文, 2020년 AI 사업 확대
사용할 수 없는 데이터 많아
비효율적인 업무수행 드러나
최근 엔비디아의 호실적무 등 AI 시장이 세간의 주목을 받는 가운데, 문재인 정부 당시 AI 사업의 급격한 확대로 갖은 문제가 발생한 점이 드러나 화제다. 감사원에 따르면 2020년 당시 문 정부는 AI 데이터 사업 규모를 7배 이상 급격히 확대하면서 사업을 감당하지 못한 것으로 전해진다.
지난 23일 IT 업계에 따르면 한 민간 IT 업체 A 사는 문 정부로부터 지난 2020년 AI 데이터 관련 일감을 수주했다. 수주 내역은 ‘AI(인공지능) 학습용 데이터 구축 사업’이며 소고기 및 달걀 등 축산물 사진을 수만 장을 이용해 데이터 뭉치를 개발하는 것이었다.
정부가 해당 데이터 뭉치를 일반에게 공개하면, 기업이 각각 AI에 학습시켜 달걀과 소고기의 겉모습만 보고 상품의 품질을 판정하고 구분하는 AI를 개발할 수 있었던 것으로 알려졌다.
하지만 A 업체가 낸 데이터 뭉치는 인공지능 학습데이터에 전혀 사용할 수 없는 상태의 적합하지 않은 데이터였다. 앞서 정부는 A등급부터 D 등급의 달걀 사진을 최소 1만 6,000장에서 최대 6만 4,000장 제출을 요구했지만, A 업체가 제출한 달걀 사진은 단 43장에 불과했다. 심지어 정부가 요구한 A~D등급 모두를 포함하지도 않았다.
A 업체는 소고기와 관련해서도 정부가 요구한 약 8만 장의 사진을 제출하지 않고 일부의 사진 몇천 장 수준만 제공한 것으로 나타났다. 모든 등급의 소고기 사진 없이는 AI를 통해 갖가지 등급을 구분할 수 없다. 정부의 요구에 따라 데이터 뭉치를 제공하지 않은 이 업체는 당시 정부로부터 19억 원을 받은 것으로 전해진다. 제대로 일하지 않고 거액을 수령한 것이다. 이 업체는 문 정부가 ‘한국판 뉴딜’ 사업을 진행하기 위해 2020년부터 ‘AI 데이터 사업’을 추진했는데 이때 참여하게 된 것이다.
감사원에 따르면 이 사업은 약 2조 5,000억 원을 들여 2020년부터 내년까지 진행되는데, 첫 2년 동안 결과로 나온 데이터 뭉치 360개 중 33.8%가 AI 학습에 사용할 수 없는 것으로 나타났다. 개수로는 122개로 AI 학습 데이터를 만드는 품질 기준에 한참 미달하는 것으로 드러났다. 사용할 수 없는 데이터에 투입된 재원은 1,148억 원으로 밑 빠진 독에 물만 부은 셈이다.
이는 음식 부문 데이터에서만 해당하지 않았다. 스포츠 부문 데이터에서도 많은 결함이 발견됐다. B 업체가 만든 ‘스포츠 사람 동작(축구)’에 해당하는 데이터 뭉치는 사람이 축구할 때 취하는 동작이 담긴 수만 사진이 포함되어 있는데, 사진마다 어떤 동작인지 설명이 빠져 있었다. 슬라이딩하는 동작, 태클하는 동작, 반칙 장면 등에 대한 설명이 없어 AI가 정확히 판단할 만큼의 정보에 해당하지 못했다.
또 다른 업체에서는 10만 건에 달하는 청력 검사 결과 자료를 모아 제출했는데, 각 자료에 모두 설명이 빠져있었다. 학습데이터에 적합하지 않은 데이터를 제출한 두 업체는 정부에 각각 19억 원, 18억 원을 수령했다.
이를 두고 감사원은 맡은 과학기술정보통신부 산하 한국지능정보사회진흥원이 AI 데이터 사업을 두고 부실한 관리를 벌여 데이터 결함 등 빈틈이 발생한 것으로 분석했다. 업계에 따르면 한국지능정보사회진흥원은 사용할 수 없는 데이터 뭉치를 여전히 데이터 공개 사이트에 올려 방치했으며, 이런 업체에 새로운 일감을 수여했다고 전해진다. 이 가운데 일부 업체는 사업비로 받은 금액에서 13억 9,000만 원을 횡령한 사실도 드러났다.
더하여 이번 감사를 통해 정부를 비롯해 지방자치단체에서 주관하는 각종 정보화 사업과 관련한 행정 처리가 수기로 진행됐다는 사실이 추가로 밝혀졌다. 지난 2018년부터 2022년 5년 동안 6만 건이 넘은 문서를 수기로 처리하여 비효율적인 업무수행 방식으로 비판받기도 했다.
댓글0