글 목록 >

3주차 경제신문스크랩

주현영  |  2020-07-25
댓글 0  |  사이다공감 2  |  조회 69

https://www.hankyung.com/economy/article/202007245362i

  

  김상조 청와대 정책실장은, 한국판 뉴딜에는 데이터 라벨링을 하기 위한 청년 일자리 10만개가 들어가 있으며, 해당 작업을 조직 내에서 하다 보면 얻는 경험을 가지고 다른 분야에 활용할 수 있을 것이라고 말했다.

  여기서 데이터 라벨링이란, 기술, 산업적으로 유망하고 AI(인공지능)응용개발에 공통적으로 활용 가능한 이미지, 영상 등 범용성 높은 인공지능 데이터를 구축하는 것' 으로 과학기술 정보통신부는 정의한다. 쉽게 말하면, AI가 학습할 교과서를 만드는 것이다. 이 교과서의 질이 높을 수록, 많을 수록, AI의 서비스의 질은 높아질 수 있다고 볼 수 있겠다. 그만큼 데이터의 '질'은 매우 중요하다.

  관련하여, 데이터를 '정부 주도'로 구축하려는 시도에 있어, 기자는 몇 가지 문제점에 대한 지적을 서술한다. 

  우선, 정부의 데이터 라벨링 일자리는 공공근로 성격이 강해, 해당 업무의 건수가 아닌 시급으로 임금을 지급한다. 그만큼 만든 데이터의 신뢰성에 의심이 들 수 밖에 없다.


  또한 이용 목적과 사업 계획이 뚜렷해야 실제 산업에서 사용 가능한 AI학습용 데이터를 만들 수 있다. 그러나 정부 정책은 일단 교과서를 만든 후, 사용처를 고민해 보자는 '공급자 위주'이다. 사용처가 없으면, 그저 정크 데이터가 될 것이다.

  이와 같은 걱정에 대해 정부 관계자는, 디지털 뉴딜은 아직 윤곽이 제시된 것이고, 단기 일자리 마련은 코로나19 극복을 위한 경기 대응 성격이 크다며, 향후 보완해 나가겠다고 말했다.


  요즘 데이터 라벨링을 하는 스타트업 회사나, 건당 얼마씩을 받는 웹사이트들을 어렵지 않게 찾을 수 있다. 컴퓨터만 가지고 있으면 장소와 시간에 구애받지 않고 할 수 있으며, 특별한 기술을 가지고 있지 않고도 할 수 있는 단순 작업, 부업이나 알바의 성격을 띄고 있어 근래 같이 실내에 있는 시간이 많은 사람들이 접근하기에 매력적이다. 본인 또한 해볼까 한 적이 있을 정도로.

  그러나 기사의 첫 문단과 같이 그 경험이 어떤 분야에 더 활용될 수 있을지는, 글쎄, 성실함과, 끈기, 인내의 향상 정도로 말할 수 있을 것 같다. 세금 낭비와 정크 데이터 생산이라는 비판을 개선시키고, 임시책이 아닌, 한국 경제, 사회를 새롭게 변화시키겠다는 '뉴딜'의 이름에 걸맞게 하기 위해서는, 해당 정책에 대한 전문가들의 이야기를 반영한 구체화가 필요해 보인다.