본문 내용으로 건더뛰기

모바일 대메뉴명

KDI 경제정보센터

16개 경제부처가 만드는
국내 유일의 경제 정책 정보지

나라경제

발행물

특집

대규모 데이터 구축 넘어 경쟁력 있는 데이터 생태계 만들 혁신 필요
김학래 중앙대 문헌정보학과 교수 2020년 11월호


데이터는 새로운 원유다. 데이터의 중요성을 강조하는 데 이보다 좋은 비유는 없다. 정부가 발표한 디지털 뉴딜의 주요 정책도 데이터가 핵심이다. 구글, 아마존, 페이스북과 같은 IT 기업의 급속한 성장은 19세기 중엽 석유산업의 호황과 비교되고, 원유의 탐사·채굴·수송 및 판매에 이르는 일련의 과정은 데이터산업과 유사하다고 말한다.
한편 데이터는 원유가 아니라는 주장도 있다. 원유는 특정한 목적으로 사용하면 사라지는 유한의 자원이다. 반면 데이터는 사라지지 않는 무한재다. 데이터는 재사용이 가능하고, 같은 데이터를 다른 목적으로 사용할 수 있다. 예를 들어 자기공명영상(MRI) 데이터는 의사가 환자를 진단·치료하는 데 사용하고, 동시에 환자가 의료보험이나 다른 사회서비스에 활용할 수도 있다.

국가적으로 필요한 데이터의 선정, 구축 등 전 단계에서 합의 가능한 가이드라인 수립을
디지털 뉴딜을 통해 데이터에 대한 기대는 더욱 높아질 것이다. 디지털 뉴딜의 대표과제인 데이터 댐 사업이 본격화됐다. 데이터 3법(「개인정보 보호법」, 「정보통신망법」, 「신용정보법」) 개정안 시행과 함께, 데이터 댐 사업은 일자리 창출과 경기부양을 위한 중요한 동력이 될 것이다. 한편 데이터 댐 사업은 과학기술과 데이터 분야의 미래에 대한 투자이기 때문에 대규모 데이터의 구축이 끝이 아니다. 경쟁력 있는 데이터 생태계를 만들기 위해서는 새로운 방식의 혁신이 필요하다.
첫째, 디지털 뉴딜은 전통적인 사업 추진과 양적 평가가 아닌 데이터 전 주기의 생태계를 고려한 제도와 관리 방안의 혁신을 포함해야 한다. 국가적으로 필요한 데이터의 선정, 구축, 배포 및 활용에 이르는 전 단계에서 합의 가능한 가이드라인을 수립해야 하고, 데이터 관련 규정, 지침 및 사업 방식에 대한 개선이 필요하다. 단기간에 캐글(Kaggle; 2010년 미국에서 설립된 온라인 AI 경진 플랫폼)과 같은 모델을 만들 수 없기 때문에, 산업·연구자·커뮤니티가 참여해 데이터를 활용하고 경험을 공유할 수 있는 실질적인 협력체계를 구축해야 한다. 또한 주요 데이터는 전담기관을 지정해 지속적으로 관리하는 방안도 검토할 필요가 있다.
둘째, 데이터와 기술에 대한 균형 있는 정책을 추진해야 한다. 만약 구글이 딥마인드를 인수하지 않았다면 대규모 클라우드 기반의 알파고와 이세돌의 대국은 성공하지 못했을 것이다. ‘만약’은 데이터, 알고리즘, 인프라에 공통적으로 적용될 수 있다. 유행에 민감한 특정한 기술이나 데이터에 치우치지 않고 균형 있는 접근이 필요하다. 이미지 데이터베이스 이미지넷(ImageNet)은 1,400만여 개의 고화질 이미지와 더불어 워드넷(WordNet) 기반의 상세한 메타데이터를 제공함으로써 심층 신경망 기법을 발전시키는 데 중요한 역할을 했다. 수요 중심의 데이터 발굴과 함께 정부의 데이터 현황을 파악하는 데이터맵을 정의하고, 인공지능(AI) 기술과 인프라를 결합하는 정책이 추진돼야 한다.
셋째, 양질의 데이터가 무엇인지 정의해야 한다. 거의 모든 산업 분야에서 데이터가 필요한 상황이지만, 분야에 따라 요구되는 데이터 형식과 기준이 다르다. 텍스트와 이미지, 비디오 형식의 데이터, 그리고 한국어와 영어 데이터는 품질기준이 다를 수 있다. 기존에 사용됐던 보편적인 틀로 데이터 품질을 평가하는 것이 어렵기 때문에 데이터 사용자와 전문가가 공동으로 요구사항을 정의하고, 데이터 구축과 평가 단계에 대한 가이드라인을 수립해야 한다. 부처에 따라 개별적으로 추진되는 가이드라인과 표준안은 범정부 차원으로 접근방식을 전환해볼 수 있다. 데이터의 수집·분석·활용은 범용성을 중심으로 범정부 수준으로 정의하고, 개별 부처와 기관의 특수성을 반영해 확장할 수 있는 방안을 검토하는 것이 필요하다. 이런 단계에서 글로벌 표준의 적극적인 활용을 통해 데이터 환경을 개선하고, 필요한 표준을 개발하고 제안하는 것을 검토해야 한다.

데이터 정책의 지향점 명확히 해야
코로나19로 인한 경제위기에 대응하기 위해 디지털 뉴딜, 데이터 댐과 같은 정책은 필요할 수 있다. 그러나 데이터를 원유와 같은 관점의 소비재로 또는 일자리 창출을 위한 임시 수단으로 인식한다는 우려도 존재한다. 이런 시점에서 정부의 데이터 정책에 대한 지향점이 무엇인지 고민해볼 필요가 있다.
마이데이터는 이런 상황을 조망하는 데 적절한 주제다. 마이데이터는 개인이 정보 관리의 주체로 본인 데이터의 열람, 제공 범위, 승인을 직접 결정해 데이터 주권을 확립하기 위한 패러다임이다. 금융을 시작으로 보건의료, 공공행정 분야에서 마이데이터의 확산이 매우 빠르게 진행되고 있다. 그런데 대부분의 논의는 비즈니스 주체 사이의 이견을 조정하고 기술적인 문제를 해결하는 데 집중됐다. 일부 사업에서 개인정보저장소(personal data storage)를 고려하고 있지만, 마이데이터의 주체인 일반 시민은 법률과 사업 추진에 대해 명확히 인지하지 못하고 있다.
마이데이터는 개인의 데이터 열람과 이동에 대한 법률, 데이터를 개인이 관리하는 책임, 개인의 데이터를 위임하는 서비스 업체와의 관계 등 획기적인 사회문화적 변화를 만들 수 있다. 이런 측면에서 개인이 데이터를 관리하는 새로운 역할을 인지하고 이에 대한 사회 전반의 공감대를 형성하는 것이 필수적이다. 기업 중심으로 추진되는 마이데이터 사업에서 개인의 데이터 주권을 강조하는 정책적 변화도 검토해야 한다.
양질의 데이터 확보는 새로운 국가경쟁력 요소가 될 것이다. 일자리 창출이 눈앞의 무거운 과제이고 ‘인형 눈알 붙이기’라는 비판이 있지만, 데이터 분야의 대규모 투자는 새로운 시장을 만들고 국가의 주요 산업과 연계돼 새로운 경쟁력을 창출할 수 있다.
한편 범정부 차원의 전략과 지향점을 명확하게 정의하고 균형 있게 추진할 필요가 있다. 대규모 예산 투자는 다양한 경제지표에 즉각적으로 반영될 수 있겠지만, 국가 차원의 데이터 경쟁력 확보는 단기간에 만들어내기 어렵다. 이런 측면에서 정부의 정책은 속도와 성과 위주의 대규모 사업보다 기초를 튼튼하게 만들고 지속적으로 생태계 구축을 지원하는 방안을 모색해야 한다.
KDI 경제정보센터