후버 댐은 1930년대 미국 대공황 시기 성공한 경제 프로젝트로 손꼽힌다. 허버트 후버 미국 31대 대통령은 1929년 취임 직후 불어닥친 대공황에 대응하기 위해 실업 극복과 사회인프라 확충을 목표로 1922년부터 진행되던 서남부 지역 댐 건설에 대규모 예산을 투입했다. 이후 후버 댐은 5년간 2만1천 명에게 일자리를 제공해 경기를 부양한 것은 물론이고, 현재까지도 미국 서남부 농업산업 용수를 책임지는 핵심 인프라로 활용된다. 과학기술정보통신부(이하 과기정통부)는 디지털 시대 후버 댐 프로젝트에 비견될 데이터 댐 프로젝트 7대 핵심 사업을 진행 중이다. 데이터 댐은 사회와 경제 전반에서 생성되는 빅데이터를 초연결 통신망을 이용해 수집하고 인공지능(AI)으로 분석하도록 대규모 인프라를 구축해 가치를 극대화하는 사업이다. 데이터 댐은 정부가 추진하는 디지털 뉴딜의 핵심 사업으로, 코로나19로 인한 경기침체 극복과 동시에 4차 산업혁명 시대에 대응할 디지털 인프라 선제 구축 효과를 노렸다. AI 바우처, AI 데이터 가공바우처 등으로 민간기업의 AI 활용 제고 데이터 댐은 AI 학습용 데이터 구축, AI 바우처, AI 데이터 가공바우처, AI 융합 프로젝트(AI+X), 클라우드 플래그십 프로젝트, 클라우드 이용바우처, 빅데이터 플랫폼 및 센터 구축 등 7대 핵심 사업으로 구성되며, 2020년 예산 4,991억 원이 투입된다. AI 학습용 데이터 구축은 데이터 댐 프로젝트의 기초이자 핵심이 되는 사업이다. 텍스트 7억 건, 음성 6만 시간, 이미지 6천만 건, 영상 1만5천 시간 등 대규모 데이터를 디지털화해 AI가 활용할 수 있는 자원으로 제공한다. 사회 각 분야에서 수집된 데이터를 바탕으로 AI 알고리즘 성능을 높인다. 정부는 AI 학습용 데이터 구축에 총 2,925억 원을 투입, 584개 기업기관을 선정했다. 대량 데이터 수집과 표준화, 가공 등의 과정에서 일자리 2만8천 개 이상 창출은 물론이고, 진화된 AI를 다양한 산업영역에 적용해 효율을 극대화하는 선순환을 유발하는 게 목표다. 데이터 댐을 통해 민간기업의 AI 활용을 높이도록 지원하는 사업도 다양하게 전개된다. AI 바우처 사업은 전통 제조 분야를 비롯해 병원, 투자운용사 등 다양한 분야의 중소벤처기업이 바우처를 신청하면, 정부가 최대 3억 원의 바우처를 제공해 AI 공급기업이 수요기업에서 필요로 하는 AI 기반 서비스와 솔루션을 맞춤형으로 제공하도록 지원중개하는 사업이다. 정부 예산 560억 원을 투입해 총 475개 과제를 진행한다. AI 도입이 필요한 중소벤처기업의 디지털 전환을 촉진하고, AI 솔루션 전문 기업에는 새로운 시장 창출을 통한 성장 기회를 제공할 것으로 기대된다. AI 데이터 가공바우처 사업은 AI 학습용 데이터가 필요한 수요기업이 바우처를 신청하면, AI에 사용할 수 있도록 공급기업에서 데이터를 가공해 제공하는 방식으로 진행된다. AI 데이터 가공바우처 사업에는 총 489억 원을 투입해 620건을 지원한다. 중소기업과 스타트업 등이 보유한 데이터를 AI 학습용 데이터로 전환해 필요한 기업에 적기에 공급하는 방식으로 활용도를 높일 것으로 기대된다. 1인 창업자와 소규모 스타트업도 손쉽게 데이터를 공급받을 수 있게 해 AI 기반 응용서비스 개발을 활성화하는 효과가 예상된다. AI 융합 프로젝트(AI+X)는 다양한 사회산업 분야에 AI를 융합하는 사업이다. AI+X는 타 분야 또는 예측하지 않은 또 다른 분야에 AI가 접목된다는 의미다. 군 의료 지원, 감염병 대응, 해안경계, 산업단지 에너지 효율화, 불법 복제품 판독 등 8개 대표 분야에 AI를 선제적으로 접목해 각 분야 전문 기업에 알고리즘 고도화와 초기 사업 기회를 제공하고 국민 체감효과를 높이는 게 목표다. 올해 예산 총 282억 원이 투입된다. 제조, 물류, 헬스케어 등 5개 산업 분야에서 세계 최고 수준 클라우드서비스 개발 클라우드는 데이터를 효과적으로 수집저장해 적재적소에 사용되도록 지원하기 위한 기초 인프라로, 대규모 데이터 저수지 역할을 한다. 클라우드 플래그십 프로젝트는 경쟁력 확보가 시급한 클라우드 산업 분야를 선정해 서비스 통합 플랫폼과 서비스 개발을 지원하는 사업이다. KT, NBP, NHN 등 국내 최고의 클라우드 기업이 연합해 제조, 물류, 헬스케어, 교육, 비대면 복지 등 5개 산업 분야에서 세계 최고 수준의 클라우드서비스를 개발하는 것을 목표로 하고 있다. 올해 사업에는 우선 250억 원을 지원한다. 국내 주요 클라우드 사업자와 전문가의 의견을 반영해 기획된 참여도가 높은 사업으로, 과기정통부는 올해 사업 이후 매년 5개씩 전략 핵심 분야를 선정해 사업의 연속성을 확보한다는 방침이다. 중소기업의 클라우드 이용을 지원하는 클라우드 이용바우처 사업도 데이터 댐 프로젝트에 포함됐다. 중소기업 업무환경을 클라우드 기반으로 전환해 기업 경영환경을 개선하고 비대면 상황에서의 업무 연속성을 확보하도록 컨설팅 비용과 전환 비용, 이용료를 종합 지원한다. 클라우드에 익숙하지 않은 제조업, 도소매, 보건복지 업종을 포함해 337개 이상 기업에 기업당 최대 2천만 원을 지원하도록 예산 80억 원을 투입, 타 산업과 정보통신기술(ICT) 융합을 촉진하는 효과를 노렸다. 빅데이터 플랫폼 및 센터 구축 사업은 공공과 민간이 협업해 활용도 높은 데이터를 생산하고 개방하는 사업이다. 정부는 금융, 환경, 문화, 교통, 헬스케어, 유통, 통신, 중소기업, 지역경제, 산림 등 10개 플랫폼을 구축했다. 올해 안에 405억 원을 투입해 5개 플랫폼을 추가 선정하고, 이를 지원할 50개 센터를 추가 구축할 예정이다. 국내 데이터 생태계를 혁신하고 기업 경쟁력을 높일 것으로 기대된다. 과기정통부는 AI와 클라우드 활성화를 위해 AI 데이터 표준화를 진행하는 한편, 디지털 전문계약제도를 도입해 새로운 거래 질서를 확립하겠다는 목표다. AI와 데이터 활용 활성화를 가로막는 법제도가 없는지에 대해서도 종합적인 연구를 거쳐 새로운 방안을 마련할 방침이다. 데이터 댐은 코로나19 위기 극복을 위해 정부 주도로 전개하는 초대형 디지털 프로젝트다. 일자리 수십만 개를 창출해 당면한 코로나19 경제위기를 극복하고, 우리나라가 미래를 대비하는 핵심 인프라를 구축하는 역할을 성공적으로 수행하게 될지 주목된다.
정부가 지난 7월 14일 발표한 한국판 뉴딜의 한 축인 디지털 뉴딜은 올해 추경부터 2022년까지 총 23조4천억 원(국비 18조6천억 원), 2025년까지 58조2천억 원(국비 44조8천억 원)을 투자해 2022년까지 39만 개, 2025년까지 90만3천 개의 일자리를 창출하고 디지털 대전환을 선도하려는 목표로 추진되고 있다. 과학기술정보통신부가 주관하고 있는 디지털 뉴딜의 대표 사업인 데이터 댐 프로젝트는 데이터 수집가공결합거래활용을 통해 데이터경제를 가속화하고 5G 전국망에 기반해 모든 산업으로 5G와 인공지능(AI) 융합서비스를 확산하려는 사업이다. 과거 미국 대공황 때 후버 댐 건설은 많은 일자리 창출과 경기부양은 물론 전기 생산과 도시 개발 등 산업화 촉진의 원동력이 됐다. 데이터 댐의 개념도 유사하다. 대규모의 데이터를 수집가공하는 사업을 통해 신규일자리를 창출함은 물론 이렇게 모은 데이터를 활용해 의료, 교육, 제조 등 연관 분야에서 새로운 비즈니스와 산업을 만들 것으로 기대된다. 올해 자연어자율주행 등 10대 분야 150종 데이터 구축 시작 AI 학습용 데이터 구축 사업은 데이터 댐의 가장 기초이자 핵심으로 AI 스피커, 자율주행차, 정밀의료 등 AI 서비스 개발에 필수적인 AI 학습용 데이터를 대규모로 구축개방(aihub.or.kr)하는 사업이다. 대량의 데이터 수집부터 가공정제품질검증 과정에서 많은 일자리가 창출될 것으로 기대된다. 지난 2017년부터 시작된 이 사업은 이번 디지털 뉴딜을 통해 사업 규모가 대폭 확대됐다. 올해 추경 2,925억 원을 시작으로 2025년까지 약 2조5천억 원을 투자해 올해 AI 학습용 데이터 150종을 포함해 2025년까지 1,300종을 추가로 구축할 계획이다. 시장수요가 높은 과제를 발굴하기 위해 민간수요(720개), 공공수요(531개), 해외 공개데이터(321개) 등 총 1,250개 후보과제에 대해 제조사, 통신사, 포털사 등 활용기업 평가와 전문가로 구성된 과제기획위원회의 검증을 통해 자연어, 헬스케어, 자율주행, 농축수산 등 10대 분야 150종의 데이터를 선정했으며, 유사한 데이터를 그룹화해 72개 그룹과제를 최종 도출했다. AI 학습용 데이터 구축 사업은 코로나발 일자리 위기 극복을 위해 최대한 많은 일자리를 창출하고 취약계층을 배려할 수 있도록 설계됐다. 먼저, 정부출연금 지원 기준 1억 원당 최소 2.4명 이상의 신규인력 채용을 의무화해 AI 기술서비스 개발자 등 직접고용이 확대되도록 했다. 둘째, 국민 누구나 쉽게 온라인 플랫폼을 통해 참여 가능한 크라우드소싱 방식을 적극적으로 도입할 수 있도록 크라우드소싱 관련 예산 비중에 따른 가점제를 운영했다. 셋째, 경력단절여성, 장애인, 기초생활수급자, 농어촌 주민 등 취약계층의 참여와 처우개선에도 가점을 부여했다. 이러한 노력에 힘입어 한국판 뉴딜에서 발표된 AI 학습용 데이터 구축 사업의 추경 일자리 기대효과는 약 2만여 명이었으나, 이번 참여기업들이 직접고용과 크라우드소싱 등으로 약 2만8천 명을 제안하는 등 당초 전망치를 상회할 것으로 기대된다. 분야별 전문 기업기관 대거 참여글로벌 수준의 데이터 품질관리와 표준화도 추진 이번 사업은 추경예산 확정(7월), 사업 공고(7월), 접수 및 평가(8월) 등의 절차를 거쳐 과제협약을 마무리하고 이미 착수했다. 짧은 기간에도 불구하고 민간기업을 중심으로 각 분야 공공기관이 함께 참여한 역대 최대 규모인 총 1,920개 기업기관이 지원했으며 최종 584개 기업기관(주관 72개, 참여 512개)을 첫해 지원 대상으로 확정했다. 특히 주요 AI 개발 전문기업, 크라우드소싱 기업 등은 물론 서울대, KAIST 등 37개 대학 산학협력단과 서울대병원, 국립암센터 등 21개 주요 병원을 비롯한 분야별 전문 기업기관이 대거 참여했다. 올해 사업을 통해 한국어 말뭉치, 농작물 병해충 이미지, 암질환 영상 등 텍스트 7억 건, 음성 6만 시간, 이미지 6천만 건, 영상 1만5천 시간 등 대규모 데이터를 구축함으로써 국내 AI 산업의 획기적인 도약의 계기가 마련될 것으로 기대된다. 한편 사업의 성공적 추진을 위한 핵심인 데이터 품질 관련 글로벌 수준의 품질관리 체계도 마련했다. 글로벌 수준의 품질기준 및 검증방법 확립, 활용기업이 참여하는 품질자문위 운영, 품질평가 전문조직(정보통신기술진흥협회) 활용 등을 추진하고 있다. 대량의 데이터를 구축하는 사업의 특성상 구축 단계에서 완벽한 품질검증이 어려운 구조적 한계가 있는 만큼, 기 구축된 데이터(2017~2019년)를 포함해 품질평가 등을 통해 지속적으로 보완하고 유지보수해나갈 계획이다. 또한 수행기관의 책임감을 제고하기 위해 데이터별 구축기업 실명제 도입, 품질평가 결과 공개 및 내년 사업선정 시 반영 등의 방안도 마련했다. 아울러 AI 데이터 품질 및 상호호환성 확보를 위한 표준안을 개발하고 국내외 표준화를 추진한다. 2019년 개발된 AI 학습용 데이터 구축 및 품질관리 공통기준을 보완구체화해 AI 데이터 관련 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발했고, 이를 한국정보통신기술협회(TTA) 단체표준으로 만들기 위해 지난 10월 6일 TTA 내 단체표준화기구(TTA PG 1005, AI 기반기술)에 공식 제안했다. 관련 전문가 등의 의견수렴 절차를 거쳐 내년 6월에 최종 채택확정될 것으로 전망된다. 또한 앞으로 관련 내용이 국제표준화 성과로도 이어질 수 있도록 추진할 계획이다. 과학기술정보통신부는 앞으로 데이터 댐의 핵심인 AI 학습용 데이터 구축 사업의 성공적 추진에 만전을 기해 코로나발 경제위기를 극복할 수 있는 많은 일자리를 창출함은 물론 우리나라가 미래 변화에 먼저 대응해 디지털 선도국가로 도약하는 데 크게 기여할 수 있도록 더욱 노력할 계획이다.
인공지능(AI)빅데이터사물인터넷(IoT) 등 지능정보기술의 발전으로 데이터의 거래유통융합 수요가 증가하면서 공공데이터 개방에 대한 민간의 요구도 함께 커지고 있다. 정부는 2013년 「공공데이터의 제공 및 이용 활성화에 관한 법률」을 제정하고, 범정부 공공데이터포털(data.go.kr)을 통해 양질의 공공데이터 개방을 지속적으로 확대해왔다. 그 결과 OECD가 발표한 2019년 공공데이터 개방평가에서 34개 조사 대상국 중 1위를 달성하며 3회 연속(2015년, 2017년, 2019년) 세계 1위라는 기록을 세우기도 했다. 국민이 필요로 하는 데이터를 제공하기 위한 노력도 빼놓을 수 없다. 코로나19 사태에 대응해 정부가 공적마스크 데이터를 신속히 개방함으로써 국민들의 마스크 구입 애로 해소에 기여한 사례는 공공과 민간이 협업한 우수사례로 평가된다. 이러한 세계 최고 수준의 공공데이터 개방 성과를 이룬 데는 국가중점데이터 개방이 큰 역할을 해왔다. 국가중점데이터는 신산업 촉진 또는 사회현안과 밀접한 분야의 공공데이터를 민간이 활용하기 편리한 형태로 가공해 개방하는 데이터를 말한다. 현재 96개 분야의 국가중점데이터가 개방되고 있다. 미세먼지 농도 알림, 교통사고 예방 등에 국가중점데이터 다양하게 활용돼 개방된 국가중점데이터는 학술연구를 비롯해 관련 비즈니스 모델 창출 등에 폭넓게 활용되고 있다. 부동산 실거래가 데이터는 부동산시장 동향 연구와 관련 앱 개발 등에 유용하게 활용되고 있으며, 상권정보는 창업 시 입지선정과 마케팅의 핵심 정보로 활용되고 있다. 그간 일반인 접근이 제한적이던 진료정보와 의료영상정보의 개방은 보건의료 연구와 비즈니스 창출 기회를 제공하고 있으며, 국민 건강정보 데이터는 국민 건강과 관련된 체계적인 연구 활동에 활용된다. 특히 다국어 5종의 음성정보와 영어대역문장 데이터는 AI빅데이터 등 4차산업의 근간이 되는 음성지능 및 언어지능 관련 기술 개발에 활용될 것으로 기대된다. 이 외에도 미세먼지 농도 알림, 교통사고 예방 등 국민 생활과 밀접한 분야나 스마트시티, 자율주행 등 신산업 기술 개발과 관련된 분야에서 국가중점데이터가 다양하게 활용되고 있다. 공공데이터포털에 제공된 API(Application Programming Interface) 데이터 상위 100위까지의 트래픽을 살펴보면 전체의 약 59%(총 63억 건 중 36억 건, 2019년 1~8월)를 국가중점데이터가 차지한다. 2020~2022년 기간에는 민간에서 필요로 하는 데이터를 발굴해 국가중점데이터로 개방할 수 있도록 더 많은 노력을 기울이고 있다. 먼저 국가 정책방향과 사회현안을 반영해 6개 주제영역(스마트시티, 자율주행, 헬스케어, 재난안전, 생활환경, 금융정보)을 도출하고, 관련 분야 지원에 필요한 데이터가 모두 개방될 수 있도록 대상을 선정했다. 또한 민간 전문가, 활용기업, 데이터 보유기관이 참여하는 태스크포스(TF)를 구성해 후보 데이터를 검토하고, 대국민 수요조사를 실시하는 등 데이터 선정에 국민과 산업현장의 다양한 목소리를 반영하기 위해 노력했다. 올해는 소방청산림청제주특별자치도 등 19개 기관이 참여해 신산업 성장을 촉진하고 국민 생활을 지원할 6개 영역 25개 분야의 국가중점데이터 개방을 추진 중이다. 자율주행, 헬스케어, 스마트시티 등 6개 영역 데이터 개방 자율주행 영역에서는 특수차량을 통해 획득한 다양한 주행상황 관련 데이터(영상센서 정보 등)를 개방해 지능형 자동차 인식기술 개발을 지원한다. 또한 경찰관교통안전요원의 수신호와 같은 도로 위 동적 데이터를 개방해 교통사고나 교통통제 등 특수한 상황에서의 자율주행차 행동패턴 연구를 지원한다. 헬스케어 영역에서는 의료기기 제조 관련 사전사후 단계의 의료기기 안전정보와 화장품, 수입 위생용품 유통 데이터 등을 개방해 국민의 알권리를 증진하고 정책 투명성과 신뢰도 향상에 기여할 것으로 기대된다. 스마트시티 영역에서는 제주도 버스 위치와 운전자 상태 등의 운행정보, 기온미세먼지 등의 환경정보를 발굴개방해 제주도 내 관광서비스의 경쟁력을 높이는 데 활용되도록 하거나 관광 정책 의사결정을 지원한다. 금융정보 영역에서는 기획재정부의 국고보조금 통합정보를 개방한다. 생활환경 영역에서는 사업장 온실가스 배출량, 산림 내 미세먼지 농도 등 생활환경과 밀접한 데이터를 개방해 국민 건강증진과 생활안전서비스 개선에 기여할 것으로 기대된다. 재난안전 영역에서는 국민의 안전과 직결되는 산사태화재 및 구조구급 활동, 가뭄대응 등 재난안전 대비에 필요한 데이터 등을 개방한다. 정부는 2021년까지 개방 가능한 공공데이터 전체를 민간에 개방해 디지털 뉴딜의 핵심인 데이터 댐을 구축하고, 국가중점데이터를 비롯한 공공데이터를 고품질로 개방하기 위한 범정부적 노력도 지속해나갈 계획이다.
사람이 있는 문화, 쉼표가 있는 삶. 일반 국민의 문화예술 참여가 확대되고 생활체육과 국내여행이 활성화되는 등 문화환경에 다양한 변화가 일어나고 있다. 또한 코로나19로 문화생활에 제한이 생기면서 코로나 블루 현상이 발생하고 있는데, 그만큼 삶에 있어서 문화생활은 매우 중요함을 느낀다. 문화 빅데이터 플랫폼은 문화 데이터 활용 생태계 촉진을 통해 문화산업을 진흥하고 대국민 서비스를 제고하는 등 선진 문화 환경을 조성하기 위해 시작됐다. 문화라는 용어가 한마디로 정의하기 불가능할 정도로 매우 다양한 의미를 가지고 있는 것처럼 문화 빅데이터 플랫폼에도 한마디로 정의하기 어려울 만큼 다양한 데이터 상품이 개방되고 있다. 도서대출, 국가서지 등 도서 관련 데이터, 문화예술 행사축제 정보, 문화누리카드 등 문화 관련 데이터, 국민의 체력측정결과 데이터, 봉사활동이나 방과 후 프로그램 등 청소년 활동에 관한 데이터, 숙박과 레저활동 관련 데이터, 한국 전 지역뿐 아니라 해외 맛집이나 메뉴까지 제공하는 스마트 음식데이터, 문화 소셜데이터, 챗봇과 와이파이 수집기에서 수집한 실제 관광객 데이터, 한류 데이터까지 총 11개의 센터에서 지속적으로 데이터를 유통한다. 문화 빅데이터 플랫폼의 차별점은 철저한 데이터 관리에 있다. 센터는 통일화된 데이터 표준품질가이드를 준수해 데이터를 생산한다. 생산된 데이터는 비식별처리와 품질검토를 거친 뒤 플랫폼에 전달되고, 플랫폼에서 데이터의 품질과 비식별처리를 한 번 더 확인한 뒤 비로소 포털에 개방한다. 포털에 업로드된 데이터들은 그 자체로도 이미 높은 품질을 보증한다. 문화예술 분야에서 데이터를 구매해 서비스를 운영하는 것은 익숙하지 않을 수 있다. 그렇기 때문에 문화 빅데이터 플랫폼은 다양한 플랫폼 데이터를 활용한 서비스를 운영하고 있다. 플랫폼의 핵심 서비스인 문화역세권은 문화체육관광시설 데이터와 시설당 이용자 수, 시설 검색량 데이터, 인구통계 데이터를 융복합해 문화시설이 모여 있는 공간인 문화역세권을 발굴해 새로운 가치를 제시한다. 그 외에 청소년 체험, 봉사, 재능 나눔, 공연 및 축제 등 청소년을 위한 데이터를 한눈에 보여주는 문화허브 서비스, 소셜 빅데이터로 문화 트렌드를 보여주는 현황판, 음식의 재료 정보까지 활용해 식당을 추천해주는 K푸드 서비스 등 플랫폼 데이터를 활용한 다양한 서비스를 준비하고 있다. 일반 기업의 활용사례로는 대표적으로 요양시설 추천 서비스인 케어닥이 있다. 플랫폼에 개방된 POI(관심지점) 데이터를 활용해 요양시설을 방문하는 가족을 대상으로 요양시설 주변 편의시설 정보를 제공한다. 플랫폼의 문화누리카드 가맹점 정보를 활용해 취약계층 보행경로에 편의정보를 제공하는 모바일서비스 맘비도 있다. 현재 문화 빅데이터 플랫폼에는 781개의 데이터가 개방돼 있으며 이 중 641개는 무료로 제공된다. 2020년에는 언택트 여가 트렌드를 반영할 수 있는 캠핑장 통합 정보와 드라이브스루 매장 등의 비대면 문화향유시설 데이터가 개방될 예정이며, 유동인구 데이터와 공연전시 시설의 융복합 데이터, 관람 후기의 감성분석과 연관어분석 데이터 등 융복합 활용 중심의 데이터 220종이 신규 개방된다. 문화 빅데이터 플랫폼에서 유통되는 데이터를 민간에서 폭넓게 활용해 국민들이 체감할 수 있는 다양한 혁신서비스가 나오길 기대한다.
4차 산업혁명, 디지털 뉴딜 등 패러다임 변화 및 정부 정책에는 항상 데이터가 중요하다고 말한다. 우리가 자주 사용하는 기상서비스(케이웨더), 내비게이션(카카오내비), 배달서비스(배달의민족), 부동산서비스(직방) 등 생활에 밀착된 서비스는 전부 데이터를 기반으로 작동되고 있다. 심지어 가솔린으로 달리는 자동차가 미래에는 데이터를 먹고 달린다는 말까지 나오고 있다. 2019년 공공데이터 활용기업 실태조사에서 국내 854개 기업에 공공데이터를 활용하는 목적을 물으니, 81%가 신규 서비스 및 상품 개발을 위해 공공데이터를 사용한다고 답했다. 그만큼 데이터와 기업의 서비스 개발은 관계가 깊다고 볼 수 있다. 사실 우리나라보다 먼저 데이터 개방 정책을 펼쳤던 해외에서는 데이터 개방의 목적이 정부 투명성 제고였다. 하지만 개방된 데이터를 민간 기업이 비즈니스(서비스 개발 등)에 활용한다는 사실이 알려지며 데이터 활용 사업화를 돕는 다양한 정책이 등장했다. 대표적으로 EU에서 추진하는 데이터피치(Data Pitch)가 있다. 데이터피치는 오픈데이터를 기반으로 혁신을 도모하는 유럽 전역의 스타트업과 중소기업을 6개월간 지원하는 인큐베이팅 프로그램으로, 참여 기업에 사업화 자금 및 네트워킹 등 사업화에 필요한 요소를 지원해주고 있다. 그럼 국내에서는 데이터 활용 사업화를 촉진하는 사업으로 무엇이 있을까? 대표적으로 2017년부터 추진된 공공데이터 활용 창업 지원 협업 프로젝트(이하 협업 프로젝트)가 있다. 협업 프로젝트란 공공기관과 민간 전문기관이 협업해 창업준비부터 해외진출까지 전 단계에 걸쳐 종합 지원하는 사업이다. 구체적으로 창업준비, 사업화, 성장촉진, 해외진출 단계로 구분해 사업을 추진하고 있다. 첫째, 창업준비 단계는 창업 초기에 필요한 기초지식 습득을 위한 창업교육, 데이터 활용 교육, 인공지능(AI) 활용 교육, 지식재산권화 지원으로 구성된다. 주로 예비창업자가 참여하는 단계다. 둘째, 사업화 단계는 신용기술 보증, 신용조회 및 평가, 일자리 체험, 민간 데이터 활용 지원, 클라우드서비스 지원으로 구성돼 있다. 주로 창업한 지 1~3년 사이의 창업 초기 단계의 기업이 참여한다. 셋째, 성장촉진 단계는 사회적 기업 지원, 맞춤형 컨설팅, 기업 홍보, 투자설명회 참여 지원 등 사업화가 어느 정도 완성된 4년 차 이상의 기업이 많이 참여하는 단계다. 마지막으로, 해외진출 단계에서는 국내외 콘퍼런스 참여 지원 및 해외진출 교육을 지원해주고 있다. 해외진출 단계는 비즈니스 모델이 어느 정도 완성된 4년 차 이상의 기업이 많이 참여하지만, 초기 단계인 1~3년 차 기업도 참여하고 있다. 이와 같은 협업 프로젝트를 통해 2017년부터 2019년까지 240개 기업을 대상으로 394개 프로그램을 지원했다. 해외 특허 출원(지속가능발전소), 신용기술 보증 선정(오애프터눈, 비알프레임), 투자유치 확정(비바이노베이션) 등 분야별로 다양한 성과를 냈다. 올해는 114개 기업 및 예비창업자를 선정해 프로그램을 지원하고 있다. 우리 정부는 디지털 뉴딜의 일환으로 데이터 댐을 구축하고 민간의 데이터 활용을 촉진하려고 한다. 민간이 데이터를 활용하는 가장 큰 목적은 서비스 개발이며, 이를 원활히 지원하기 위해서는 데이터 댐과 함께 공공데이터 활용 창업 지원 협업 프로젝트와 같은 데이터 활용 사업화 지원 프로그램이 강화돼야 한다. 데이터 댐을 통해 데이터 활용 기반을 마련하고 데이터 활용 사업화 지원을 통해 기업의 사업화가 촉진된다면, 보다 나은 데이터 활용 서비스가 창출될 수 있을 것이다.
데이터는 새로운 원유다. 데이터의 중요성을 강조하는 데 이보다 좋은 비유는 없다. 정부가 발표한 디지털 뉴딜의 주요 정책도 데이터가 핵심이다. 구글, 아마존, 페이스북과 같은 IT 기업의 급속한 성장은 19세기 중엽 석유산업의 호황과 비교되고, 원유의 탐사채굴수송 및 판매에 이르는 일련의 과정은 데이터산업과 유사하다고 말한다. 한편 데이터는 원유가 아니라는 주장도 있다. 원유는 특정한 목적으로 사용하면 사라지는 유한의 자원이다. 반면 데이터는 사라지지 않는 무한재다. 데이터는 재사용이 가능하고, 같은 데이터를 다른 목적으로 사용할 수 있다. 예를 들어 자기공명영상(MRI) 데이터는 의사가 환자를 진단치료하는 데 사용하고, 동시에 환자가 의료보험이나 다른 사회서비스에 활용할 수도 있다. 국가적으로 필요한 데이터의 선정, 구축 등 전 단계에서 합의 가능한 가이드라인 수립을 디지털 뉴딜을 통해 데이터에 대한 기대는 더욱 높아질 것이다. 디지털 뉴딜의 대표과제인 데이터 댐 사업이 본격화됐다. 데이터 3법(「개인정보 보호법」, 「정보통신망법」, 「신용정보법」) 개정안 시행과 함께, 데이터 댐 사업은 일자리 창출과 경기부양을 위한 중요한 동력이 될 것이다. 한편 데이터 댐 사업은 과학기술과 데이터 분야의 미래에 대한 투자이기 때문에 대규모 데이터의 구축이 끝이 아니다. 경쟁력 있는 데이터 생태계를 만들기 위해서는 새로운 방식의 혁신이 필요하다. 첫째, 디지털 뉴딜은 전통적인 사업 추진과 양적 평가가 아닌 데이터 전 주기의 생태계를 고려한 제도와 관리 방안의 혁신을 포함해야 한다. 국가적으로 필요한 데이터의 선정, 구축, 배포 및 활용에 이르는 전 단계에서 합의 가능한 가이드라인을 수립해야 하고, 데이터 관련 규정, 지침 및 사업 방식에 대한 개선이 필요하다. 단기간에 캐글(Kaggle; 2010년 미국에서 설립된 온라인 AI 경진 플랫폼)과 같은 모델을 만들 수 없기 때문에, 산업연구자커뮤니티가 참여해 데이터를 활용하고 경험을 공유할 수 있는 실질적인 협력체계를 구축해야 한다. 또한 주요 데이터는 전담기관을 지정해 지속적으로 관리하는 방안도 검토할 필요가 있다. 둘째, 데이터와 기술에 대한 균형 있는 정책을 추진해야 한다. 만약 구글이 딥마인드를 인수하지 않았다면 대규모 클라우드 기반의 알파고와 이세돌의 대국은 성공하지 못했을 것이다. 만약은 데이터, 알고리즘, 인프라에 공통적으로 적용될 수 있다. 유행에 민감한 특정한 기술이나 데이터에 치우치지 않고 균형 있는 접근이 필요하다. 이미지 데이터베이스 이미지넷(ImageNet)은 1,400만여 개의 고화질 이미지와 더불어 워드넷(WordNet) 기반의 상세한 메타데이터를 제공함으로써 심층 신경망 기법을 발전시키는 데 중요한 역할을 했다. 수요 중심의 데이터 발굴과 함께 정부의 데이터 현황을 파악하는 데이터맵을 정의하고, 인공지능(AI) 기술과 인프라를 결합하는 정책이 추진돼야 한다. 셋째, 양질의 데이터가 무엇인지 정의해야 한다. 거의 모든 산업 분야에서 데이터가 필요한 상황이지만, 분야에 따라 요구되는 데이터 형식과 기준이 다르다. 텍스트와 이미지, 비디오 형식의 데이터, 그리고 한국어와 영어 데이터는 품질기준이 다를 수 있다. 기존에 사용됐던 보편적인 틀로 데이터 품질을 평가하는 것이 어렵기 때문에 데이터 사용자와 전문가가 공동으로 요구사항을 정의하고, 데이터 구축과 평가 단계에 대한 가이드라인을 수립해야 한다. 부처에 따라 개별적으로 추진되는 가이드라인과 표준안은 범정부 차원으로 접근방식을 전환해볼 수 있다. 데이터의 수집분석활용은 범용성을 중심으로 범정부 수준으로 정의하고, 개별 부처와 기관의 특수성을 반영해 확장할 수 있는 방안을 검토하는 것이 필요하다. 이런 단계에서 글로벌 표준의 적극적인 활용을 통해 데이터 환경을 개선하고, 필요한 표준을 개발하고 제안하는 것을 검토해야 한다. 데이터 정책의 지향점 명확히 해야 코로나19로 인한 경제위기에 대응하기 위해 디지털 뉴딜, 데이터 댐과 같은 정책은 필요할 수 있다. 그러나 데이터를 원유와 같은 관점의 소비재로 또는 일자리 창출을 위한 임시 수단으로 인식한다는 우려도 존재한다. 이런 시점에서 정부의 데이터 정책에 대한 지향점이 무엇인지 고민해볼 필요가 있다. 마이데이터는 이런 상황을 조망하는 데 적절한 주제다. 마이데이터는 개인이 정보 관리의 주체로 본인 데이터의 열람, 제공 범위, 승인을 직접 결정해 데이터 주권을 확립하기 위한 패러다임이다. 금융을 시작으로 보건의료, 공공행정 분야에서 마이데이터의 확산이 매우 빠르게 진행되고 있다. 그런데 대부분의 논의는 비즈니스 주체 사이의 이견을 조정하고 기술적인 문제를 해결하는 데 집중됐다. 일부 사업에서 개인정보저장소(personal data storage)를 고려하고 있지만, 마이데이터의 주체인 일반 시민은 법률과 사업 추진에 대해 명확히 인지하지 못하고 있다. 마이데이터는 개인의 데이터 열람과 이동에 대한 법률, 데이터를 개인이 관리하는 책임, 개인의 데이터를 위임하는 서비스 업체와의 관계 등 획기적인 사회문화적 변화를 만들 수 있다. 이런 측면에서 개인이 데이터를 관리하는 새로운 역할을 인지하고 이에 대한 사회 전반의 공감대를 형성하는 것이 필수적이다. 기업 중심으로 추진되는 마이데이터 사업에서 개인의 데이터 주권을 강조하는 정책적 변화도 검토해야 한다. 양질의 데이터 확보는 새로운 국가경쟁력 요소가 될 것이다. 일자리 창출이 눈앞의 무거운 과제이고 인형 눈알 붙이기라는 비판이 있지만, 데이터 분야의 대규모 투자는 새로운 시장을 만들고 국가의 주요 산업과 연계돼 새로운 경쟁력을 창출할 수 있다. 한편 범정부 차원의 전략과 지향점을 명확하게 정의하고 균형 있게 추진할 필요가 있다. 대규모 예산 투자는 다양한 경제지표에 즉각적으로 반영될 수 있겠지만, 국가 차원의 데이터 경쟁력 확보는 단기간에 만들어내기 어렵다. 이런 측면에서 정부의 정책은 속도와 성과 위주의 대규모 사업보다 기초를 튼튼하게 만들고 지속적으로 생태계 구축을 지원하는 방안을 모색해야 한다.
COPYRIGHT ⓒ 2019 KOREA DEVELOPMENT INSTITUTE. ALL RIGHTS RESERVED.