올 초 여야의 첨예한 정치대립 상황 속에서도 침체된 국내 데이터경제의 활성화를 위해 데이터 3법(「개인정보 보호법」, 「정보통신망법」, 「신용정보법」) 개정안이 통과됐다. 개정 데이터 3법은 ‘가명정보’ 개념을 도입해 이를 통계작성, 과학적 연구, 공익적 기록보존 등의 목적에 사용할 수 있도록 했다. 그 외에 분산된 개인정보 보호 감독 기능을 일원화하고, 유럽연합(EU) 개인정보보호규정(GDPR) 적정성 결정 요건을 충족시키기 위해 개인정보보호위원회를 국무총리 소속의 중앙행정기관으로 격상시켰다.
결국 개정 3법으로 공익적 목적은 물론 기업들의 데이터를 활용한 새로운 사업 개발에 활로가 트였다. 특히 금융, 유통, 미디어, 건강, 통신 등의 분야에서 데이터 활용이 보다 활발해질 전망이다. 「신용정보법」의 개정으로 낙후된 금융산업의 혁신도 기대되는 부분이다. 신용정보의 대상으로 빅데이터가 포함되고 결합된 가명정보도 활용이 가능해졌다. 이미 유용한 데이터에 충분히 접근할 수 있는 제1 금융권보다는 제2, 제3 금융권 및 인터넷·핀테크업체들의 데이터를 이용한 새로운 서비스 개발이 본격화될 전망이다.
가명정보 개념과 활용범위의 모호함은 정부 가이드라인 통해 줄여야
기존 산업에서의 데이터 활용도 중요하지만 우리가 주목해야 하는 것은 신산업을 위한 데이터 활용이다. 빅데이터를 ‘21세기 원유’라고 하지만 앞으로 자율주행자동차, 스마트시티, 원격의료, 스마트금융 등 신산업에서 데이터는 ‘원유’를 넘어 ‘혈액’이 될 것이다. 즉 데이터는 중요 자원에 머물지 않고 신산업 자체를 움직이는 필수 요소가 될 전망이다. 전기가 없으면 전자산업이 존재할 수 없듯 앞으로는 데이터가 순환되지 않으면 신산업은 존재할 수 없다.
미래 산업의 핵심인 데이터 활용 분야에서 우리나라는 현재 미국, 유럽, 중국은 물론 일본에도 뒤처지고 있다. 앞서 언급한 EU의 GDPR에서는 상업적 목적을 포함한 모든 연구에 가명정보를 활용할 수 있게 했다. 일본도 2015년 관련 법을 개정해 제3자에게 익명 가공정보를 제공할 수 있도록 했다. 미국은 이미 의료나 신용정보 목적 이외의 상업적 데이터를 자유롭게 거래하는 수천 개의 데이터 브로커들이 활발히 활동하고 있다. 더욱이 알리바바, 텐센트 등 중국 기업들은 사이버보안법 외의 데이터 수집과 이용에는 제약 없이 인공지능(AI)과 빅데이터를 결합해 신산업 창출에서 이미 세계 어느 나라의 기업들보다도 앞서가고 있다.
우리의 경우 데이터 3법 개정 이후에도 기업들이 데이터를 활용하는 데는 여전히 여러 장애요인이 존재한다. 그중 첫 번째는 많은 전문가가 지적하듯 가명정보의 개념과 활용범위의 모호함이다. 사실 가명정보와 개인정보의 차이는 상대적이다. 개인의 신원을 알 수 있는 이름, 주민등록번호, 전화번호 등을 제외한 가명 혹은 익명정보라고 하더라도 그 개인에 관한 다른 정보들을 계속 수집해 추가하다 보면 개인의 신원을 충분히 유추할 수 있다. 이를테면 어떤 사람의 직업이 국회의원이라는 것만 알려져 있어도 거주지역 정보가 추가되면 금방 신원이 드러난다. 가명정보 활용의 구체적인 범위도 아직 불명확하다. 개정된 데이터 3법에서 기업은 ‘과학적 연구’ 목적으로만 가명정보를 활용할 수 있으나 가명정보를 어떤 조건에서 어떻게 활용할 수 있는지, 상업적 목적으로 어디까지 써도 되는지는 불분명하다. 이 문제에 대해서는 향후 정부가 가이드라인을 통해 점진적으로 관련 불확실성을 줄여나가야 할 것이다.
데이터 보안 문제, 관련 산업 같이 육성하는 것이 바람직한 해법
또 하나는 이제 겨우 3개 법의 개정이 이뤄진 것이고 관련 분야의 하위 법들은 아직 개정이 이뤄지지 않았다는 것이다. 예를 들어 의료 분야에서만 현재 「의료법」 등 관련 법안이 30여개에 이른다. 이런 하위 법들의 정비에서는 각 분야의 특성을 살리는 것이 필요하다. 모든 분야에 대해 일괄적인 개정 방안보다는 분야별로 전문화되고 마이크로한 접근이 필요하다. 예컨대 특정 의료 분야에서는 치료와 진료 목적에 어느 정도 가명정보 이상의 데이터 활용이 필요한 반면, 순수 연구 목적에서는 그렇지 않을 수 있다.
데이터 활용을 위한 데이터의 유통과 거래가 증가할수록 데이터 유출 위험은 높아질 수밖에 없다. 때문에 불법적인 데이터 유출은 물론 비의도적인, 사람이나 기계의 실수에 의한 유출을 방지하는 것도 매우 중요하다. 앞으로는 AI 발전의 부작용으로 사람보다 AI가 데이터를 유출할 가능성이 점차 높아지고 있다. 심지어 AI가 가짜 개인정보들을 대량으로 만들어내 유통시킬 수도 있다. 이를 막고 분별해내는 산업도 중요하다. 특히 개인정보가 돈이 된다는 인식이 확산되는 경우 이런 위험은 더욱 높아질 것이다. 데이터 보안과 관련된 부분은 데이터의 유출 및 불법사용에 대한 처벌 강화 등 법·제도적 보완도 필요하지만 보다 바람직한 방향은 관련 산업을 같이 육성하는 것이다.
마지막으로 AI와 데이터 관련 인력양성 문제는 산학연의 보다 밀접한 협업으로 풀어야 할 과제다. 산업에서 현실적인 수요가 있는 부분에 대한 인력양성에 초점을 맞출 필요가 있다. 정부 주도의 획일적인 인력양성보다는 데이터산업에 종사하는 사람들이 대학 및 대학원 교육과 연구에 보다 적극적으로 참여하면서 실질적인 역할을 할 수 있도록 정부가 지원하는 것이 필요하다. 대학들도 단순한 코딩 교육을 실시하기보다는 데이터를 통해 창의적인 인재를 육성하는, 데이터에 대한 이해력 제고 교육에 보다 힘을 써야 한다.
정리하면 데이터 3법 개정 이후 우리의 과제는 정부의 적극적인 지원하에 데이터 활용의 활성화를 어떻게 민간 주도로 풀어나가는가에 있다. 현재는 울퉁불퉁한 비포장 길만 겨우 마련된 상황이다. 길을 좀 더 정비해 대량의 데이터가 신속하고 안전하게 돌아다니게 하는 것은 정부의 몫이다. 현재 세계 데이터경제의 판도를 보면 정부의 세심한 배려하에 민간의 창의성과 노력이 바탕이 된다. 다양한 분야에서 AI를 접목해 신나게 데이터 고속도로를 달리게 하는 신산업 육성이 대세가 되고 있다. 계획경제에 자본주의경제를 접목한 중국의 사례를 봐도 결국 데이터 분야에서는 민간 주도의 산업화만이 기업은 물론 국가의 경쟁력을 높일 수 있다는 점을 유념해야 한다.