본문 내용으로 건더뛰기

KDI 경제정보센터

ENG
  • 경제배움
  • Economic

    Information

    and Education

    Center

칼럼
통계로 세상 읽기데이터경제, 어떻게 측정해야 할까
변준석 통계청 통계개발원 사무관 2024년 07월호

지난 5월 오픈AI가 챗GPT-4o를 출시해 세상을 다시 한번 놀라게 했다. 이전 모델처럼 텍스트, 음성 등을 인식해 다시 텍스트로 변환 및 전달하는 것에서 나아가 모든 형태의 입력을 종합적으로 인식하고 실시간으로 텍스트, 오디오, 사진, 비디오 등을 처리·생성하는 멀티모달 기능을 선보였다. 

한편 엔비디아는 생성형 AI 모델의 기반이 되는 거대 언어모델(LLM) 훈련에 적합하도록 설계된 그래픽처리장치(GPU) ‘H(Hopper)100’을 출시한 데 이어 올 3월엔 H100보다 연산 속도가 2.5배, 전용 플랫폼 적용 시 추론성능이 최대 30배 향상된 차세대 고성능 GPU ‘B(Blackwell)100’을 공개해 AI시장에서 큰 주목을 받고 있다. 이에 미국 AI 기업들은 인간과 유사한 수준의 지능과 처리능력을 갖춘 범용 AI(AGI)가 생각보다 빨리 출현할 것으로 기대하고 있다. 챗GPT-4o는 범용성 및 활용성 측면에서, B100은 실제 구현 가능한 하드웨어 측면에서 AGI의 출현이 그리 멀지 않았음을 보여준다.

그렇다면 AI, 나아가 AGI 학습과 추론의 원천은 무엇일까? 바로 데이터다. 디지털 시대에는 산업 현장, 판매나 서비스 등 비즈니스 상황뿐 아니라 우리의 소비와 일상 하나하나까지 디지털로 전환된 데이터로 저장된다. 한국데이터산업진흥원에 따르면 2023년 해외 데이터시장 규모는 약 6,018억 달러에 이를 것으로 추정되며, 연평균 성장률은 15.7%에 달한다(<그림 1> 참고). 데이터경제는 종래의 경제학에서 말하는 생산의 3요소인 토지·노동·자본에 데이터가 추가돼 생산의 4요소가 되는 경제 체제라고 할 수 있다. 여기에서 데이터는 ‘데이터 자본주의’라고 말할 수 있을 정도로 대체 불가능하며 핵심적인 요소다.
 

디지털경제 등 유사 개념 선행연구의
지표체계 구축 방향을 참고


데이터가 경제활동의 중요한 생산요소로 활용되는 데이터경제 시대에 기업뿐 아니라 국가통계에서도 데이터는 주요한 자산이다. 데이터경제는 개념적 정의가 다양하고 디지털경제, 인터넷경제 등 다수의 유사 개념이 존재하기 때문에, 국가통계 측면에서 측정하고 진단하기 위해서는 우선 데이터경제의 이론적 정의와 유사 개념을 비교·파악할 필요가 있다. OECD 보고서 등의 선행연구에서는 데이터경제를 ‘데이터와 지식(알고리즘)이 경제주체의 혁신 능력과 국가경제 성장의 핵심요소가 되는 새로운 경제 구조’로 정의한다. 즉 다양한 디지털 기술을 기반으로 데이터를 생산, 수집, 가공, 분배, 소비, 분석 및 활용해 의미 있는 정보를 창출하는 경제활동으로 보는 것이다. 

한편 디지털경제는 주된 경제활동이 디지털화되고 네트워크화된 정보와 지식이라는 생산요소에 의존하는 경제 체제이며, 인터넷경제는 주된 경제활동이 인터넷상의 가상공간을 기반으로 이뤄지는 경제로서 좁은 의미의 디지털경제라고 이해할 수 있다. 네트워크 공간, 나아가 디지털 공간에서 발생하는 모든 정보가 데이터다. 즉 데이터는 디지털경제를 구성하는 핵심요소다. 디지털경제는 디지털 인프라와 관련 기술을 강조하는 개념인 반면, 데이터경제는 디지털경제가 구동되는 핵심요소를 강조한 개념이라는 점에서 차이가 있을 뿐 두 개념을 분리해 설명하기는 어렵다. 

이에 데이터경제 측정의 목적과 방향을 설정하기 위해 유사 개념인 디지털경제의 지표 구축과 관련한 해외 연구를 참고했다. 디지털경제의 규모를 측정하는 데 초점을 두고 있는 미국식 접근법과 회원국의 경제적·사회적 디지털화 또는 디지털 성숙도 비교에 초점을 두는 EU식 접근법에서 착안해 데이터경제 규모를 측정함으로써 국가경제에서 데이터경제가 차지하는 비중을 가늠하고, 디지털 전환을 통한 데이터 활용의 사회적 성숙도와 경제적·사회적 영향을 측정할 수 있는 지표를 구축하고자 한다. 이를 위해 다음과 같이 데이터경제를 데이터경제 펀더멘털, 데이터경제 활동, 데이터경제의 경제적·사회적 요소로 범주화해 측정을 위한 프레임워크를 짜봤다.

첫째, 데이터경제 펀더멘털을 측정하기 위해 데이터경제의 기초를 구성하는 3대 요소인 데이터 노동, 데이터망, 데이터 자본을 중심으로 범주화했다. 여기에 데이터경제로의 전환 심화도를 측정할 수 있는 지표들을 포함했다. 예를 들어 데이터 노동에는 데이터산업 종사자 수, 데이터망에는 5G 준비 지수 등의 지표가 있다.

둘째, 데이터경제 규모를 측정할 수 있도록 산업을 기준으로 생산내역을 나타낸 공급사용표(SUT)에 기반한 경제규모 측정 방법을 제시한다. 디지털 인프라, 전자상거래, 디지털서비스 등 미국 및 캐나다에서 디지털경제를 측정하기 위해 사용했던 분류를 차용하고, 한국은행의 표준산업분류코드를 북미 산업분류코드와 매칭했다. 이를 통해 전체 경제에서 데이터경제가 차지하는 비중을 측정할 수 있다.

셋째, 데이터경제의 경제적·사회적 요소를 측정하고자 사회, 문화, 교육 등의 관점에서 국가혁신 체계를 반영해 데이터 기반 정부, 데이터 교육 체계, 데이터 과학기술 역량, 데이터의 사회적 영향 등으로 지표를 범주화해 종합적으로 파악할 수 있도록 했다. 특히 데이터의 사회적 영향 영역에서는 개인정보 유출사고 수, 데이터 리터러시 등의 요인도 포함했다.

1990년대 인터넷망의 확산과 2000년대 스마트폰의 보급은 디지털 시대의 서막을 열었다. 이후 디지털 인프라 확대와 관련 기술 발전으로 데이터 활용이 고도화되고 있다. AGI의 도래를 기대하면서 성숙한 디지털 시대를 준비하고 있는 지금, 미래 변화에 효과적으로 대처하고 대응하기 위해서는 데이터가 갖는 경제적·사회적 가치를 이해하고 측정할 필요가 있다. 

데이터의 경제효과 및 기술 성숙도는
우리 사회의 현재를 가늠할 수 있는 척도


데이터 활용이 미치는 직간접적 경제효과를 측정하고 관련 기술의 성숙도를 진단해 봄으로써 우리 사회의 현재를 가늠할 수 있을 것이다. 또한 데이터 활용이 우리 사회에 미치는 긍정적·부정적 영향력을 이해하고 대비해야 할 것이다. 

※ 본 기고는 통계개발원의 연구조사 보고서 「데이터경제로의 이행에 따른 국가발전지표 진단연구(2022)」에 기반해 작성함.
보기 과월호 보기
나라경제 인기 콘텐츠 많이 본 자료
확대이미지