본문 내용으로 건더뛰기

모바일 대메뉴명

KDI 경제정보센터

16개 경제부처가 만드는
국내 유일의 경제 정책 정보지

나라경제

발행물

칼럼

류한석의 신기술 토크
범용 AI의 선두주자 GPT-3가 가져온 충격
류한석 류한석기술문화연구소 소장 2020년 10월호


현재 IT업계에서 이용하는 인공지능(AI)은 구체적으로 정해진 작업만 수행하도록 프로그래밍된 것으로, 전문 용어로는 ‘Narrow AI(좁은 인공지능)’라고 한다. 이는 AI가 특정 작업만 수행할 수 있고 다른 작업은 수행할 수 없어 사용 범위가 제한적이라는 의미에서 붙여진 명칭이다.
반면에 다양한 업무 수행이 가능하고 인간과 흡사한 지적 판단이 가능한 AI를 ‘Strong AI(강한 인공지능)’라고 한다. 최근에는 Strong AI와 유사한 의미로 ‘AGI(Artificial General Intelligence,  범용 인공지능)’라는 용어를 더 많이 사용하고 있다.

일론 머스크 등이 참여한 AI 연구기관 오픈AI, 1,750억 개 매개변수 갖춘 GPT-3 개발
AGI는 인간의 두뇌와 동일한 수준에서 작업을 수행하고 음성을 듣고 이해하며 복잡한 사고와 판단을 수행할 수 있는 지적 능력을 가진 가상 두뇌다. AGI는 단지 하나의 기술이 아니라 인류의 역사에 중요한 계기가 될 것으로 기대되는 기술이다.
현재 여러 기업이 AGI 개발에 뛰어들고 있는데 현시점에서 가장 주목할 만한 사례는 GPT–3다. GPT–3의 개발사 오픈AI(OpenAI)는 와이 콤비네이터 전 사장 샘 알트만(Sam Altman), 테슬라 창업자 일론 머스크(Elon Musk), 링크드인 공동창업자 리드 호프먼(Reid Hoffman), 페이팔 공동창업자 피터 틸(Peter Thiel), 구글 출신 딥러닝 전문가 일리야 서츠케버(Ilya Sutskever) 등이 참여해 2015년 설립한 AI 연구기관이다. 2019년 7월 마이크로소프트는 오픈AI에 10억 달러를 투자했으며 오픈AI의 가장 중요한 후원자를 자처하고 있다.
GPT는 Generative Pre–Training의 약어로 기존 GPT–2의 개량 모델인 GPT–3는 방대한 양의 데이터셋(3천억 개의 토큰)과 매개변수(1,750억 개)를 갖춘 자연어 모델 기반의 딥러닝 시스템이다.
GPT–3는 기존 AI와 달리 상당히 많은 분야의 질문에 답할 수 있다. 단일 문장이 아니라 대화의 문맥을 파악하고 창의적인 답변을 내놓는 수준에 도달했으며 인간이 작성한 뉴스 기사와 구분하기 어려운 수준의 기사를 작성할 수도 있다. 실제로 GPT–3와 대화를 나눠보면 GPT–3는 인류의 어리석음과 사랑에 대해 얘기하고 거짓말도 한다.
GPT–3의 API(Application Programming Interface)에 접근할 수 있는 일부 개발자들은 GPT–3 기반의 애플리케이션을 개발해 선보였다. 그들의 블로그나 트위터에서 GPT–3를 응용한 결과물을 만나볼 수 있다. 예를 들면 GPT–3를 특정 역사적 인물로 설정해 대화를 나누거나(이는 GPT–3의 방대한 지식 때문에 가능하다), 소설가나 화가처럼 창작물을 만들도록 할 수도 있고, GPT–3에 단지 요구사항을 알려주는 것만으로 화면을 디자인하거나 프로그래밍 코드를 작성하도록 할 수도 있다. 미래에는 소프트웨어 개발자도 일자리를 걱정해야 하는 시기가 올 것이다. 웬만한 소프트웨어는 AI가 개발하는 시대가 도래할 것이기 때문이다.

방대한 데이터셋에 기반한 자연어 모델이 AI 성능 크게 개선할 수 있다는 것 증명
그렇다면 GPT–3가 다른 AI 시스템과 달리 AGI에 한층 가까워진 이유는 무엇일까? GPT–3의 기술적 성취는 무엇보다 시스템의 작동 규모와 성능에 있다. GPT–3는 다른 딥러닝 시스템과 마찬가지로 데이터에서 패턴을 찾는데 그러한 통계적 규칙성을 발견하기 위해 아주 방대한 데이터셋을 기반으로 학습한다.
인간의 뇌를 흉내 낸 GPT–3의 신경망은 특정 단어가 입력되면 서로 다른 노드(node) 간의 네트워크 매개변수를 기반으로 해당 단어에 뒤따를 가능성이 가장 높은 단어를 찾아낸다. 참고로 기계학습은 입력값에 대응하는 결괏값이 제대로 나오도록 하는 최적의 매개변수를 찾는 과정이다. 오픈AI는 GPT–3의 기계학습에 상당한 투자를 했다. 2018년에 출시된 GPT–1은 1억1,700만 개의 매개변수를 사용했고 2019년의 GPT–2는 15억 개의 매개변수를 사용했다.
그런데 GPT–3는 무려 1,750억 개의 매개변수를 통해 엄청난 성능 향상을 이뤄냈다. AI 연구 관점에서 GPT–3의 주요 성과는 매우 방대한 데이터셋에 기반한 자연어 모델이 AI의 성능을 크게 개선할 수 있다는 걸 증명했다는 데 있다. 지난 5월 마이크로소프트는 오픈AI 전용의 새로운 AI슈퍼컴퓨터를 발표했는데, 해당 시스템은 28만5천 개의 CPU 코어, 1만여 개의 GPU, 400기가비트(Gb)의 네트워크를 기반으로 한다.
GPT–3는 현재까지 나온 AI 시스템들 중에서 AGI에 가장 근접해 있으며 AGI의 실현 가능성을 한층 높여줬다. 하지만 GPT–3의 선전에도 아직 AGI의 시대는 도래하지 않았으며 AGI가 실제로 구현될 수 있는가에 대해 회의적인 전문가도 적지 않다. 어쨌든 지금과 같은 발전 속도로 봤을 때 GPT–4, GPT–5 등의 후속 모델은 더욱 놀라운 결과를 보여줄 것으로 예상된다.
현재 여러 글로벌 기업 및 스타트업이 AGI 개발에 뛰어들고 있으며 투자금도 계속 늘어나고 있다. 시장조사기관 마인드커머스의 보고서에 따르면, AGI에 대한 투자가 2023년까지 500억 달러에 달할 것으로 예상됐다.
AGI와 관련해 우리는 모든 가능성을 열어놓고 미래를 맞이할 필요가 있다. AGI가 결코 실현되지 않을 것이라고 믿는다면 지금 우리는 그리 대비할 일이 없지만, AGI가 실현된다고 가정한다면 새로운 미래를 위해 대비할 것이 아주 많다. 어떤 관점이 더 미래지향적인지는 너무나 명백하지 않은가. 
KDI 경제정보센터