2016년 3월 구글 딥마인드의 알파고가 이세돌을 이긴 것은 우리에게 큰 충격을 줬다. 국민들에게 인공지능(AI)이 머지않아 인간을 능가할 것이라는 두려움과 환상을 주기에 충분했다. 한국 언론에 단골로 등장하는 미래학자 레이먼드 커즈와일은 AI가 인간을 능가하는 특이점이 2045년쯤 가능할 것이라는 근거 없는 전망으로 AI에 대한 환상을 실현 가능한 비전으로 만들었다. 여기에 일부 정부출연연구소와 학자들까지 환상 부풀리기에 가세했다.
그러나 현재의 AI는 데이터에서 기계적으로 학습한 패턴에 따라 정해진 연산을 수행하는 것뿐이다. 인간의 ‘이해력’과 ‘창의력’이 없다. 그 추론 과정을 설명하기도 힘들다. 예를 들어 빅테크 기업의 AI 기술 독점을 염려해 만들어진 오픈AI가 올 6월 선보인 최신의 자연어 처리 기술 GPT-3를 보자. 현재까지 학습 텍스트 데이터 규모가 가장 큰 이 기술은 인간이 쓴 것처럼 문장을 앞뒤에 맞게 생성하는 것으로 보이지만 인간을 피상적으로 흉내 낼 따름이다. 사람이 평생 학습하는 텍스트의 수백억 배의 데이터를 기계학습 시스템에 입력한 결과다. 사람같이 이해한다는 개념이 없다. 따라서 새로운 환경에서 새로운 문제를 만들고 푸는 창의적 역량도 없다.
데이터 기반 혁신에 산업·학문 경계 없지만 대학은 분절된 체계 극복 못하고 있어
필자는 최근 한국을 방문한 AI의 세계적 석학인 마이클 조던 미국 UC버클리 교수와 수차례 대담했다. 지난해 추석 연휴에 중국 칭화대의 심포지엄에 초청돼 서로 생각을 나눈 후 철학이 통해 한국에 초청하게 됐다. 그와 나는 AI라는 환상을 주는 이름보다 데이터사이언스가 학문적으로 더 적합한 이름이라는 점에 공감한다. 앤드류 응 미국 스탠퍼드대 교수와 튜링상 수상자 조슈아 벤지오를 비롯해 스탠퍼드대, UC버클리, MIT 등 거의 모든 명문대에서 AI 연구를 선도하는 학자를 가장 많이 키운 조던 교수는 특이점은 과학적 근거 없는 공상과학소설이라고 잘라서 말한다.
GPT-3의 경우에서 보듯이 사람의 모사 능력을 향상시키기 위해 패턴 인식용 딥러닝 신경망의 크기와 학습 데이터를 최적화하는 현재의 AI 패러다임은 상업적으로 그 효용성을 인정받았지만 연구에서는 한계에 이르렀다는 것이 조던 교수 같은 석학들의 견해다.
그는 제한된 능력을 전제로 많은 AI 에이전트가 시장을 이뤄 인간의 의사결정을 돕는 새로운 패러다임을 제안한다. 이 패러다임의 발전을 위해 경제학, 의학 등 데이터 기반의 합리적 의사결정을 연구해온 학문들을 하나의 장으로 끌어내는 것이 바람직하다. 이런 관점에서 조던 교수는 다양한 학부 배경을 가진 대학원생들을 뽑아 데이터사이언스 교육 연구를 하도록 이끄는 서울대 데이터사이언스대학원의 교육 철학에 공감했다.
전 세계적으로 데이터 기반의 파괴적 혁신이 모든 산업과 학문에서 경계 없이 일어나고 있지만 대학은 분절된 전통적 학문 사일로(silo) 체계를 극복하지 못하는 어려움이 있다. 5~6년 전까지만 해도 UC버클리도 예외가 아니었다. 하지만 이 대학은 범대학 차원의 허브형 데이터사이언스 학사 조직을 만들어 대학 교육의 혁명적 변화를 이끌어냈다.
2019~2020학년도에 Data8 번호가 붙은 1학년 과목 ‘데이터사이언스 기초’만 2,800명이 수강했다. 그다음 과목인 ‘데이터사이언스의 원론과 기법’은 1,600명이 수강했다. 조던 교수가 개설한 고급 과목 ‘데이터와 추론, 의사결정’은 500명이 수강했다. 이 외에 데이터와 AI 윤리 문제를 다루는 ‘인류와 윤리’ 과목도 500명이 수강했다. Data8 과목의 경우 2015~2016학년도에 불과 500명이던 수강생이 그다음 해에 1천 명 그리고 최근에는 2,800명으로 늘어났다. 이 과목은 아무런 기초가 없는 대학 신입생들에게 계산학적 사고와 추론적 사고의 개념을 실제 데이터셋을 가지고 보여주고 실험하면서 가르친다. 파이썬과 주피터 노트북 사용법에서 시작해 데이터베이스 테이블 개념과 조인 연산, 통계적 개념, 선형 회귀(linear regression)와 분류(classification)를 가르친다.
다양한 학문이 경계 없이 합쳐질 때 새로운 패러다임 주인 될 가능성 높아
학문적 자유를 존중하는 대학은 기업에 비해 변화의 속도가 느리다. 변화의 필요성이나 방법에 동의하지 않거나 현재의 사일로를 지키려는 세력 때문에 변화가 쉽지 않다. UC버클리에서는 1학년 과목 Data8의 대성공으로 범대학 차원의 변화가 탄력을 받아 변화의 비전이 성공하게 됐다. 대다수의 신입생이 Data8을 수강하면서 학부 과정의 통계학, 생명과학, 사회학 등 다른 과목도 따라서 변할 수밖에 없다.
UC버클리는 다음 단계 도약을 위해 이 데이터사이언스 학사 조직의 책임자를 학장에서 부총장으로 격상하고 산업체 연구소 책임자를 영입했다. 이 변화에 감동한 익명의 기부자가 3천억 원을 UC버클리에 기부했다.
안타깝게도 조던 교수나 필자가 보기에 우리의 AI 교육과 연구는 폐쇄된 지역 시각에 갇혀 있는 것으로 보인다. 일부 AI 대학원은 현재의 AI의 출발지인 전기컴퓨터공학보다 더 특화된 교육과 연구를 지향한다. 또한 1만여 명이 몰리는 복잡한 국제학회의 논문 수를 우월성 지표로 삼는다. 이러한 양적 지표와 특화된 좁은 시각은 경주마처럼 경마장의 정해진 길을 따라 빨리 달리는 추격형 인재양성에는 효과적일지 모르지만 새로운 패러다임의 새로운 문제에 도전하고 선도하는 인재를 키우는 것과는 거리가 있다.
AI 연구가 새로운 패러다임을 모색하는 지금은 한국의 AI 연구와 교육이 글로벌 일류로 도약하기 위한 최적의 시점이다. 이런 도약을 위해서는 앞서가는 글로벌 일류 관점을 겸허하게 받아들여야 한다. AI 코어와 AI-X를 나눠 교육하자는 일부의 주장은 추종자적 사고의 결과다. 경제학 등 문과 졸업생이 데이터사이언스 교육을 받아 새로운 패러다임의 선구자가 왜 되지 못하겠는가? 의과대 졸업생이 데이터사이언스 교육을 받아 미래 노벨 의학상 수상자가 될 수 있지 않는가? 파괴적 혁신은 개방성과 다양성에서 나온다. 하나의 운동장에서 다양한 학문이 경계 없이 합쳐질 때 우리가 새로운 패러다임의 주인이 될 가능성이 높다.