최근 AI 기술의 비약적인 발전으로 이른바 ‘AI 에이전트’라 불리는 지능형 비서들이 일상 깊숙이 들어오고 있다. 음성 대화나 텍스트 채팅을 통해 개인 비서처럼 도움을 주는 AI가 스마트폰, PC, 스피커, 메신저 등 다양한 플랫폼에서 활약하고 있다. 최근 진화된 AI 에이전트를 자사 서비스에 앞다퉈 적용하고 있는 글로벌 빅테크 기업들이 어떤 서비스를 내놓는지 살펴보자.
아마존, 방대한 이용자 기반으로 AI 에이전트 대중화···
SNS와 AI 안경 장악한 메타의 AI 비서들
아마존은 가정용 AI 비서인 알렉사(Alexa)에서 한 단계 도약한 ‘알렉사 플러스(Alexa+)’를 올 초 선보였다. Alexa+는 아마존 프라임 회원에게 무료로 제공되는 개인 AI 조수로, ‘이용자가 원하는 일을 알아서 척척 해주는 것’을 목표로 한다. Alexa+의 가장 큰 특징은 음성 기반의 뛰어난 의사소통과 광범위한 업무 처리 능력으로, 특히 주목할 점은 말을 행동으로 바꾸는 능력이다. Alexa+는 단순 질의응답을 넘어 여러 서비스를 연동해 실제 작업을 자동 수행한다. 아마존은 Alexa+ 내부에 수만 개의 서비스와 기기를 연결하는 전문가 시스템을 구축해 놨다고 밝히고 있다.
예를 들어 이용자가 “주말에 오븐을 고치고 싶어”라고 말하면, Alexa+는 웹을 탐색해 수리업체를 찾고 수리업체의 계정 인증을 거쳐 수리 일정을 예약한 뒤 “수리 예약을 완료했다”고 알려줄 수 있다. 이 모든 과정을 이용자 개입 없이 처리한다. 또한 이용자의 구매 내역, 선호 음악, 동영상 시청기록, 배송지 등 개인정보를 학습해 소비 취향을 파악하고, 이용자가 ‘결혼기념일 날짜’, ‘채식주의 식단’ 등 특정 정보를 직접 알려주면 장기 기억 장치에 저장한다. 이들 정보를 종합해 이용자의 맥락과 취향을 이해하고 맞춤형 조언과 추천을 제공하는 능력을 강화한다. 현재 Alexa+를 사용할 수 있는 기기인 ‘에코(Echo)’의 보급이 6억 대를 넘어서고 있다. 아마존은 프라임 회원 등 방대한 이용자를 기반으로 AI 에이전트 대중화를 시도하고 있다.
메타는 인스타그램, 페이스북, 스레드, 왓츠앱 등에 AI 비서를 제공하는 전략을 펼치고 있다. 2023년 9월 연례 개발자 행사인 메타 커넥트에서 ‘메타 AI’라는 대화형 AI 서비스를 발표한 데 이어 지난 4월에는 최첨단 오픈소스 거대언어모델(LLM) ‘라마 4(Llama 4)’를 공개해 더욱 진화된 서비스를 전 세계 이용자에게 공급할 계획이다. 메타 서비스 이용자는 AI 에이전트와 보다 감정적으로 연결해 주는 AI 친구 서비스를 통해 인스타그램, 왓츠앱 등에서 자신만의 개인 AI 에이전트를 만들어 검색, 쇼핑, 예약, 콘텐츠 생성 등 다양한 기능을 자동 실행할 수 있다. 메타는 일상생활에서 필요한 다양한 서비스를 통합해 원스톱 처리하는, 이른바 슈퍼앱으로 메타 AI를 발전시킨다는 계획이다. 또한 메타 AI를 챗GPT와 유사한 독립 서비스로도 제공할 예정이다.
나아가 메타는 AI 안경을 발전시켜 올해를 AI 안경 대중화의 원년으로 삼겠다는 목표다. 대화형 음성 AI 에이전트에 더해 다양한 AI 안경 앱을 선택해 설치할 수 있는 AI 안경 앱스토어도 제공할 계획이다. 결국 메타는 AI 에이전트 앱 플랫폼 발전에 미래를 걸고 있다.
구글은 지난 4월 매년 개최하는 기술 컨퍼런스 ‘구글 클라우드 넥스트 2025’에서 서로 다른 AI 에이전트나 서비스를 쉽게 연결해 협력하게 만드는 A2A(Agent to Agent) 프로토콜을 공개했다. 마치 오케스트라 지휘자처럼 이용자가 원하는 바를 실현하기 위해 필요한 에이전트를 알아서 호출하고 에이전트와 에이전트 그리고 에이전트와 기존 웹 서비스를 연결해 업무를 수행한다. 미국 생성형 AI 스타트업 앤스로픽이 개발한 MCP(Model Context Protocol)가 파일 접근이나 이미지 생성 같은 기본적인 도구들을 연결하는 개념이라면, 구글 A2A는 한 단계 더 나아가 AI 에이전트 자체를 연결한다.
A2A는 구글 제미나이뿐 아니라 챗GPT 등 다른 기업의 LLM들도 연결할 수 있다. 각 에이전트는 ‘자기가 무엇을 할 수 있는지’를 텍스트 기반의 데이터 교환 표준인 ‘제이슨(JSON)’ 형식으로 기록한 ‘에이전트 카드’를 가지고 있다. 이용자가 요청하면 클라이언트나 원격 에이전트가 이 에이전트 카드들을 분석한 후 알아서 가장 적합한 에이전트들을 찾아서 연결한다. 예를 들어 인사 담당자가 지원자 목록을 분석하고 선별해 인터뷰 일정을 조율하는 복잡한 작업을 에이전트 하나가 다른 에이전트들을 연결해 처리할 수 있다.
개발자 이점도 뚜렷하다. 구글 클라우드 같은 특정 클라우드 플랫폼에 맞춰 솔루션을 개발할 경우 동일한 기능이라도 다른 클라우드 플랫폼에서 사용하려면 그에 맞춰 다시 제작해야 한다. 그러나 A2A 프로토콜을 이용해 필요한 기능을 한번 구현하면 여러 클라우드 플랫폼에서 모듈화된 코드를 재활용하는 방식으로 호환되는 앱을 만들 수 있다. 에이전트 카드에 더해 이러한 플랫폼 호환성이 개발 시간과 비용을 줄여줄 수 있다. 결국 A2A는 단순히 툴을 연결하는 것을 넘어 분산돼 있는 다양한 AI 모델과 기능을 서로 협력하게 만드는 발판을 제공한다. 이를 통해 각 AI 모델마다 독립적인 생태계를 계속 유지하면서도 개별 에이전트들이 뭉쳐 훨씬 강력하고 통합된 서비스를 만들 수 있다.
구글은 알아서 에이전트 호출해 연결하고 호환도 가능,
MS는 복잡한 다중 에이전트 시스템 구축 지원
MS는 지난 4월 에이전트 기반 솔루션을 빠르고 효율적으로 생성하고자 하는 개발자들을 위한 애저 AI 파운드리(Azure AI Foundry)라는 개발 플랫폼을 발표했다. 이 플랫폼은 개발하고자 하는 특정 서비스에 대한 초기 콘셉트 구상 및 실험부터 코딩, 사전 프로덕션 평가, 프로덕션 관리 및 이후 단계까지 전체 AI 개발 수명 주기를 지원하는 광범위한 기능을 제공한다. 구글 A2A의 ‘에이전트 카드’와 유사하게 애저 AI 파운드리는 ‘모델 카탈로그’를 제공한다. 이는 오픈AI, 메타, 딥시크, 코히어 등의 프리미엄 LLM뿐만 아니라 MS의 파이(Phi)와 같은 소형언어모델(sLLM), AI 플랫폼인 허깅페이스의 수백 가지 오픈모델 등 수천 개의 AI 모델을 탐색하고 접근할 수 있도록 돕는다. 이 외에도 지식 및 작업 추가, 다양한 AI 서비스 통합, 코드 통합, 평가 및 모니터링, 보안 및 거버넌스 기능을 제공하며 복잡한 다중 에이전트 시스템 구축을 지원한다.
MS는 지난해 10월에는 맞춤형 AI 에이전트 개발 플랫폼인 ‘코파일럿 스튜디오’를 출시했으며, 자사를 ‘코파일럿의 회사’라고 부를 정도로 AI 에이전트 전략에 사활을 걸고 있다. 사이버 공격 징후를 AI가 감지해 관리자에게 알려주고 조치를 제안하는 시큐리티 코파일럿(Security Copilot), 영업사원의 CRM 활용을 돕는 세일즈 코파일럿(Sales Copilot) 등 직무 특화 AI도 속속 내놓고 있다.
MS는 컴퓨팅 환경 전반에 AI를 내재화해 이용자가 무엇을 하든 곁에서 도와주는 AI 비서를 제공하겠다는 포부를 밝히고 있다. 윈도우 PC부터 클라우드서비스까지 끊김 없이 이어지는 범용 코파일럿 경험이 현실화된다면, 업무효율 증진은 물론 일상의 사소한 불편까지도 AI가 매끄럽게 해결해 주는 새로운 시대가 열릴 수 있다.
이렇게 빅테크 기업들은 서로 다른 강점과 철학으로 AI 에이전트 경쟁에 뛰어들고 있다. 그 결과 인간과 AI의 상호작용은 더욱 자연스러워지는 방향으로 혁신될 것이다. 앱을 끝없이 터치하기보다는 앱과 대화로 소통하고, AI가 선제적으로 제안하며, 멀티 디바이스가 연동돼 언제 어디서나 필요한 도움을 받을 수 있는 환경이 보편화될 수 있다.