글. 이상덕
매일경제 기자. <챗GPT 전쟁: 실리콘밸리는 지금 무엇을 준비하고 있는가> <매그니피센트 7: 빅테크 투자 지도> 저자
흔히 챗봇으로 불리는 생성형 AI는 주로 대화와 콘텐츠 생성을 하는 데 사용된다. 사용자로부터 명시적 지시나 질문을 받아야만 작동하고, 이후 글쓰기·번역·코딩 등 정보 생성 업무를 한다. 예를 들어 챗GPT에게 요리법을 물어보면 즉시 답변은 하지만, 그 후의 행동은 사용자가 직접 수행해야 한다.
반면, 에이전트형 AI는 능동적이다. 스스로 목표를 설정하고, 필요할 경우 시스템과 연동해 연속적인 작업을 수행할 수 있다. 사용자가 처음 명령을 내린 이후에도 메모리와 컨텍스트를 유지해 여러 단계의 작업을 자동으로 실행하는 것이다. 예를 들어, AI 에이전트는 식재료를 스스로 확인하고 부족한 재료를 온라인으로 주문한 뒤 레시피를 추천할 수 있다.
이러한 이유로 글로벌 시장조사업체 가트너는 ‘에이전트형 AI’를 2025년 가장 주목할 전략 기술 트렌드로 선정했다.
구분 | 생성형 AI | AI 에이전트 (자율 에이전트) |
---|---|---|
주요 역할 | 대화 및 콘텐츠 생성 (조언자) | 자율적 행동 및 작업 수행 (실행자) |
개입 여부 | 사용자의 지시 및 질문 필요 | 필요 시 스스로 작업 수행 |
강점 | 글쓰기, 번역, 코딩 등 정보 생성 | 이메일 전송, 일정 관리, IoT 제어 등 |
작동 방식 | 사용자와의 상호작용에 의존 | 외부 도구·데이터 통합해 독립 실행 가능 |
예시 | 챗GPT에게 요리법 묻기 | AI가 식재료 확인해 장보기·요리법 추천 |
AI 에이전트가 등장한 배경에는 단연 기술의 발전이 있다. 무엇보다 대규모 언어 모델(LLM, Large Language Model)의 발전은 방대한 데이터를 학습해 복잡한 추론과 자연어 이해를 가능하게 했다. 덕분에 에이전트는 맥락을 파악하고, 여러 단계의 계획을 세울 수 있게 된 것이다. 검색증강생성(RAG, Retrieval-Augmented Generation)을 통해 실시간 외부 데이터를 검색하고 활용할 수도 있게 됐다. 기존 AI는 학습한 정보만 답할 수 있었지만, 이제는 RAG를 통해 웹이나 내부 데이터베이스에서 최신 정보를 가져와 더 정확하고 시의적절한 결정을 내린다.
강화학습(Reinforcement Learning)과 인간 피드백을 통한 강화학습(RLHF, Reinforcement learning from human feedback) 역시 AI 에이전트를 가능하게 했다. 강화학습은 에이전트가 목표를 달성할 때 보상을 줘 올바른 행동으로 유도하는 방식인데, 여기에 RLHF를 더하면 학습의 질이 높아진다. 또 데이터를 클라우드로 전송하지 않고 기기 자체에서 처리하는 엣지 컴퓨팅(Edge Computing)이나 새로운 정보를 지속적으로 받아들이며 성능을 개선하는 지속 학습(Continual Learning), 외부 데이터에 신속하게 접근할 수 있도록 지원하는 네트워크 인프라, 음성 이미지 텍스트를 연동하는 멀티모달(Multimodal) 역시 AI 에이전트를 빠른 속도로 개선시켰다.
이를 통해 AI는 관찰(Observe) → 계획(Plan) → 실행(Act)이라는 사이클을 스스로 돌리며, 목표를 향해 작업을 할 수 있는 것이다.
다양한 AI 에이전트 툴킷을 제공하는 엔비디아의 네모(NeMo) © 엔비디아
이러한 가능성은 빅테크의 에이전트 AI 전쟁을 촉발했다. 먼저 오픈AI와 마이크로소프트(MS)는 GPT-4와 GPT-4.5 모델을 토대로 다양한 AI 에이전트를 개발하는 중이다. MS는 코파일럿이라는 브랜드를 전면에 내세워 워드, 아웃룩, 팀스와 같은 오피스 제품군에 AI 기능을 통합했다. 특히 올해 4월 코파일럿에 ‘메모리’ 기능을 추가, 사용자 선호도와 습관을 기억하고, 이를 토대로 예약, 쇼핑, 콘텐츠 생성 등 다양한 작업을 수행할 수 있도록 했다.
스마트폰을 장악한 구글과 애플 역시 에이전트 AI에 적극적이다. 구글은 제미나이(Gemini)를 이미 지메일, 구글 드라이브, 유튜브 등에 연동했고, 이를 토대로 이메일 요약, 문서 작성, 일정 관리 등을 지원하고 있다. 구글은 올해 말까지 음성비서인 구글 어시스턴트를 제미나이로 완전히 교체한다는 목표를 갖고 있다.
애플은 올 들어 검색 엔진을 AI로 속속 바꾸고 있다. 애플의 서비스 부문 책임자인 에디 큐 부사장은 블룸버그를 통해 “지난달 사파리(Safari)의 검색량이 처음으로 감소했다”면서 “오픈AI와 퍼플렉시티, 앤스로픽 등 AI 기반 검색 제공자들이 결국 구글과 같은 기존 검색 엔진을 대체하게 될 것”이라고 말했다.
메타는 올해 4월, 연례 AI 행사인 라마콘(LlamaCon)을 열고 오픈소스 AI인 라마4를 토대로 한 독립형 AI인 메타AI 앱을 공개했다. 페이스북, 인스타그램, 메신저 등 종전 플랫폼과 통합 사용이 가능하고, API를 활용해 개발자는 다양한 맞춤형 AI 에이전트를 개발할 수 있다.
그래픽처리장치(GPU) 기업인 엔비디아 역시 네모(NeMo)라는 툴킷을 공개했다. 엔비디아 GPU를 토대로 LLM, 음성 인식, 텍스트-음성 변환, 멀티모달 모델 등을 손쉽게 개발할 수 있다.
AI 에이전트는 업무 방식과 산업 구조를 더욱 빠른 속도로 바꿀 것으로 보인다. 미국 세인트루이스 연준에 따르면, 지식 근로자의 75%가 업무에 AI를 활용하고 있으며, 이에 따라 주당 평균 5.4%의 업무 시간이 줄었다. 프로젝트 관리에서도 일정 조율, 진행 상황 모니터링, 위험 알림 등을 이미 AI가 챙기고 있다.
가장 큰 변화는 서비스업에서 일어나고 있다. 은행이나 통신사의 콜센터에서 가상 상담원이 24시간 실시간 응대를 하는 것이 대표적인 사례이다. IBM 보고서에 따르면, AI 상담원을 도입한 기업들은 고객 서비스 비용을 최대 30% 절감하면서도 응답 지연을 줄이는 성과를 보이고 있다.
또한 여행, 전자상거래, 의료 상담 등 고객 접점 영역에서 AI 에이전트 사용이 늘어나고 있다. AI 에이전트에게 고객의 과거 여행 이력과 관심사를 학습시켜 1:1 맞춤 여행 컨설턴트로 활용하고, 개인 쇼핑 도우미 에이전트가 상품 추천부터 주문까지 대행해주는 전자상거래 플랫폼이 대표적인 사례이다.
현재 AI 업계에는 여러 AI 에이전트를 연동해, 보다 복잡한 업무를 효율적으로 통제하는 이른바 ‘메타 에이전트(Meta Agent)’라는 개념마저 등장하고 있다. 미국 상장지수펀드(ETF) 운용사인 앰플리파이의 폴테터 CEO는 “2025년 말쯤이면 메타 에이전트가 등장하기 시작할 것”이라고 전망하기도 했다.
또한 에이전트 기반 서비스 플랫폼도 등장할 전망이다. 각종 전문 에이전트들을 모아두고, 사용자에게 온디맨드로 서비스를 제공하는 마켓플레이스로, 예를 들어 법률 자문 에이전트, 부동산 검색 에이전트, 건강 코치 에이전트 등을 호출해 사용할 수 있는 서비스를 가리킨다.
AI 에이전트의 부상은 일하는 방식뿐 아니라 일자리마저 개편할 가능성이 크다. 단기적으로는 일부 단순 사무직의 축소가 우려되는데, 반면 특별 상황 대응이나 감성적인 소통은 인간의 전문 영역이 될 가능성이 있다. 또 AI 트레이너, 프롬프트 엔지니어, AI 윤리 감사관 등 새로운 직무들이 속속 등장할 수 있다. 때문에 인류는 AI 에이전트 시대에 적극 대비할 필요가 있다. 특히 미래 세대는 주입식 교육을 버리고 AI를 활용한 문제해결 능력을 극대화해야 할지 모른다.
실리콘밸리의 구루로 불리는 기술철학자인 케빈 켈리는 “기술은 다른 생명 시스템과 마찬가지로 스스로를 확장하고 진화하기를 원한다”는 말을 남겼다. 켈리는 기술을 단순한 도구의 집합이 아닌, 인간이 만든 모든 기술과 시스템이 얽혀 하나의 생명체처럼 진화하는 거대한 생태계로 본 것이다. 갈수록 AI를 ‘잘 쓰는 법’을 넘어, 어떻게 하면 AI를 활용해 인간의 가치를 극대화하는지 고민하는 시대로 진입하는 것 같다.
구글 제미나이를 활용해 모니터 화면에 있는 코드를 분석하는 장면 © 구글