영상 보기

비디오 제목

요약

유튜브 채널 “Google Cloud APAC”의 “AI Breakfast | Episode 4 - Agent로 일하는 시대가 이미 와버렸다 (Part 2)” 영상은 에이전트 기술의 발전과 구글의 관련 전략을 자세히 다루고 있다.

에이전트의 정의와 역할

  • 에이전트는 자율적이고 통합된 대규모 언어 모델(LLM)을 의미한다. 단순히 똑똑한 것을 넘어 실제 업무를 수행하는 ‘일하는 존재’로 진화하고 있으며, 실제 직원의 모습과 유사하게 발전하고 있다.

에이전트 작동에 필요한 기술적 기반 에이전트가 제대로 기능하기 위해서는 다음과 같은 기술적 토대가 필요하다:

  • 두뇌, 즉 LLM: 가장 중요한 부분은 LLM이다. 제미니 2.5(Gemini 2.5)와 같은 강력한 기반 모델이 여기에 해당하며, 이들은 ‘생각하는’ 모델로서 답변을 생성하기 전에 추론 과정을 거쳐 스스로 답을 설명할 수 있는 능력을 갖추고 있다. 제미니 2.5는 에이전트 벤치마크 리더보드에서 오랜 기간 1위를 유지하고 있으며, 에이전트의 가장 근본적인 기반이자 오케스트레이터 모델로서 단단히 자리 잡아야 한다.
  • 도구 사용 능력: 에이전트는 검색 기능이나 외부 예약 시스템 관리와 같은 도구를 활용할 수 있어야 한다. 다양한 사양과 접근 방식을 가진 시스템을 보다 보편적인 방식으로 다룰 수 있는 능력이 요구된다.
  • 정보 탐색 능력 (Grounding): 정보를 잘 찾아내는 능력이 에이전트에게는 매우 중요하다. 구글은 ‘Grounding with Google Search’ 개념을 통해 제미니가 구글 검색의 방대한 정보를 활용하여 실시간 정보나 기업/개인이 보유하지 않은 정보까지 찾아 종합적인 답변을 제공하도록 한다. 나아가 ‘Grounding with Maps’를 통해 구글 지도의 방대한 실제 세계 정보(리뷰 데이터, 사진 데이터 등)를 활용하여 좋은 평점을 받은 식당을 추천하는 등의 판단도 가능하게 준비하고 있다.
  • 다중 모드(Multimodality): 에이전트가 인간처럼 사고하고 판단하기 위해서는 세상을 인지할 수 있어야 하며, 이는 텍스트뿐만 아니라 시각, 청각 등 다양한 유형의 정보를 동시에 인지하고 처리하는 능력을 의미한다. 구글의 ‘프로젝트 아스트라(Project Astra)’는 정의된 LLM에 다중 모드와 구글 검색을 활용한 도구 사용 능력을 통합하여 시연한 사례이다.

최신 에이전트 트렌드

  • MCP (Model Card Protocol): 도구 사용과 관련하여 표준화가 시작되고 있다. MCP는 AI 애플리케이션과 외부 소스 및 도구 간의 연결을 표준화하는 공개 프로토콜이다. 이 프로토콜은 도구의 기능과 호출 규칙을 정의하여 LLM이 도구를 더 쉽게 이해하고 사용함으로써 오류 발생 가능성을 줄여준다. 앤트로픽(Anthropic)이 처음 제안했으며, 오픈AI(OpenAI)를 거쳐 구글 제미니도 MCP를 사용할 수 있다고 발표되었다.
  • A2A (Agent-to-Agent) 프로토콜: 멀티 에이전트 시대에 맞춰 구글이 발표한 기술로, 구글 클라우드 내의 에이전트뿐만 아니라 다른 벤더 플랫폼이나 프레임워크를 사용하는 에이전트 간에도 서로를 식별하고 직접 통신할 수 있도록 한다. 이는 하나의 에이전트가 할 수 있는 작업의 범위를 확장시켜주며, 나아가 사물 인터넷(IoT) 시대에는 가전제품들도 서로 연결되어 명령을 주고받을 수 있도록 할 예정이며, 이는 이미 일부 고객사와 논의 중이다.

구글 에이전트 전략의 핵심 플랫폼: Agent Space

  • Human-in-the-loop의 중요성: 에이전트의 자율성과 도구 사용 능력이 확장됨에 따라 인간의 감독과 관리가 매우 중요해진다. 에이전트가 특정 역할을 수행하기 전에 인간에게 선택지를 제시하고 허락을 구하는 Human-in-the-loop 개념이 안전장치로서 필수적이다.
  • Agent Space 출시: 기업 환경에서 에이전트 간의 상호 작용을 처리하고 에이전트 생태계를 효과적으로 활용할 수 있도록 구글이 출시한 플랫폼이다. 이는 구글이 수십 년 만에 처음으로 출시한 SaaS(Software as a Service) 제품이며, 에이전트와 함께 일하는 시대를 위한 엔터프라이즈 맞춤형 플랫폼이다.
  • 목표: 기업들이 평균 9개 이상의 애플리케이션과 수많은 데이터 소스를 사용하는 복잡한 환경에서 발생하는 어려움을 해결하기 위해 만들어졌다. Agent Space는 이러한 분리된 데이터 소스들을 연결하고 에이전트 간의 통신을 통해 통합 검색과 인사이트를 제공하여 업무 효율성을 높이는 것을 목표로 한다.
  • 주요 기능 및 특징:
    • 커넥터 제공: 다양한 데이터 소스를 연결하기 위한 약 150개의 커넥터가 이미 개발되어 있으며, 이를 통해 통합 검색과 자연어 질의응답이 가능하다.
    • 행동 기반 자동화: 단순히 정보를 찾는 것을 넘어, 에이전트가 자동으로 이메일을 보내거나, 메시지를 전송하거나, 이벤트를 예약하는 등 실제 업무를 수행할 수 있도록 한다.
    • 에이전트 갤러리 및 마켓플레이스: 구글이 미리 개발한 ‘Deep Research Agent’, ‘Data Science Agent’ 등 업무 기능별 에이전트들을 제공하며, 기업이 자체 에이전트를 구축하여 업로드하거나 마켓플레이스를 통해 다른 에이전트들을 찾아 사용할 수 있는 생태계를 조성한다.
    • 에이전트 제작 용이성: 코딩 지식이 없는 사람도 에이전트 목표와 사용 도구를 자연어로 작성하면 에이전트로 등록하고 실행할 수 있는 ‘Agent Designer’ 기능(노코드)이 포함되어 있다. 개발자를 위해서는 더 세밀한 작업을 위한 ‘Agent Development Kit(ADK)’도 제공되며, 이는 제미니뿐만 아니라 타사 LLM, 랭체인(LangChain)이나 크루AI(CrewAI) 같은 다양한 프레임워크와도 호환되는 오픈소스 기반이다. ADK로 개발된 에이전트는 ‘Agent Engine’에 배포된 후 Agent Space에 등록된다.
  • 대상: 현재 Agent Space는 기업을 위한 B2B 솔루션으로만 제공된다.

내 생각 정리

오늘 후반부의 내용은 정신이 번쩍 뜨이는 대목이었다.

첨단 기업의 ‘첨단’ 이란 말이 어떤 건지 새삼 깨달았다.

언론에서는 다양한 AI 관련된 소식을 빠르게 전한다고 하지만, 생각해보면 그러한 기술은 결국 엔드 유저의 관심을 사기 위한 것들이지, 실제 기업의 위치를 가르쳐주지는 않는 다는 내 나름의 오랜 깨달음을 알고 있었음에도 다시 한 번 뒤통수를 맞은 느낌이었다.

에이전트 플랫폼의 활성화, B2B 시장에만 열려 있는 Agent Space, 그리고 이를 준비하기 위한 ADK 와 노코드 툴.

세상의 AI의 등장과 흐름은 이미 시작된지 오래였고, 구글의 준비는 사실 언론이나, 커뮤니티의 정도를 이미 뛰어 넘었구나- 라는 생각을 했다.

백엔드 개발자이자, AI 개발자로 성장을 꿈꿔오고 있지만, 그런 것에 비하면 실제 비즈니스 시장과 구글과 같은 기업들이 어디까지 계획과 상황을 고려하고 있는지를 보면, 정말 침착하게, 대신 치열하게 준비해야 하는 것인지, 새삼 느낄 수 있었다.

이런 상황의 대처, 준비, 기업이 꿈꾸는 형태를 모르는데 어떻게 전문가가 될 수 있겠는가? 그리고 거기서도 핵심 기술로 보이는 ADK 와 같은 것들, 파이썬과 자바를 제대로 다시 공부하는게 필요하고, 그렇게 해서 ADK 적 방법론을 제대로 배워야 할 것이라 생각한다.

Human-in-the-loop 키워드를 비롯해서, adk, 플랫폼이 되는 언어 python 에 대한 키워드 등… 대응해야할 키워드가 보다 선명해지는 것이 느껴진다.