영상 보기
요약
인공지능의 기본적인 개념, 대중화 과정, 사람처럼 대화하는 AI의 특성, 미래 트렌드, 그리고 구글의 AI 전략에 대한 내용들.
- 인공지능의 정의: 구글의 관점에서 인공지능은 우리의 시간과 노력을 절감시켜주는 생산성 도구이며, 인류의 문제를 해결하고 개인, 조직, 공공 단체가 창의적인 결과를 얻도록 돕는 도구로 기대한다.
- AI의 대중화 시점: 일반 대중이 AI를 처음 접하기 시작한 계기는 2016년 알파고(AlphaGo)가 이세돌과의 바둑 대국을 펼쳤을 때이며, 업계에서는 STT(음성을 텍스트로)와 TTS(텍스트를 음성으로) 기술의 발전, 그리고 거대 생성형 AI 모델들이 채팅 형태로 출시되면서 대중화가 확실히 각인되었다고 평가되고 있다.
- AI가 사람처럼 대화하는 가장 큰 변화: 현재 AI 모델들은 사람의 행동 패턴과 방대한 텍스트 데이터를 학습하고 흉내 내는 것에 머무르고 있다. AI가 사람처럼 대화하는 것처럼 느껴지는 것은 패턴 분석과 학습을 통한 답변 구조 때문이다. AI는 아직 사람의 미세한 뉘앙스, 톤, 심리 상태와 같은 비텍스트 요소를 완벽하게 ‘이해’ 및 ‘판단’ 한 것은 아님
- 멀티모달리티(Multimodality): 구글의 제미나이(Gemini)는 처음 설계될 때부터 텍스트뿐만 아니라 소리, 음성, 영상, 이미지 등 인류가 만들어낸 다양한 미디어를 입력받아 해석할 수 있는 멀티모달리티를 지향 이는 궁극적으로 인공 일반 지능(AGI)에 도달하기 위해 필수적인 요소로 간주함.
- 미래 AI 트렌드 (10년 후): 앞으로의 AI는 ‘에이전트(Agent)’ 시대로 접어들 것으로 예상. 에이전트는 LLM을 적용하여 다양한 업무를 자동화하고 수행하며, 개인부터 기업까지 모든 사람이 활용하는 형태로 발전할 것이다. 딥마인드의 목표인 AGI는 10년 뒤쯤이면 인류의 난제를 해결하고 삶에 긍정적인 변화를 가져올 것으로 기대하고 있다. 이미 알파폴드(AlphaFold)와 같은 AI는 특정 문제 해결 능력에서 사람을 능가하는 ‘슈퍼 휴먼’ 수준에 도달했다.
- AI 산업 주도 플레이어 및 전략: 구글(Google), 오픈AI(OpenAI), 앤트로픽(Anthropic), 딥시크(DeepSeek), 메타(Meta)의 라마(Llama) 등이 주요 플레이어이자 AI 리더 플랫폼이다. 구글은 특히 ‘책임감 있는 AI(Responsibility AI)’를 슬로건으로 삼아, 속도나 성능보다는 안전성을 최우선으로 여긴다. 이는 사용자에게 잘못된 정보를 주거나 혼란을 야기하지 않기 위함이다.
- 구글의 제미나이 생태계 확장 전략: 구글은 명확한 ‘AI 엔진’을 가지고 있다. 딥마인드와 같은 R&D 조직에서 AI 모델을 연구하고 개발한 후, 유튜브, 구글 지도, 지메일 등 10억 명 이상의 사용자가 있는 자체 제품에 먼저 AI 모델을 적용하여 확장성과 사용자 피드백을 검증하고 있다. 이후 준비가 되면 오픈소스로 제공하고, 기업 고객을 위해 구글 클라우드(Google Cloud) 제품을 통해 기술을 제공하는 일련의 과정을 거친다.
- AI가 생산성에 미치는 영향: AI는 업무 현장에서 없어서는 안 될 필수적인 도구가 되었으며, 구글 워크스페이스(Workspace)에 제미나이가 탑재되어 업무를 원활하게 수행할 수 있도록 돕는다. 특히 노트북LM(NotebookLM)은 학계에서 논문 요약 등 연구의 사전 단계를 단축시켜주는 데 크게 활용되고 있다
- 생성형 AI 활용 격차와 한계: AI 활용 격차는 주로 프롬프트 엔지니어링(Prompt Engineering)에서 비롯되지만, 더 중요한 것은 AI가 생성한 결과물을 사용자가 직접 필터링하고 검증할 수 있는 능력(배경지식)이다.
- AI 환각 증상(Hallucination): 환각은 AI의 패턴 분석 및 학습 과정에서 발생하는 자연스러운 현상으로, 뇌의 예측적 인지 과정과 유사. 특히 2017년 구글에서 발표한 트랜스포머(Transformer) 모델 기반의 LLM은 단어를 숫자로 변환하여 연관 관계를 파악하기 때문에, 언어를 직접 이해하는 것은 근본적으로 아니다. 이러한 태생적 한계로 인해 환각이 발생할 수밖에 없다.
- 환각 증상 극복 노력:
- 더 많은 데이터 학습: 모델에 더 많은 데이터를 학습시켜 환각 발생 확률을 줄인다.
- 인간의 지도: 개발자가 거버넌스 모델을 통해 잘못된 답변을 방지하는 구조를 제공한다.
- 그라운딩(Grounding) 기술: 구글은 ‘구글 검색(Google Search)을 통한 그라운딩’ 기술을 통해 제미나이가 실시간 정보를 활용하여 답변의 정확성을 높였다. 향후 구글 지도 및 유튜브 데이터까지 그라운딩에 활용될 예정이다. 답변에 출처(Citation)를 필수로 명시하여 사용자가 신뢰성을 판단할 수 있도록 돕는다.
내 생각 정리
요 최근의 AI 상황, 그 와중에서 아주 개론적인 내용들이 핵심이 된다고 보였다. 그리고 어디까지나 구글의 강점, 구글이 이번 2025 행사 이후에 상황에 대한 아주 간략한 정리라고 할까?
확실한 것은 구글이 말한 것 처럼, 2016년부터 준비하던 그들이기에, 이제는 속도는 빠르게 가야 하기에 달려가고 서두르겠지만, 동시에 기존부터 준비하던 든든한 하부가 드디어 결실을 맺는 단계가 되었다는 생각이 들었다.
제미나이만 보더라도 그렇다. 현재 사용하는 과정에서 얻은 제일 큰 핵심은 가성비, 그리고 AI 개발을 위한 하드웨어와 소프트웨어의 대응, 그리고 결정적으로 할루시네이션의 정도를 보면, 1편의 이야기처럼 구글은 다른 곳들에 비하면 월등한 플랫폼 AI 모델로서의 성능을 보여준다.
또한 계속 배우고 싶어했던 부분도 구글의 AI 관련 기능들, GCP와 통합된 서비스들이, 아직 불완정할지는 모르지만 다른 곳에 비하면 확실히 박차를 가하고 있음을, 느낄 수 있는 부분이기에 AI에 대해서는 AWS 보다 Google을 우선시 해야 할지도 모르겠다.
또한 대담 과정에서 나온 신뢰에 대한 지속적인 강조 표현들을 보면, 여러 이유가 있지 않을까 싶다. 우선 가장은 AI 의 특성을 이해하는 많은 이들에게, AI 활용을 한다고 할 때 결국 ChatGPT와 같은 각인된 선발주자들에 비해 신뢰성이 부족하다는 인상, 그리고 AI 사용하면서 알게된 이 환각증상이나, 여러 점들, 생각해보면 1.5까지만 해도 아쉬웠던 부분들에 대한 ‘편견’을 깨야 하는게 구글의 핵심이라고 생각한게 아닐까?
사실 LLM 자체에 대해 생각해본다면 대단히 상품성에서 ‘미묘한’ 본질을 갖고 있다. 성능은 말해서 뭐해 수준인 것은 맞으나, 결국 같은 값을 지불하고 동일한 성능을 낸다. 이 영역에 대한 한계는 아직 갖고 있기 때문에, 그런 점을 어필하는 구글은 결국 LLM 의 본질적 한계를 어떻게 극복하고, 극복 후에 어떻게 ‘팔아야할 까’ 에 집중한 전략이 아닐까 생각하게 된다.