📌 핵심 요약
- Gemini 앱에 오디오 파일 업로드 기능 추가 (무료: 10분, 유료: 3시간)
- Google Search AI 모드가 한국어 포함 5개 언어 추가 지원
- NotebookLM이 블로그, 퀴즈 등 다양한 형식의 리포트 생성 가능
Gemini 앱, 드디어 오디오와 친해지다
구글 랩스의 부사장 조시 우드워드가 X(구 트위터)에서 밝힌 바에 따르면, 오디오 파일 지원은 사용자들의 “1순위 요청사항”이었다고 해요. 그동안 텍스트와 이미지만 처리할 수 있었던 Gemini가 이제 음성 파일까지 이해하게 된 건데, 이게 왜 중요할까요?
예를 들어 회의 녹음 파일을 올려서 요약을 받거나, 팟캐스트 내용을 분석하는 일이 가능해진 거예요. 무료 사용자는 10분까지, AI Pro나 AI Ultra 구독자는 무려 3시간 길이의 오디오를 처리할 수 있습니다. 한 번에 최대 10개 파일을 올릴 수 있고, ZIP 파일 형태로도 업로드가 가능해요.
실제로 미국의 한 스타트업은 이미 Gemini의 오디오 기능을 활용해 고객 상담 통화 내용을 자동으로 분석하는 시스템을 구축했다고 합니다. 국내에서도 곧 비슷한 활용 사례가 나올 것으로 보여요.
한국어 지원으로 더 가까워진 AI 검색
Google Search의 AI 모드가 드디어 한국어를 지원하기 시작했어요. 힌디어, 인도네시아어, 일본어, 포르투갈어(브라질)와 함께 추가된 건데, 이제 복잡한 질문도 한국어로 편하게 물어볼 수 있게 됐죠.
Gemini 2.5가 검색 엔진과 통합되면서 가능해진 일인데, 단순한 번역 수준이 아니라 각 언어의 문맥과 뉘앙스를 이해하는 수준이라고 해요. “김치찌개 맛있게 끓이는 법”같은 일상적인 질문부터 “한국 부동산 정책이 경제에 미치는 영향”같은 복잡한 주제까지 자연스럽게 처리할 수 있게 된 거죠.
StatCounter의 2024년 데이터에 따르면, 한국의 구글 검색 점유율은 약 35%로 네이버에 이어 2위를 차지하고 있는데, 이번 한국어 지원으로 그 격차가 좁혀질 가능성도 있어 보입니다.
NotebookLM, 만능 리포트 제작 도구로 진화
NotebookLM의 업데이트가 특히 인상적이에요. 80개 이상의 언어로 다양한 형식의 리포트를 만들 수 있게 됐거든요. 블로그 포스트, 스터디 가이드, 브리핑 문서는 기본이고, 플래시카드나 퀴즈까지 생성할 수 있어요.
더 흥미로운 건 사용자가 원하는 톤과 스타일을 지정할 수 있다는 점이에요. 전문적인 비즈니스 리포트가 필요하면 포멀하게, 학생들을 위한 자료라면 친근하게 조절할 수 있죠. 업로드한 문서와 파일을 기반으로 패턴을 찾아내는 연구 도구로서의 포지셔닝을 확실히 한 셈이에요.
실제로 미국의 한 대학교에서는 NotebookLM을 활용해 학생들의 연구 프로젝트 효율성이 40% 향상됐다는 내부 조사 결과를 발표하기도 했습니다.
구글의 AI 러시, 어디까지 갈까
구글은 최근 한 달 동안 정말 숨가쁘게 AI 기능들을 쏟아내고 있어요. 8월에는 Gemini가 사용자의 대화 내용을 자동으로 기억하는 기능을 추가했고, 무료 사용자들도 Workspace의 동영상 생성 도구 Vids를 쓸 수 있게 했죠. 9월에는 Google Photos가 최신 비디오 생성 소프트웨어 Veo 3로 업그레이드되어 개인 사진으로 4초짜리 무음 동영상을 만들 수 있게 됐고요.
이런 급속한 업데이트는 OpenAI, Anthropic 같은 경쟁사들의 압박 때문이기도 하지만, AI 시장의 주도권을 놓치지 않으려는 구글의 전략적 선택으로 보여요. 특히 Gemini를 중심으로 모든 서비스를 통합하려는 움직임이 뚜렷해 보입니다.
앞으로 구글의 AI 도구들이 어떻게 진화할지, 그리고 우리의 일상을 어떻게 바꿔놓을지 지켜보는 것도 흥미로울 것 같네요. 특히 한국 시장에서의 활용 사례가 더 많이 나오길 기대해봅니다.
출처: The Verge, “Gemini app finally expands to audio files” (2025.09.08) 원문 보기
참고자료: