Google DeepMind, Gemini 2.5 공개: 더 똑똑하고 강력한 AI를 향한 중대한 도약
이 기사는 AI 번역본입니다. 오역이 의심되면 댓글로 알려 주세요.
Created on September 12|Last edited on September 12
Comment
Google DeepMind가 공식적으로 Gemini 2.5를 발표하며 AI 개발 여정의 새로운 장을 열었다. 이번 릴리스에는 현재까지 Gemini 시리즈에서 가장 지능적이고 성능이 뛰어난 모델인 실험적 버전의 Gemini 2.5 Pro가 포함된다. 이를 통해 DeepMind는 단순한 예측이나 분류를 넘어, 더 깊이 있게 추론하고 문제를 처리하도록 설계된 “사고하는 모델” 영역으로 한층 더 나아갔다. Gemini 2.5 Pro는 LMArena 리더보드 정상에 데뷔했으며, 이는 성능과 사용자 선호도 모두에서 강점을 입증하는 지표다.
사고하는 모델의 부상
Gemini 2.5는 사고하는 모델이라는 개념을 중심으로 설계되었다. 즉, 즉각적으로 반응하기보다 응답을 도출하기까지 시간을 들여 추론하는 AI다. 이 접근법은 정확도 향상, 더 미묘한 이해, 그리고 맥락에 대한 강한 파악을 뒷받침한다. DeepMind는 Gemini 2.0 Flash Thinking과 같은 초기 버전을 이 방향의 초기 단계로 언급하지만, Gemini 2.5는 이러한 추론 능력을 모델의 기반에 직접 내재화함으로써 한 단계 더 나아간다. 목표는 더 나은 판단력과 이해를 바탕으로 더 복잡한 문제를 해결할 수 있는 모델을 구축하는 것이다.
Gemini 2.5 Pro와 성능 벤치마크
2.5 Pro 모델은 수학, 코딩, 과학 전반의 벤치마크에서 두각을 나타내며 GPT-4.5와 Claude 3.7 Sonnet 같은 주요 모델을 능가한다. 성능 평가는 단순 시험 점수뿐 아니라 인간 선호도까지 반영되며, Gemini 2.5 Pro는 LMArena 벤치마크에서 뚜렷한 우위를 보였다. 현재 개발자는 Google AI Studio를 통해, 사용자는 Gemini 앱의 Gemini Advanced에서 이용할 수 있으며, 엔터프라이즈급 배포를 위한 Vertex AI 지원도 곧 제공될 예정이다.

추론과 문제 해결의 진전
Gemini 2.5 Pro는 추론 과제에서 뚜렷한 성능 향상을 보이고 있다. 다수결 투표와 같은 비용 높은 테스트 시점 강화 기법을 사용하지 않고도 GPQA와 AIME 2025 같은 벤치마크에서 선도적인 성적을 낸다. 특히 주목할 점은 Humanity’s Last Exam에서 18.8%를 기록했다는 것이다. 이 시험은 수백 명의 전문가가 인간 수준의 추론 한계를 평가하기 위해 설계한 것으로, 테스트 중 외부 도구에 의존하지 않는 모델 기준에서 새로운 최고 성과다. 이는 Gemini가 내부적으로 심도 있게 이해하고 해석하며 응답하는 능력을 갖추었다는 점을 보여준다.
코딩 역량과 에이전트형 응용 사례
Google는 Gemini 2.5 개발에서 코딩 성능을 최우선 과제로 삼았음을 분명히 밝혔다. 그 결과, 이 모델은 코드를 이해할 뿐 아니라 적극적으로 생성하고 변환하며, 최소한의 프롬프트로 실제 동작하는 애플리케이션까지 구축할 수 있다. SWE-Bench Verified 벤치마크에서 Gemini 2.5 Pro는 맞춤형 에이전트 구성으로 63.8%를 기록했다. 이는 단 한 줄의 지시만으로도 앱 빌드나 코드 디버깅 같은 다단계 작업을 자율적으로 수행할 수 있는 에이전트형 시스템 개발에 유리한 위치를 점했음을 의미한다.
멀티모달 강점과 긴 컨텍스트 윈도우
Gemini 2.5는 네이티브 멀티모달리티와 대규모 컨텍스트 윈도우에 대한 DeepMind의 집중을 이어간다. 초기 출시부터 100만 토큰 컨텍스트 윈도우를 제공하며, 곧 이를 두 배로 확대할 계획이다. 이는 모델이 텍스트, 코드, 이미지, 오디오, 비디오, 그리고 전체 리포지토리까지 아우르는 방대한 정보를 한 번에 처리해 복잡한 문제를 해결할 수 있음을 의미한다. 이러한 유연성은 컨텍스트 크기와 입력 다양성이 중요한 엔터프라이즈 및 연구용 애플리케이션에서 특히 핵심적이다.
출시 현황과 향후 계획
개발자는 오늘부터 Google AI Studio에서 Gemini 2.5 Pro를 바로 사용해 볼 수 있으며, Gemini Advanced 사용자도 앱에서 직접 접근할 수 있다. Google은 확장 사용과 프로덕션 수준 배포를 위한 가격 정책을 곧 발표할 예정이라고 밝혔다. DeepMind가 AI 도구를 계속 다듬어 가는 가운데, Gemini 2.5 Pro는 대규모 모델의 진화 방향을 보여 준다. 즉, 더 이전보다 훨씬 높은 역량으로 추론하고 적응하며, 여러 분야의 과제를 다룰 수 있는 시스템을 향해 나아가고 있다.
Gemini 2.0에서 2.5로의 빠른 도약은 DeepMind가 속도를 늦추지 않고 있음을 보여 준다. 이미 기저에 새로운 역량이 탑재되어 있고 추가 업데이트도 예정된 만큼, Gemini 시리즈는 앞으로도 Google의 AI 전략의 핵심으로 자리매김할 가능성이 크다.
Add a comment