DeepSeekが新しいAIモデルを発表した後、Googleは3月25日にGemini 2.5を発表し、ショーを奪いました。グーグルはこれを「最も賢いモデル」と呼んでいます。これは "Gemini 2.5 Proの実験版 "とのこと。様々なベンチマークでリードしており、発売時にはLMArenaで大差をつけて1位を獲得しました。"
Gemini 2.5は、GoogleのGemini AIファミリーの一部です。推論能力を強化し、2024年12月に発表されたジェミニ2.0フラッシュシンキングをベースにしています。Gemini 2.5 Proは、Humanity's Last Exam(HLE)において、OpenAIのo3-miniとAnthropicのClaude 3.7 Sonnetを上回りました。この新しいテストは、"ベンチマークの飽和 "を修正することを目的としています。これは、AIのモデルが急速に進歩し、現在のテストが簡単すぎる場合に起こります。HLEで18.8%のスコアを達成したGemini 2.5は、o3-miniの14%(テキストベースの入力のみを評価)とClaude 3.7 Sonnetの8.9%を上回りました。
Gemini 2.5は、現在チャットボットアリーナランキングのトップにいます。科学、数学、コーディングのテストで素晴らしい結果を示しています。他のモデルを僅差ではありますが、明確に上回っています。AIの進歩の速さを考えれば、これは驚くべきことではありません。グーグルによると、新しいGemini 2.5 Proは、推論、マルチモーダル処理、エージェントベースのインタラクションにおいて大きな進歩を示しています。ユーザーの入力が少なくてもうまく機能します。
こちらもお読みください: セールスフォース、Tableau PulseとTableau Agentの日本語サポートを開始
Gemini 2.5 Proは、100万トークンのコンテキストウィンドウを提供するようになりました。3月25日現在、Google AI StudioおよびGeminiアプリを通じてGemini Advancedユーザーに提供されています。まもなくVertex AIでも利用可能になります。 グーグル はまた、今後数週間のうちに価格の詳細を発表する予定であることも示唆しています。