いま読まれている記事

Google、最新AIモデル「Gemini 3」発表。推論能力が強化され、画像や音声などのマルチモーダル処理能力も向上。ユーザーの利用状況に応じてUIを最適化する新機能「生成インターフェース」が新たに導入

article-thumbnail-251119q

Googleは11月19日、AIアシスタントのGeminiアプリにおいて、最新モデルとなる「Gemini 3」を発表した。

今回のアップデートでは、モデルの推論能力の強化に加え、ユーザーの利用状況に応じてインターフェースを最適化する新機能「生成インターフェース」や、より複雑なタスクを自律的に遂行するためのエージェント機能「Gemini Agent」などが導入されている。

新モデルであるGemini 3 Proは、モデル選択から「Thinking」を選ぶことで、本日よりすべてのユーザーが利用可能だ。 今回のアップデートではAIモデルの基本性能向上のみならず、アプリ全体の体験を刷新。より実用的で整理された応答が可能となったほか、マルチモーダル機能やコーディング支援機能においても大幅な進化を遂げている。

Google、最新AIモデル「Gemini 3」発表_001
(画像はGoogleの公式ブログより。Gemini 3 Proを含む複数モデルにおけるベンチマークの比較)

機能面では、Gemini 3はこれまでで最も高性能なコーディングモデルを搭載。Canvas機能を用いたアプリ構築が多機能化したほか、画像や音声などのマルチモーダル処理能力も向上している。

また、アプリのデザインも刷新され、作成した成果物を管理するフォルダ機能の追加や、Googleのショッピンググラフを活用した商品情報の表示機能も強化された。なおショッピング機能の日本での提供は現時点では未定だ。

特筆すべき点は「生成インターフェース」と呼ばれる新たな試みである。これはユーザーの入力内容に合わせて、モデル自身が瞬時に最適なインターフェースを生成する機能だ。

例えば、旅行プランを尋ねると写真や操作可能なモジュールを含む雑誌のようなレイアウトを表示する「ビジュアルレイアウト」や、特定のトピックに対してインタラクティブなUIをリアルタイムでコーディングして表示する「動的ビュー」などが提供される。これらにより、静的なテキスト情報の枠を超えた応答が可能となる。

さらに、複数の手順を要するタスクを処理する「Gemini Agent」も発表された。これはGoogleのアプリ群と連携し、カレンダー管理やメールの整理、さらにはメール情報をもとにした旅行の手配などを自律的に行う実験的な機能である。ユーザーはAIの重要なアクションに対して承認を行うことで操作を管理できる仕組みだ。

「Gemini Agent」は、現時点では米国のGoogle AI Ultraサブスクリプションユーザー向けの提供となり、日本での展開については未定となっている。

ライター
物心ついたころからFFとドラクエと共に育ち、The Elder Scrolls IV: オブリビオンで洋ゲーの沼にハマる。 ゲームのやりすぎでセミより長い地下生活を送っていたが、最近社会にリスポーンした。 ローグライクTCG「Slay the Spire」の有志翻訳者。
Twitter:@Gre_zzz

この記事に関するタグ

本ページはアフィリエイトプログラムによる収益を得ている場合がございます

新着記事

新着記事

ピックアップ

連載・特集一覧

カテゴリ

その他

若ゲのいたり

カテゴリーピックアップ