いま読まれている記事

Google、最新AIモデル「Gemini 3.5 Flash」や動画生成AI「Gemini Omni」、AIエージェント「Gemini Spark」など多数の新機能を発表。今秋にはGemini搭載のオーディオグラスも発売予定

article-thumbnail-260520d

5月20日、Googleは年次開発者会議「Google I/O 2026」にて、Geminiをはじめとした同社のAI技術に関する新たなロードマップを発表した。

今回の発表では、最先端の知能を備えた最新モデル「Gemini 3.5」や、多様な入力から映像を生成できる「Gemini Omni」、ユーザーのタスクを自律的にこなすAIエージェント「Gemini Spark」などが発表されている。

最新AIモデル「Gemini 3.5 Flash」

最新モデルシリーズの第一弾として提供が開始された「Gemini 3.5 Flash」は、AIエージェントの開発やコーディングにおいて高いパフォーマンスを持続的に発揮するモデルだ。これまでのFlashシリーズならではの圧倒的なスピードを維持しながら、複数の次元でフラッグシップモデルに匹敵する高度な知能を提供するという。

難解なコーディングのベンチマークである「Terminal-Bench 2.1」や、マルチモーダルな理解力を測る「CharXiv Reasoning」において、「Gemini 3.1 Pro」を凌駕するスコアを記録したという。

これまで数週間かかっていたような開発作業やデータ分析をわずかな時間で完了させられるようになり、コストも半分以下に抑えることが可能とのことだ。

「Gemini 3.5 Flash」は本日より「Gemini」アプリなどで無料で体験可能となっている。

動画の生成や会話による直感的な編集ができる「Gemini Omni」

新たなモデルファミリーとして発表された「Gemini Omni」は、テキストや画像、音声、動画などを自由に組み合わせて入力し、映像コンテンツを生成できる新モデルだ。

自然言語によるプロンプトのみで直感的に動画を編集でき、登場キャラクターの特徴や物理法則の一貫性を保ちながらシーンを再構築することが可能となっている。

重力や流体力学といった物理法則に対する理解が向上しており、同社が持つ歴史や科学などの背景知識と組み合わせることで、単なる映像美を超えた論理的な物語の生成が可能になったとのことだ。

なお、生成されたすべての動画には電子透かし技術「SynthID」が埋め込まれ、コンテンツの透明性が担保されるという。

同モデルの第一弾となる「Gemini Omni Flash」は、本日よりすべてのGoogle AI Plus、Pro、Ultraユーザーを対象に、「Gemini」アプリや「Google Flow」を通じて順次提供を開始。

さらに、今週からは「YouTube Shorts」や「YouTube Create」アプリのユーザーにも無料で順次提供されるほか、数週間以内にはAPIを通じてデベロッパーや企業向けにも提供されるとのことだ。

24時間タスクをこなすAIエージェント「Gemini Spark」

また、ユーザーのデジタルライフを24時間体制でサポートするパーソナルAIエージェント「Gemini Spark」が登場した。PCやスマートフォンを閉じた状態でもクラウドベースでバックグラウンド稼働し、日常的な情報の整理やワークフローの作成といった複雑な処理を代行してくれる。

「Gmail」や「Google ドキュメント」などのツールと深く連携し、クレジットカード明細からのサブスクリプション契約の特定や、特定のメールを要約したダイジェストの自動送信、会議のメモを統合してGoogle ドキュメントを作成するといった活用が可能だ。

Geminiを搭載した新型オーディオグラスが今秋発売予定

くわえて、Android XRプラットフォームの新たな展開として、Geminiを搭載したスマートグラス「Intelligent eyewear」の情報も明かされた。

本製品には音声でサポートを提供するオーディオグラスと、必要な情報を視覚的に表示するディスプレイグラスの2種類が存在し、まずはオーディオグラスが今秋に発売される。

オーディオグラスはSamsungやアイウェアブランドのGentle Monster、Warby Parkerとの提携により、日常的に着用しやすいスタイリッシュなデザインを実現しているという。フレームの側面をタップするか「Hey Google」と話しかけることで、即座にGeminiへアクセスできる。

機能面においては、視界に入った看板の翻訳やレストランのレビュー確認、現在地に基づいたナビゲーションなどが利用可能となっている。また、高品質な写真や動画を瞬時に撮影し、AIを用いて背景の不要な要素を削除するといった編集も音声コマンドのみで行えるようだ。

そのほかにも、話者の声のトーンやピッチに合わせたリアルタイム翻訳機能や、バックグラウンドでの複数ステップのタスク処理にも対応している。本デバイスはAndroidおよびiOSのスマートフォンとペアリング可能となっており、数カ月以内にさらなる詳細が明かされるとのことだ。

このほかにも、パーソナライズされた1日のタスクリストをGeminiが自動生成する「Daily Brief」や、ショッピングをサポートする「Universal Cart」など多数の新機能が発表されている。詳細については、Googleが公開している「Google I/O 2026」の発表まとめページなどを確認してほしい。

ライター
物心ついたころからFFとドラクエと共に育ち、The Elder Scrolls IV: オブリビオンで洋ゲーの沼にハマる。 ゲームのやりすぎでセミより長い地下生活を送っていたが、最近社会にリスポーンした。 ローグライクTCG「Slay the Spire」の有志翻訳者。
Twitter:@Gre_zzz

この記事に関するタグ

本ページはアフィリエイトプログラムによる収益を得ている場合がございます

新着記事

新着記事

ピックアップ

連載・特集一覧

カテゴリ

その他

若ゲのいたり

カテゴリーピックアップ