5月20日、Googleは年次開発者会議「Google I/O 2026」にて、Geminiをはじめとした同社のAI技術に関する新たなロードマップを発表した。
今回の発表では、最先端の知能を備えた最新モデル「Gemini 3.5」や、多様な入力から映像を生成できる「Gemini Omni」、ユーザーのタスクを自律的にこなすAIエージェント「Gemini Spark」などが発表されている。
【#GoogleIO 2026 より速報 📣 】
— Google Japan (@googlejapan) May 19, 2026
進化した Gemini アプリの最新アップデートまとめ⬇️
🚀Gemini 3.5 Flash: 困難なタスクを効率的にこなす最高性能モデルで、圧倒的なスピードを提供
🎬 Gemini Omni: 新しい動画生成モデル Gemini Omni… pic.twitter.com/No1aNL8Ium
最新AIモデル「Gemini 3.5 Flash」
最新モデルシリーズの第一弾として提供が開始された「Gemini 3.5 Flash」は、AIエージェントの開発やコーディングにおいて高いパフォーマンスを持続的に発揮するモデルだ。これまでのFlashシリーズならではの圧倒的なスピードを維持しながら、複数の次元でフラッグシップモデルに匹敵する高度な知能を提供するという。
Gemini 3.5 新登場 ✨
— Google Japan (@googlejapan) May 19, 2026
第一弾として、困難なタスクを効率的にこなす最新モデル Gemini 3.5 Flash を #GoogleIO で発表
・圧倒的なスピード:Flash シリーズならではの超低レイテンシ
・エージェント機能とコーディング力:Gemini 3.1 Pro を凌駕
本日より、Gemini アプリや Google 検索の AI… pic.twitter.com/mPl80uGVIc
難解なコーディングのベンチマークである「Terminal-Bench 2.1」や、マルチモーダルな理解力を測る「CharXiv Reasoning」において、「Gemini 3.1 Pro」を凌駕するスコアを記録したという。
これまで数週間かかっていたような開発作業やデータ分析をわずかな時間で完了させられるようになり、コストも半分以下に抑えることが可能とのことだ。
「Gemini 3.5 Flash」は本日より「Gemini」アプリなどで無料で体験可能となっている。
動画の生成や会話による直感的な編集ができる「Gemini Omni」
新たなモデルファミリーとして発表された「Gemini Omni」は、テキストや画像、音声、動画などを自由に組み合わせて入力し、映像コンテンツを生成できる新モデルだ。
自然言語によるプロンプトのみで直感的に動画を編集でき、登場キャラクターの特徴や物理法則の一貫性を保ちながらシーンを再構築することが可能となっている。
Gemini Omni combines an intuitive understanding of physics with Gemini's real-world knowledge and reasoning. 🌐
— Google (@Google) May 19, 2026
Now, the stories and outputs you create won't just look photorealistic — they'll behave like the real world.#GoogleIO pic.twitter.com/030gOR4E1W
重力や流体力学といった物理法則に対する理解が向上しており、同社が持つ歴史や科学などの背景知識と組み合わせることで、単なる映像美を超えた論理的な物語の生成が可能になったとのことだ。
なお、生成されたすべての動画には電子透かし技術「SynthID」が埋め込まれ、コンテンツの透明性が担保されるという。
🎥 Google の新しい動画生成モデル Gemini Omni が本日より 日本を含めた世界各国で展開開始🚀
— Google Japan (@googlejapan) May 19, 2026
動画の作成と編集が、これまでにないほど自由で直感的に進化:
・テキスト、画像、動画クリップなど異なるフォーマットの素材を自由に組み合わせて動画を作成可能… pic.twitter.com/hUTYhwtOeo
同モデルの第一弾となる「Gemini Omni Flash」は、本日よりすべてのGoogle AI Plus、Pro、Ultraユーザーを対象に、「Gemini」アプリや「Google Flow」を通じて順次提供を開始。
さらに、今週からは「YouTube Shorts」や「YouTube Create」アプリのユーザーにも無料で順次提供されるほか、数週間以内にはAPIを通じてデベロッパーや企業向けにも提供されるとのことだ。
24時間タスクをこなすAIエージェント「Gemini Spark」
また、ユーザーのデジタルライフを24時間体制でサポートするパーソナルAIエージェント「Gemini Spark」が登場した。PCやスマートフォンを閉じた状態でもクラウドベースでバックグラウンド稼働し、日常的な情報の整理やワークフローの作成といった複雑な処理を代行してくれる。
Introducing Gemini Spark ✨
— Google (@Google) May 19, 2026
It’s your 24/7 personal AI agent that helps you navigate your digital life, taking action on your behalf, and under your direction.
🧠 It runs on Gemini 3.5 and is built on @Antigravity, so it can perform long-running tasks easily in the background.… pic.twitter.com/NX9CCMBGPT
「Gmail」や「Google ドキュメント」などのツールと深く連携し、クレジットカード明細からのサブスクリプション契約の特定や、特定のメールを要約したダイジェストの自動送信、会議のメモを統合してGoogle ドキュメントを作成するといった活用が可能だ。
Geminiを搭載した新型オーディオグラスが今秋発売予定
くわえて、Android XRプラットフォームの新たな展開として、Geminiを搭載したスマートグラス「Intelligent eyewear」の情報も明かされた。
本製品には音声でサポートを提供するオーディオグラスと、必要な情報を視覚的に表示するディスプレイグラスの2種類が存在し、まずはオーディオグラスが今秋に発売される。
We’re partnering with @Samsung, @_GentleMonster_ and @WarbyParker on new intelligent eyewear.
— Google (@Google) May 19, 2026
Here's a sneak peek at two designs from this fall's upcoming collections.#GoogleIO pic.twitter.com/f10T1qATxJ
オーディオグラスはSamsungやアイウェアブランドのGentle Monster、Warby Parkerとの提携により、日常的に着用しやすいスタイリッシュなデザインを実現しているという。フレームの側面をタップするか「Hey Google」と話しかけることで、即座にGeminiへアクセスできる。
機能面においては、視界に入った看板の翻訳やレストランのレビュー確認、現在地に基づいたナビゲーションなどが利用可能となっている。また、高品質な写真や動画を瞬時に撮影し、AIを用いて背景の不要な要素を削除するといった編集も音声コマンドのみで行えるようだ。
そのほかにも、話者の声のトーンやピッチに合わせたリアルタイム翻訳機能や、バックグラウンドでの複数ステップのタスク処理にも対応している。本デバイスはAndroidおよびiOSのスマートフォンとペアリング可能となっており、数カ月以内にさらなる詳細が明かされるとのことだ。
このほかにも、パーソナライズされた1日のタスクリストをGeminiが自動生成する「Daily Brief」や、ショッピングをサポートする「Universal Cart」など多数の新機能が発表されている。詳細については、Googleが公開している「Google I/O 2026」の発表まとめページなどを確認してほしい。
