現地時間3月21日、ビル・ゲイツ氏は自身のブログで「AIの時代が始まった」と題したブログ記事を投稿し、人工知能が携帯電話やインターネットと同じくらい革命的であると伝えた。
その中でゲイツ氏はこれまでの人生で革新的だと感じたテクノロジーのデモをふたつ挙げ、ひとつはWindowsの先駆者であったグラフィカル ユーザー インターフェイスの存在、そしてもうひとつは昨年テストで見た「GPT」だと記述した。
さらにAIが今後マイクロプロセッサやパーソナルコンピューター、インターネット、携帯電話と肩を並べて開発され、人々の働き方や学び方、旅行、健康管理、コミュニケーションの方法を変えると主張。リスクについても併記しつつ、AIが次のフロンティアになるだろうと続けている。
このブログ記事が投稿される少し前、同日3月21日、Adobe、Google、Microsoft、NVIDIAが対話AIや画像生成AIといった「ジェネレーティブAI」(生成AI)の新サービスやプラットフォームを発表、あるいは提供を開始した。OpenAIの対話AI「Chat GPT」や画像生成AI「Midjourney」が国内外でここ数ヶ月注目を集め、開発者や各社がすでにさまざまな展開を以前より進めていた中、技術カンファレンス「GTC」開催にあわせ同分野で一挙に動きがあった1日となった。
※「Adobe Firefly」の公式ムービー
Adobeは同社のツールやサービスに搭載するジェネレーティブAI「Adobe Firefly」(サイトリンク)を発表。ユーザーの言葉によって「画像や音声、ベクター、ビデオ、3Dから、ブラシ、カラーグラデーション、動画変換」などを思い通りかつこれまで以上に簡単でスピーディに生成できるようになると伝えている。今回公表されたプライベートベータ版は初代モデルで、テキストによる高品質の画像生成機能とテキストエフェクトを提供している。
また最大の特徴はAIのトレーニング方法。かねてより画像生成AIでは実在するクリエイターの画像や作品を無許可で学習させる行為が議論の的となっていたが、「Adobe Firefly」はAdobeが提供するライセンス済み画像、あるいはオープンライセンスやパブリック・ドメインライセンス画像で学習していく。また、クリエイター向けには学習に使用されたくない作品に付けられる「Do Not Train」タグが導入される。
ユーザーが個別に「Adobe Firefly」を教育し独自のスタイルを持つAIに成長させることもできるようになる予定で、ここでは自身の作品だけでなく他のユーザーが提供するストック素材も利用可能になる。このストック素材の提供で収益が発生するような仕組みもベータ終了後に組み込んでいくという。
Googleは2023年2月に発表した対話AIの「Bard」(サイトリンク)の提供を米国と英国で開始した。対話型AI言語モデル「LaMDA」の軽量で最適化されたバージョンを利用。テキストを入力して「今年より多くの本を読むためのヒント」を回答してもらう、「量子力学」を簡単に説明してもらうなど、AIと対話できる。
「Bird」は単純な対話AIとしてだけでなく、Google検索を補完するサービスとしても活用されるという。簡単に検索にアクセスして応答を得たり、Web全体でのソース検索ができるように設計されていおり、たとえば検索クエリ候補を新しいタブに表示し関連結果をワンクリックで深く調べられる「Google it」ボタンが実装されている。
なおGoogleは、現実世界の偏見や固定概念、また虚偽の情報を「Bard」が伝える可能性が現時点ではあるとしている。その解決策のひとつとして、「Bard」はほとんどの場合においてひとつの質問に対し複数の回答(ドラフト)を答える設計になっており、ユーザーは最適な回答を対話の基点として選択することができると説明した。
「Bard」は現時点で日本からは利用できないが、今後ほかの国でも順次提供していく予定だという。
We're expanding access to Bard in US + UK with more countries ahead, it's an early experiment that lets you collaborate with generative AI. Hope Bard sparks more creativity and curiosity, and will get better with feedback. Sign up: https://t.co/C1ibWrqTDr https://t.co/N8Dzx1m0fc
— Sundar Pichai (@sundarpichai) March 21, 2023
※「Bard」の提供開始をアナウンスするGoogleのCEO、Sundar Pichai氏
Microsoftがプレビュー提供を開始したのは画像生成AI「Bing Image Creator」(サイトリンク)。同社のパートナー「OpenAI」の「DALL∙E モデル」の高度なバージョンを利用。こちらは一般的な画像生成AIと同様に、テキストでの命令文を受けアートスタイルを選択することで画像を生成する。
特徴的なのは同社の検索エンジン「Bing」やWebブラウザの「Edge」ですでに提供が開始されている対話AIチャットの新機能として組み込まれてもいる点で、ユーザーはテキストと画像を一箇所でAIに生成させることが可能となっている。同社は発表で「Edge」がAI画像生成機能を備えた最初で唯一のブラウザになるとアピールした。
なお生成される画像は有害なものは制限されるほか、AIが生み出した画像であることを明確にするために左下に「Bing」のロゴが挿入されるという。
Today we announced Bing Image Creator in chat and more. Read all the details here: https://t.co/GWpicVFOl1 pic.twitter.com/vKxiwnTv5R
— Bing (@bing) March 21, 2023
※「Bing Image Creator」を発表する「Bing」の公式Twitterアカウント。
「GTC」のホストでもあるNVIDIAは基調講演にてさまざまな発表をしたが、その中でもひときわ目立ったのがスーパーコンピューター「NVIDIA DGX Cloud」を活用した「NVIDIA AI Foundations」(サイトリンク)。
これは「Oracle Cloud Infrastructer」などのクラウドサービスプロパイダと提携して展開されるもので、発表によれば今後は「Microsoft Azure」や「Google Cloud」でも展開予定だという。テキスト生成の「NVIDIA NeMo」、ビジュアルコンテンツの「NVIDIA Picasso」、生物学の分野で使える「NVIDIA BioNeMo」。これらの生成AIによるアプローチをより容易に提供するためのクラウドサービスとなる。
この78分の基調講演において同社のCEOジェンスン・フアン氏はAIが変革する未来を伝え、その中で「AIにおけるiPhoneの瞬間に我々はいる」ともコメントしている。
※NVIDIAのCEOによる「GTC 2023」基調講演の映像