いま読まれている記事

OpenAI、最新画像生成モデル『ChatGPT Images 2.0』を発表。思考能力による複雑なタスクの処理や、ウェブ検索、複数画像の同時生成が可能に。日本語テキストの描画精度も大幅に向上

article-thumbnail-260422w

4月22日、OpenAIは新しい画像生成モデルである「ChatGPT Images 2.0」を発表し、提供を開始した。

本モデルは詳細な指示への追従や正確なオブジェクト配置にくわえ、高密度なテキストのレンダリング性能が向上している。

「ChatGPT Images 2.0」は、同社の画像モデルとして初めて思考能力を備えており、ウェブ検索を通じたリアルタイム情報の取得や自己チェックが可能だ。

1つのプロンプトから一貫性のある複数の画像を生成することもでき、マンガのページやポスターの複数のバリエーションの制作などに対応している。

Openai、最新の画像生成モデル「ChatGPT Images 2.0」を発表_001
(画像はOpenAI公式サイトより)

公式サイトでは、多様な生成例とプロンプトが紹介されている。たとえば、「ブラウザ上のChatGPTでアスキーアートの犬を描かせる様子」といったUI画面や、「鉛筆で書かれた野球の歴史に関する手書きのエッセイ」を写真のように生成した例が挙げられている。

Openai、最新の画像生成モデル「ChatGPT Images 2.0」を発表_002
(画像はOpenAI公式サイトより)
Openai、最新の画像生成モデル「ChatGPT Images 2.0」を発表_003
(画像はOpenAI公式サイトより)

本モデルでは、日本語や韓国語といった非ラテン文字を自然に描画する機能も向上しており、「魔法の羽ペンを見つけるシーンを描いた、日本語のマンガのカラーページ」や、「タイポグラフィに関する多言語ポスター」などの例で、その実力が確認できる。

Openai、最新の画像生成モデル「ChatGPT Images 2.0」を発表_004
(画像はOpenAI公式サイトより)

そのほか、“曇りの日の海岸”や“夜の街角にいる友人”といった、不完全さや粒状感まで再現したリアルなスナップショットも公開されている。

本モデルはすべてのChatGPTおよびCodexユーザーが利用できるが、思考能力を用いた高度な出力機能は有料の「Plus」「Pro」および「Business」ユーザーに限定して提供される。

API経由では“gpt-image-2”として公開されており、開発中の製品に画像生成や編集機能を組み込むことも可能だ。

ライター
物心ついたころからFFとドラクエと共に育ち、The Elder Scrolls IV: オブリビオンで洋ゲーの沼にハマる。 ゲームのやりすぎでセミより長い地下生活を送っていたが、最近社会にリスポーンした。 ローグライクTCG「Slay the Spire」の有志翻訳者。
Twitter:@Gre_zzz

本ページはアフィリエイトプログラムによる収益を得ている場合がございます

新着記事

新着記事

ピックアップ

連載・特集一覧

カテゴリ

その他

若ゲのいたり

カテゴリーピックアップ

インタビュー

インタビューの記事一覧