最新グラフィックボードGeForce RTX 50シリーズの最新テクノロジーを紹介するメディア向けイベント「NVIDIA GeForce RTX 50 シリーズ APAC プレスツアー技術説明会」が、1月22日に赤坂インターシティコンファレンスで開催された。
当初は主にゲーマー向けのデバイスとして利用されてきたグラフィックボードだが、ブロックチェーンのマイニングやAIでの利用など、最近はその用途がどんどん広がってきている。そのため、PCを選ぶときに最も重視すべきパーツのひとつにもなった。
そうした中で同社から発表されたのが、NVIDIA GeForce RTX 50シリーズだ。今回の技術説明会では、このRTX 50シリーズにどんな技術が採用されているのか詳しく紹介された。
セッションは2部構成で行われており、休憩はさんでトータル3時間半以上にも及ぶ長丁場であったが、本記事ではそこからわかった特徴について注目のポイントをピックアップしてご紹介していく。
RTX 50シリーズはDLSS 4でフレームレートが大幅に改善された
セッション1の前半に登壇したのは、アジア太平洋地域担当テクニカルマーケティング ディレクターのJeff Yen(ジェフ イェン)氏だ。
同氏から説明が行われたのは、本イベントのメインともいえるGeForce RTX 50シリーズについてである。今回は、今年の頭に開催された「CES 2025」で発表されたものをさらに深掘りした内容となっていた。
これまでのフラグシップモデルであったRTX 4090は、ローンチ時の価格は1599ドルだった。それと比較して、同等の性能を持つRTX 5070は価格が549ドルに抑えられている。
このふたつのグラフィックボードの比較として、RTX 4090のDLSS 3を使った場合が494FPSで、RTX 5070のDLSS 4を使った場合が210FPSである。
RTX 50シリーズには、Blackwellなど先進的なアーキテクチャが多数採用されている。RTコアやTensorコア、ハードウェアのプロセッサなども刷新されている。
だが、単純にハードウェアが進化したというだけではなく、「RTX Neural Shaders」や「RTX Neural Faces」、「RTX Mega Geometry」、「DLSS 4」といった新しいRTXテクノロジーも合わせて発表されているのだ。
RTX 50シリーズのデスクトップファミリーには、GeForce RTX 5090、GeForce RTX 5080、GeForce RTX 5070 Ti、GeForce RTX 5070といったラインナップが用意されている。
その中でも基幹製品となるのが、RTX 5090だ。こちらでDLSS 4を使用することで、フレームレートを大幅に改善することができる。
より多くのフレームが表示できるようになるというだけではなく、レイテンシーも低く抑えることができるのが特徴である。こちらはひとつ下のモデルであるRTX 5080も同様だ。どちらもRTX 50シリーズに採用されたBlackwellの恩恵を最大限活用することができるのである。
RTX 5090とRTX 5080に関しては、熱設計の部分に関しても最新のものが採用されている。従来までは「Blower」や「Dual axial」という方式が採用されていた。
前世代のモデルからは、「Dual axial flow through」が採用されており、ファンからダイレクトに空気を送るシステムが採用されている。
今回のRTX 5090とRTX 5080には、「Double flow through」という新たな設計を採用。下記図の緑で描かれている部分がPCBになっており、ファンからダイレクトに空気が突き抜けていくような方式となっているといというわけだ。
それに加えてファンの音などノイズの発生も抑えられており、GPUの冷却効率も向上している。
RTX 50シリーズは、デスクトップ向けだけではなくラップトップ向けの製品もラインナップされている。また、性能面でもBlackwellアーキテクチャのメリットが得られるようなものとなっている。
性能面でいうと、RTX 4090と同等のパフォーマンスを発揮しながら、消費電力は半分に抑えることができるのだ。
またバッテリーの駆動時間も向上しており、40パーセント長く使用できるようになった。ウェブブラウジングや動画視聴など、ゲーム以外の用途での使用においても30パーセント長く使用することが可能だ。
このラップトップ向けのRTX 50シリーズは、各社メジャーなメーカーから搭載されたマシンが発売される予定である。
RTX 50シリーズを支える様々なAI技術
続いて、GeForce テクニカルマーケティング ディレクターのSean Cleveland(ショーン クリーブランド)氏が登壇し、RTX 50シリーズで採用された新しいテクノロジーの詳細について説明が行われた。
Sean氏から最初に紹介されたのが、RTX 50シリーズのニューラルレンダリングについてだ。今から25年前に、同社ではGeForceが導入された。その当時使われていたのが、プログラマブルシェーダーである。
その後20年の間に、ピクセルシェーダーからコンピュートシェーダー、レイトレーシングへと進化を続けてきた。
RTX 50シリーズのGPUには、Blackwellと共にニューラルレンダリングが採用されている。こちらは、小さなニューラルネットワークをプログラマブルシェーダーに入れた形になる。これにより、全く新しい世代のグラフィックスが可能になったのである。
これを実現するために、同社ではマイクロソフトと連携し「Cooperative Vectors」と呼ばれるAPIを作成。開発者がゲーム用のニューラルテクノロジーを開発することができるようになった。
そして、このテクノロジーにより、「RTX Neural Materials」など新たな技術が利用出来るようになったのだが、ここで活用されているのがAIだ。
「RTX Neural Materials」では、従来よりもVRAMの使用を1/7に抑えることができるようになった。また、シルクや陶器といった素材の質感も「RTX Neural Materials」ではAIを活用することでシャドーを圧縮し、よりリアルな表現ができるようになったのだ。
たとえば、大規模な映画では、複数のレイヤーで構成された複雑なマテリアルが使われている。金属の表面には埃や指紋による汚れが加えられているほか、シルクでは見る角度によってさまざまな色合いが加えられている。
従来まではこれらをリアルタイムで再現するのは非常に難しかったのだが、AIを活用することでシェーダーの圧縮を行い、実現している。
また、「RTX Neural Radiance Cache」により、真の意味での間接照明も実現している。
パフォーマンスが向上するだけではなく、シーン内での間接照明の良さも表現することが可能だ。光りのバウンスが多いときは、どのようにシーンが見えるのかニューラルネットワークが推定してくれる。これらはゲームプレイ中、常に稼働しており自己学習が行われている。
「RTX Skin」は、映画産業から拝借した技術だ。
たとえば、人の耳を例に挙げると、光りが通ることでいきいきとした表現になる。オリジナルのテクスチャーは肌が凸凹としておりシャドーがきつく入っているということもあって、肌がサンドペーパーのように荒れて見える。
だが、「RTX Skin」を活用することで、それらが消え、光りが肌の上に均一に広がっている。
人の顔を描くのは、グラフィックにとって非常に難しいことでもある。それは、人は現実との違いが認識できるからだ。
よくCGで作られた人の顔に違和感を覚えることを「不気味の谷 (uncanny valley) 」と呼ぶことがあるが、まさにそうした状態になってしまうのである。
そこで生成AIを活用した「RTX Neural Faces」を採用し、人の顔のクオリティを向上させている。インプットした素材を元に、リアルタイムで生成AIによって顔を推論し、学習モデルが最適化していくのだ。
過去30年間で、ゲームで使用されているジオメトリーのトライアングルの数は指数関数的に増えている。
Unreal Engine 5とジオメトリーシステムにより、開発者は何億ものトライアングルが使用できるようになるのだ。従来までのジオメトリーシステムでは、階層的なデータ構造を持つBVH(Bounding Volume Hierarchy)を構築する必要があった。しかし、特定のディテールを表示するためには、データの更新が必要になる。
だが、クラスターベースのシステムを導入して、多くのトライアングルを使うことになるとBVHのコストが上がってしまう。そこで導入されたのが、「RTX Mega Geometry」である。これにより、インテリジェントに圧縮が可能になったほか、複雑なジオメトリーのトレースも実現している。
スーパーコンピューターを24時間365日稼働し続けながらDLSSを改善
続いてDLSS 4とReflex 2について紹介が行われた。
リアルタイムでのグラフィック表示では、画質とスムーズさ、応答速度のバランスをとる必要がある。たとえば画質を4Kにすると、スムーズさと応答速度が犠牲になる。その一方で、画質をフルHDの1080pにすると、フレームレートと応答性が向上する。
従来のレンダリングで、この3つの要素をバランス良くするにはどうすればいいのだろうか? たとえば、10個のGPUを並列化するということも考えられる。そもそもこのリアルタイムのグラフィックでは、賢くレンダリングを行う必要がある。その理由は、かなりの重複性や冗長性があるからだ。
フレームからフレームへの変化は、人が認識できないレベルである。そこでAIを使い、冗長性を発見。実際の演算をせずに予測を行うことで、演算を節約することができる。これにより、3つの要素のトレードオフがうまくできるようになるのである。
DLSSは、信じられないほどのスピードで立ち上がってきた。現在は540以上のタイトルで利用可能になっている。昨年ローンチされた20タイトルのうち、15タイトルでDLSSを採用している。またRTXを使用している80パーセントがDLSSを使用しており、30億時間以上使われているという実績がある。
DLSSは、同社にとってこの6年間は学びの時間でもあった。NVIDIAでは最新のGPUを搭載したスーパーコンピューターを設置して24時間365日可動し続けており、こちらで日々DLSSの改善を行っているのである。
こうした改善は、新しいトレーニングデータを使い、常に実施されているのだ。そして、数百もあるゲームタイトルでDLSSがうまく実行できるように、様々な問題を解決を行っている。
AIのイメージを分類する技術は進化を遂げている。そこで使われているテクノロジーがCNN(Convolutional Neural Network)だ。CNNではデータをツリー状で分析していく。
これは演算処理の観点からも効率がよく、DLSS 2とDLSS 3で採用されていた。
そこからさらにエキサイティングな進化が起こった。それが「Transformer Model」と呼ばれるものだ。
こちらは、より汎用的な目的で設計が行われており、DLSS 4ではこの「Transformer Model」が採用されている。これにより学習中により多くの例を記憶することができるようになり、より大きなデータセットが扱えるようになったのである。
また、コンピューティングの観点からも効率が良くなるため、驚くようなレベルで計算力が上がっている。
レイトレーシングの品質を向上する「Ray Reconstruction」も、「Transformer Model」。とくに難しいライティングのシーンでは、この能力が発揮されるのである。
また、「Super Resolution」(スーパー解像度)にも「Transformer Model」が使われている。
DLSS 3のフレーム生成では、RTX 40シリーズの「Optical Flow Accel」などを活用してひとつのフレームを生成していた。
だが、これは複数のフレームを生成するときにコストパフォーマンスが悪くなるというデメリットがあった。それによりGPUの速度も制限され、フレームレートも下がってしまうのだ。
そこでBlackwellでは、DLSS 4の「マルチフレームジェネレーション」に最適化した形で設計が行われている。Tensorコアのスループットを強化し、ハードウェアのFlip Meteringテクノロジーも改善を行った。「AI-Management Processor」も導入している。
複数フレームを生成できるようにするために、DLSS 4では様々なテクノロジーを組み合わせており、1回だけレンダリングするだけでよくなるのである。これにより、速度が40パーセント向上。VRAMの使用料も30パーセント削減することができた。
このように、様々な効率改善が行われているのだが、GPUは数msという短い時間のなかでレンダリングされたフレームに対して、5つのAIモデルを実行していく必要がある。
こちらを実現するために、RTX 50シリーズでは第5世代のTensorコアを採用しており、AIの性能も2.5倍になった。
DLSS 4では、「マルチフレームジェネレーション」と「Super Resolution」、「Ray Reconstruction」などを活用することで、フレームレートも8倍に上がっている。ちなみに「フレームジェネレーション」から「マルチフレームジェネレーション」にアップデートした場合は、フレームレートは1.7倍になる。
その一方でレイテンシーは安定している。さらに重要なポイントとして、「Transformer Model」により反射などイメージの品質も向上しているのだ。
DLSSは、デイゼロの段階で75のゲームとアプリでサポートされている。こうしたタイトルは今後も増えていく予定だ。
ちなみに先ほどご紹介した「マルチフレームジェネレーション」は、RTX 50シリーズでのみサポートされている機能となっている。こちらは、TensorコアやBlackwellなどのテクノロジーに依存している部分が大きいからというのがその理由だ。
続いて、Reflex 2の紹介が行われた。
同社ではゲームにおける応答性が重要だと考えており、低遅延にも取り組んでいる。プレイヤーが体験する遅延を40パーセント低減。現在は主要タイトルのすべてに搭載されており、プレイヤーの10人中9人までがこの機能をONにしている。
FPSを良くするためには、常にGPUを稼働させておきたい。GPUが無限ならば最高のFPSが出せる。
このために、レンダーキューが作成される。GPUを忙しく可動させるためには、CPUが働かなければならない。しかし、CPU側の処理が間に合わなくなってしまうと、ゲームにも遅れが生じるのだ。
一方、Reflexはハードウェアとソフトウェアを組み合わせてCPUとGPUを正確に同期できるようにしている。これにより、CPUがGPUをフルに活動させるために先走る必要がなくなるのだ。こちらはレンダーキューの部分に「Just-in-time submission」と呼ばれる手法を使って実現している。
Reflex 2がPCゲームで使われるのはこれが初めてだ。ここで採用されているのが、「フレームワープ」と呼ばれるテクノロジーである。
こちらは直近のマウスポジションをサンプリングし、最新のマウスポジションに合わせるようにするというものだ。だが、この「フレームワープ」によりイメージ上に穴が空いてしまうという欠点も出てしまう。
同社では長年研究を行っており、新たな技術を開発してきているが、この穴が空いてしまうという問題に関しても色と深度データを前のフレームから取得し、開いてしまった部分を埋める技術を開発。これにより、ネイティブレンダリングのようにフレームを生成できるようにしているのだ。
さらには遅延も低減することができ、応答性も75パーセント改善された。このReflex 2は、『THE FINALS』と『VALORANT』というふたつのトップシューティングゲームで採用される。