しかし、パフォーマンスにはコストがかかる。
NvidiaのRTX Neural Texture Compression (NTC)がついにベンチマークされ、実際の3Dワークロードにおける同技術の能力が実証された。
Compusembleは、1440pおよび4K解像度のRTX 4090上でNvidiaの新しいメモリ圧縮技術をベンチマークし、従来のテクスチャ圧縮技術と比較して、NTCを使用することでメモリテクスチャサイズがなんと96%削減されることを明らかにしました。
結果は以下のビデオでご覧いただけます。
Compusembleは2つのモードでNTCをテストした: 「BCnにトランスコードされたNTC 「と 」サンプル上の推論 」です。
前者はロード時にテクスチャをBCnにトランスコードし、後者は特定のビューのレンダリングに必要な個々のテクセルだけを解凍し、テクスチャメモリサイズをさらに削減します。
DLSSアップスケーリングが有効な1440pの場合、「NTC transcoded to BCn 」モードはテストアプリケーションのテクスチャメモリフットプリントを272MBから98MBへと64%削減した。
しかし、「NTC inference on sample」モードでは、テクスチャサイズがわずか11.37MBと大幅に減少しました。
これは、非ニューラル圧縮と比較して95.8%、以前のニューラル圧縮モードと比較して88%のメモリ使用量の削減を意味します。
Compusembleのベンチマークでは、RTX Neural Texture Compressionを有効にすると、パフォーマンスが若干低下することが明らかになった。
しかし、ベンチマーク担当者はこのベータ版ソフトウェアを現行世代のRTX 5090ではなく、旧世代のRTX 4090で実行したため、新しいアーキテクチャではこうした性能低下が縮小する可能性がある。
「NTCをBCnにトランスコードする 」モードは、NTCオフと比較して平均FPSのごくわずかな減少を示したが、1%FPSの最低値は、NTCを無効にした通常のテクスチャ圧縮よりも明らかに優れていた。
「NTC inference on sample」モードは最も大きな打撃を受け、1,600 FPS台半ばから1,500 FPS台半ばになった。
1%の低域は840FPS台へと大幅に低下した。
メモリ容量の削減は、DLSSアップスケーリングの代わりにTAAアンチエイリアシングを使用した1440pでも同じですが、GPUの性能動作は異なります。
3つのモードはいずれもDLSSより大幅に高速で動作し、ほぼ2000FPSで動作した。
「NTC inference on sample」モードでの1%ローは1300FPS台半ばで動作し、840FPSから大きく飛躍した。
当然のことながら、解像度を4Kに上げるとパフォーマンスが大幅に低下する。
DLSSアップスケーリングを有効にした場合、「NTCからBCnへのトランスコード」モードでは平均1,100 FPS台、「NTCからサンプルへの推論」モードでは平均1,000 FPS弱となる。
両モードとも、1%の最低値は500FPS台だった。DLSSを無効にし、TAAアンチエイリアシングを使用したネイティブ解像度を選択した場合、「NTC transcoded to BCn」モードでは平均FPSが1,700FPS台に、「NTC inference on sample」モードでは平均FPSが1,500FPS台に向上した。
前者のNTCモードの1%最低値は1,100 FPS弱、後者の1%最低値は800 FPS弱だった。
解説:
RTX NTCでVRAMを節約。
RTX NTCとはGPU展開中のテクスチャを圧縮する技術のようです。
その効果はすさまじく、272MB使用のものをを11.37MBまで圧縮できますので、95.8%の節約ということになります。
かなり驚きの数字です。
しかし、残念ながら良いことばかりではなく、オーバーヘッドもかなり大きいようです。
平均FPSで計算すると9.91%、ほぼ1割のFPSが減少することになります。
使用されるAI処理はこれだけではありませんので、すべてを同時に使用するとかなりのオーバーヘッドということになります。
こういった技術は基本的に未来の技術で、普及には2-3世代はかかると思われます。
DLSSが最初に出たのはRTX2000シリーズでした。
出た当初は色々といわれていましたが、6年たった今ではあるのが当たり前です。
当時のフラッグシップ、RTX2080Tiのラスタライズ性能はRTX4070と同程度になっています。
近年ミドルレンジモデルの性能は伸びが鈍化していますので、RT2080Tiのラスタライズ性能とRTX**60と同じになるのに今しばらく時間が必要でしょう。
また、CPUの性能も当然必要になりますので、そういった意味でもミドルロー(RTX**60を基軸にした構成)のゲーミングPCで楽しむためにはそれなりの時間が必要になると思います。