■事実
ReSTIRとパストレーシングの背景
ReSTIR(Reservoir-based Spatiotemporal Importance Resampling)は2020年にNVIDIAのベネディクト・ビッタリのチーム(Bitterli et al.)がSIGGRAPH論文で発表したアルゴリズムで近隣ピクセルや前フレームの光サンプルを再利用(時空間リサンプリング)することでPTの計算量を劇的に削減する手法です。
ReSTIRの派生研究はその後も続き、直接照明特化版(ReSTIR DI)・間接照明特化版(ReSTIR GI)・パストレーシング全般版(ReSTIR PT、2022年発表)へと発展してきました。
パストレーシング(PT)は光の物理的な振る舞い(反射・屈折・散乱など複数バウンス)を計算する最高品質のレンダリング手法で、レイトレーシング(RT)の上位版にあたります。
PTの課題は計算コストの高さで、最高峰のRTX 5090でもDLSS(Deep Learning Super Sampling)やフレームジェネレーションなしでは、Alan Wake 2、Cyberpunk 2077など、4K解像度のフルPTで60fpsを下回るタイトルが存在します。
Cyberpunk 2077の夜間シーンは多数の動的光源を扱うためReSTIR DIを採用しています。
今回の発表:ReSTIR PT Enhanced
NVIDIAは本技術を「Production Ready(実用化に近い)」と評価しているが、これは「アルゴリズムが製品に組み込める段階」を意味し、現時点でゲームに搭載されるという発表ではありません。
NVIDIAは研究論文「ReSTIR PT Enhanced: Algorithmic Advances for Faster and More Robust ReSTIR Path Tracing」を公開しました。(2026年4月時点)
改良版ReSTIR PTは、2022年に発表された従来のReSTIR PTベースラインと比較して平均2.74倍の高速化を達成しました。(4シーンの平均値)
すべての改善を適用した最終版では、画質向上(ノイズ低減など)とのトレードオフを含めても2.30倍の高速化を維持しています。
具体的な改善内容(5つの最適化)
直接照明と間接照明の統合:従来は別々に処理されていた直接光・間接光リザーバを単一のリザーバに統一し、パフォーマンスと品質の両方を改善します。
カラーノイズと非遮蔽ノイズの低減:既存技術を活用してノイズを追加削減します。
空間的再利用コストの半減:「相互近傍選択(reciprocal neighbor selection)」により空間リサンプリングのコストを約50%削減
シフトマッピングの改善:フットプリントベースの再接続基準(footprint-based reconnection criteria)を新たに導入し、シーン・マテリアルに応じて自動調整;誤った光サンプル再利用を減少させまする
相関アーティファクト低減:サンプル複製マップ(duplication maps)により時空間の相関を低減;ちらつきや残像ノイズを抑えます。
GPU最適化の数値結果
Warp Latency(ワープ待機時間):347,000サイクル → 241,000サイクル → 82,000サイクル(約76%削減)にします。
メモリ消費量:1920×1080解像度でピクセルあたりストレージを2×(88+16)バイトから2×64バイトに圧縮し、合計431MB→265MB(約38%削減)にします。
SM Warp Occupancy(GPUコアの有効稼働率):22.4% → 31.1%(低レベル最適化後)→ 34.9%(ロシアンルーレット適用後)にします。
Active Threads per Warp(ワープあたりの有効スレッド数):15.3 → 19.9 → 20.6にします。
GPU最適化結果まとめ表
| 最適化ステージ | SM Warp 占有率 | ワープあたり有効スレッド | Warp待機時間 | ベースラインとの速度比 |
|---|---|---|---|---|
| ベースライン(Lin et al. 2022) | 22.4% | 15.3 | 347k cycles | 1.0× |
| 低レベルGPU最適化(相互近傍選択など) | 31.1% | 19.9 | 241k cycles | 平均2.74× |
| +ロシアンルーレット適用 | 34.9% | 20.6 | 82k cycles | さらに改善 |
| 全改善適用(ノイズ低減込み) | — | — | — | 2.30× |
解説
今回の論文の本質はアルゴリズムの工夫であり、ハードウェアへの依存度が低い点が重要で、将来的にAMDやIntelのGPUでも利用できる実装パスがある。(ただし最大限の性能はRT専用コアの多いNVIDIA GPUで発揮される)
メモリ消費が431MB→265MBに減った点はGPUのVRAM事情にとっても嬉しい話で、高解像度PTではVRAMが逼迫しやすく、約38%の削減は地味ながら実用上の意味が大きい。
ロシアンルーレット(Russian Roulette)というアルゴリズム名については補足すると、これはレンダリングの世界でよく使われる「一定確率で光線追跡を打ち切る」テクニックの名称のことで、ギャンブルではない。
Warp Latencyが347,000サイクルから82,000サイクルへという削減幅、要するに「GPUにいかに暇な時間を作らせないか」の戦いで、NVIDIAの研究者たちは今日もGPUを一生懸命働かせている。
パストレーシングが「ハイエンドGPU専用の見世物」から「普通のゲームに使われる技術」になる道のりは長いが、今回のような地道な論文積み重ねが確実にその距離を縮めている。
今回の発表は「研究論文の公開」であり、ゲームへの即時搭載ではない点を最初に押さえておく必要があり、Videocardz(専門メディア)も「これはまだリサーチ段階だ」と明示している。
とはいえ、「Production Ready に近い」という評価は無視できない点で、過去のReSTIR系技術がCyberpunk 2077やZorah(RTX 5000シリーズのデモ)に搭載された実績を踏まえると、将来のゲームエンジン統合・ドライバレベル実装への布石と見るのが妥当だ。
NVIDIAのパストレーシング戦略は、レイトレーシングのときと同じパターンを踏んでおり、「自ら技術を開拓→業界に提示→普及待ち」という流れで、今回もその一環だ。
パストレーシングの重さは本質的な問題であり、2〜3倍の高速化があっても「RTX 5090でDLSSなしでフルPTが余裕で動く」という水準にはまだ届いておらず、あくまで「以前より大幅に現実的になった」という話だ。
ReSTIR PT Enhancedは「アルゴリズムの賢さで計算を減らす」アプローチで、RTコアのスループット自体が上がれば掛け算で効く。
Blackwell(RTX 5000シリーズ)でRT性能がさらに強化されていることを踏まえると、次世代(RTX 6000シリーズ相当)でハードとアルゴリズム両方が揃う、という絵が見える。
AMDやIntelも必死で追い縋っているが、この内容を考えるとNVIDIAが1枚上手であることは確かだろう。
AI活用の面では、NVIDIAはすでにDLSSやRay Reconstructionで「AIでレンダリングの穴を埋める」手法を確立済みで、ReSTIRの出力にAIデノイザーを組み合わせる形はほぼ既定路線だろう。
今回の論文でもノイズ低減が改善ポイントとして明示されており、「ReSTIRで光のサンプリングを最適化→AIで残ったノイズを除去」という二段構えが完成形に近いだろう。