
NVIDIAのフラッグシップGPUであるBlackwell GPUは、PCIeの帯域幅をフルに使用していない場合、特にビデオ編集アプリケーションで、性能の大部分を失うようだ。
NVIDIAのRTX 5090以外のアドインカードを使用すると、性能に大きな差が出る可能性があります。
複数の作業負荷にわたってGPUの性能を決定する要因は数多くありますが、重要な要因の1つは、GPUがアクセス可能なPCIe帯域幅です。
最新のPCIe 5.0世代では、PCIeレーンが不十分な場合、特にビデオレンダリングやコンテンツ作成のような集中的な作業負荷において、GPUの性能が著しく低下する可能性があります。Puget Systemsは、NVIDIAのGeForce RTX 5090で広範なテストを実施し、PCIe帯域幅が少ない場合の性能への影響を調べました。
興味深いことに、GPUに割り当てられたPCIe帯域幅は、プライマリデバイスとは別に別のデバイスをPCIeスロットに装着すると影響を受ける。
多くのマザーボードメーカーは、PCIe 5.0 x 16スロットを1つ搭載しており、RTX 5090をフルパフォーマンスで動作させることができますが、PCIeネットワークカードなど他のアドインカードを接続すると、GPUのパフォーマンスに影響します。Puget SystemsがNVIDIAのフラッグシップGPUであるBlackwell GPUをレンダリングアプリケーションとAIワークロードでテストしたところ、GPUはPCIe帯域幅をフルに消費した場合のみ完璧に動作するようだった。

After Effectsを始め、RTX 5090はPCIe 5.0 x 16からPCIe 3.0 x 4になったときにパフォーマンスが大幅に低下し、10%以上の差が出た。
同様に、DaVinci Resolveでは、GPUがPCIe 3.0 x 4で動作した場合、性能ヒットは20%以上となり、同世代でレーン数がx16からx4に減少した場合も顕著なヒットが見られた。
これは、マザーボード上で複数のアドインカードを動作させると、GPU性能に大きな影響を与える可能性があることを示しています。

ゲーム開発ベンチマーク、特にUnreal Engineでは、ほぼすべてのPCIeコンフィギュレーションで性能にほとんど変化が見られませんでした。
これはLlama.cppベンチマークのようなAIワークロードでも同様で、オンボードGPUにPCIe帯域幅を低く割り当てても性能に影響はありませんでした。
ここでの低下がさほど大きくない理由は、これらのアプリケーションがGPU VRAMへの依存度が高いためです。
平均的な消費者はPCIe帯域幅をあまり気にする必要はありませんが、専門家、特にコンテンツ制作者はPCIe帯域幅を念頭に置く必要があります。
解説:
RTX5090はレンダリングワークロードにおいて、PCIe5.0x16、PCIe5.0x8=PCIe4.0x16でないと真価が発揮できない。
PCIe5.0x4=PCIe4.0x8=PCIe3.0x16だと約10%、PCIe4.0x4=PCIe3.0x8だと25.4%の性能が失われる計算になります。
25%以上の性能を失うというのはこのことでしょう。
現在のシステムでRTX5090をPCIe3.0x16以下のシステムにぶら下げるケースというのはあまり発生しないとは思いますが、PCIeの帯域幅によって大きな制限を受けるというのは事実なのでしょう。
さすがにPCIe4.0x16だとそういったことはありませんが、ものすごい進化を遂げていることは確かでしょう。
次世代はPCIe5.0x16でないと性能が出ないなんてことになるかもしれません。
これはもちろんRTX5090の話でそれより下のGPUで困ることはないと思われます。
面白いことにLLMなどほかのワークロードではPCIeの帯域を使いきることはないようです。