AMDは、Radeon AI PRO R9700 GPUの詳細と、既存のRadeon PRO W7800に対するAIタスクの比較について発表した。
AMD、RDNA 4ベースのRadeon AI PRO R9700 GPUでAI TOPSを4倍、AI性能を2倍に向上
AMDは最近、ROCm 7でソフトウェア・スイートを拡張し、現在のAIアクセラレーター戦略を3つの主要カテゴリーに拡大した。
Ryzen AI MAX APUは小中規模のLLM、Radeon AI PRO GPUはマルチGPUのエッジ推論と小中規模のLLM、そして最後にInstinct AIアクセラレーターはラック・スケールの推論とトレーニング用の大規模LLMを目指す。
AMDは、MI350シリーズの詳細を明らかにする一方で、Radeon AI PROラインアップのAI統計もいくつか明らかにした。
AMD Radeon AI PRO R9700は、64個のコンピュート・ユニットまたは4096個のストリーム・プロセッサーを備えたNavi 48 GPUを採用している。
GPUには128個のAIアクセラレーターが搭載され、TBPは最大300Wです。
メモリに関しては、AMD Radeon AI PRO R9700は、256ビットバスで動作する32GBのGDDR6メモリを搭載しており、これは実質的に9070 XTのVRAMの2倍に相当する。
AMDが共有するその他の性能面には、96 TFLOPsのFP16演算と1531 TOPSのINT4(スパース)が含まれる。
AMD Radeon AI PRO R9700 GPUの目標は、高品質のAIモデルを効率的に完成させることです。
これは、DeepSeek R1 Distill Qwen 32B Q6、Mistral Small 3.1 24B Instruct 2503 Q8、Flux 1 Schnel、SD 3.5 Mediumなど、ほとんどの高度なローカルAIワークロードに最適な量です。
パフォーマンスに関しては、AMDはRadeon AI PRO R9700がDeepSeek R1でRadeon PRO W7800 32 GB GPUの2倍高速であるとしており、16 GBのVRAMバッファを搭載するRTX 5080との比較測定も示している。
16GBのVRAMは、より多くのメモリを必要とするAIモデルには適していない可能性があり、そのためR9700は最大5倍高速であることが示されている。
R9700は、47.8 TFLOPsのFP32、191.4 TFLOPsのFP16 / BF16、382.7 TFLOPsのFP8、382.7 TOPsのINT8、および765.5 TOPSのINT4性能を提供する。
このGPUはまた、WMMA(Wave Matrix Multiply Accumulate)命令とStructured Sparsityをサポートします。
スパース性を利用した場合、INT4の合計TOPSは1531に達する。FP16の数値はRadeon PRO W7800の2倍増、INT8/INT4の数値は4倍増です。
AMDはまた、より大きなモデルをサポートすることが、より良い結果を得るために不可欠である理由も強調している。
To-Imageでは、FP16上で実行される8Bモデルは1Bモデルよりもはるかに優れた結果をもたらす。
推論に関しては、32Bの6ビットモデルの方が8Bの6ビットモデルよりも精度が高くなります。
AMDはまた、R9700とW7800のシングルGPU比較でFP16 AI性能を紹介しており、新バージョンはDeepSeek R1 Distill Llama (8B)で2倍以上の性能向上を実現している。
AMD Radeon AI PRO R9700は、最新のPCIe 5.0プラットフォームを使用して、4-wayマルチGPU構成に拡張することもできます。
これにより、ユーザーは、Mistral 123BやDeepSeek R1 70 Bのようなバッファモデルを扱うことができる巨大な128 GBプールを利用することができます。
最後に、AMD Radeon AI PRO R9700 GPUは、ASUS、ASRock、Gigabyte、PowerColor、Sapphire、XFX、Yestonなどの主要パートナーを通じて、今年7月に発売される予定である。
このカードはデュアルスロットデザインで、ブロワークーラーを搭載する。
ASRockのモデルは以下でご覧いただけます:
※ 画像をクリックすると別Window・タブで拡大します。
AMD Radeon Proワークステーション・グラフィックス・ラインナップ:
| グラフィック カード名 |
Radeon AI PRO R9700 |
Radeon Pro W7900 |
Radeon Pro W7800 |
Radeon Pro W6900X |
Radeon Pro W6800 |
Radeon Pro VII |
Radeon Pro W5700X |
Radeon Pro W5700 |
Radeon Pro WX 9100 |
Radeon Pro WX 8200 |
Radeon Pro WX 7100 |
| GPU | Navi 48 | Navi 31 | Navi 31 | Navi 21 | Navi 21 | Vega 20 | Navi 10 | Navi 10 | Vega 10 | Vega 10 | Polaris 10 |
| 製造プロセス | 4nm | 5nm+6nm | 5nm+6nm | 7nm | 7nm | 7nm | 7nm | 7nm | 14nm | 14nm | 14nm |
| コンピュート ユニット数 |
64 CU | 96 CU | 70 CU | 80 | 60 | 60 | 40 | 36 | 64 | 56 | 36 |
| ストリーム プロセッサー数 |
4,096 | 6,144 | 4,480 | 5,120 | 3,840 | 3,840 | 2,560 | 2,304 | 4,096 | 3,584 | 2,304 |
| クロック (最大) |
未定 | ~2.5 GHz | ~2.5 GHz | 2171 MHz | 2320 MHz | 1700 MHz | 2040 MHz | 1930 MHz | 1500 MHz | 1500 MHz | 1243 MHz |
| VRAM | 32 GB GDDR6 | 48 GB GDDR6 | 32 GB GDDR6 | 32 GB GDDR6 | 32 GB GDDR6 | 16 GB HBM2 | 16 GB GDDR6 | 8 GB GDDR6 | 16 GB HBM2 | 8 GB HBM2 | 8 GB GDDR5 |
| メモリ帯域幅 | 640 GB/s | 864 GB/s | 576 GB/s | 512 GB/s | 512 GB/s | 1024 GB/s | 448 GB/s | 448 GB/s | 512 GB/s | 484 GB/s | 224 GB/s |
| メモリバス幅 | 256-bit | 384-bit | 256-bit | 256-bit | 256-bit | 4096-bit | 256-bit | 256-bit | 2048-bit | 2048-bit | 256-bit |
| 演算性能 (FP32) |
48 TFLOPs | 61.3 TFLOPs | 45.2 TFLOPs | 22.23 TFLOPs | 17.82 TFLOPs | 13.1 TFLOPs | 9.5 TFLOPs | 8.89 TFLOPs | 12.3 TFLOPs | 10.8 TFLOPs | 5.7 TFLOPs |
| TDP | 300W | 295W | 260W | 300W | 250W | 250W | 240W | 205W | 250W | 230W | 150W |
| 価格 | 未定 | $3999 US | $2499 US | $5999 US | $2249 US | $1899 US | $999 US | $799 US | $2199 US | $999 US | $799 US |
| 発売年 | 2025 | 2023 | 2023 | 2021 | 2021 | 2020 | 2019 | 2019 | 2017 | 2018 | 2016 |
解説:
AMD Radeon AI PRO R9700 GPUの情報が出てきました。
前評判どおり、Radeon PRO W7800の4倍のTOPSと2倍のAI性能ということです。
TOPSとAI性能はW7900よりも高性能なのでしょうね。
Navi41/42がキャンセルされてしまったのは残念ですが、R9700とブランドネームを変えてイメージを一新するだけの性能向上を果たしているようです。
あとはROCm7.0でどのくらい性能を引き出せるのかという感じです。
発売は7月とのことで、一般ゲーマーに手が届く程度の価格にはならないでしょうが、どのような評価になるのか非常に楽しみです。
また、同時にROCmが予備的なサポートを開始する可能性もありますので、こちらも楽しみですね。
[st_af id=”7991″]