NVIDIAが最近リリースしたディスクリートGPU「GeForce MX550」をテストしたところ、AMD RDNA 2「Radeon 680M」統合GPUをかろうじて上回った。
AMDの統合型RDNA 2 GPUは、NVIDIAのディスクリートGeForce MX550 35W GPUと同等ながら、優れた効率性を発揮している
NVIDIA GeForce MX550は、GPUにTuring TU117を採用しています。先ほどの情報から、1024個のCUDAコア、最大1320MHzのクロック、12Gbpsクロックの64bitバスで動作する2GB GDDR6メモリインターフェイス、TDPは25Wという削ぎ落とした構成になっている。
GPUはTuringチップをベースにしているが、RTXを搭載していないGPUチップを使用しているため、RTとDLSSの機能はない。
NVIDIA GeForce MXシリーズGPUファミリーの仕様:
GPU名 | GPU アーキテクチャー | CUDAコア数 | GPUクロック | メモリ速度 | メモリバス幅 | TDP |
GeForce MX570 | Ampere GA107 | 2048 | 未確認 - 1155 MHz | 12 Gbps GDDR6 | 64-bit | 25W |
GeForce MX550 | Turing TU117 | 1024 | 未確認 - 1320 MHz | 12 Gbps GDDR6 | 64-bit | 25W |
GeForce MX 450 | Turing TU117 | 896 | 540 - 1575 MHz | 10 Gbps GDDR6 | 64-bit | 25W |
GeForce MX 430 | Turing TU117 | 896 | 未確認 - 未確認 MHz | 10 Gbps GDDR6 7 Gbps GDDR5 | 64-bit | 25W |
GeForce MX 350 | Pascal GP107 | 640 | 1354- 1468 MHz | 7 Gbps GDDR5 | 64-bit | 25W |
GeForce MX 350 | Pascal GP107 | 640 | 746- 937 MHz | 7 Gbps GDDR5 | 64-bit | 15W |
GeForce MX 330 | Pascal GP108 | 384 | 1531- 1594 MHz | 6/7 Gbps GDDR5 | 64-bit | 25W |
GeForce MX 310 | Pascal GP108 | 256 | 1341- 1379 MHz | 6/7 Gbps GDDR5 | 64-bit | 25W |
GeForce MX 250 | Pascal GP108 | 384 | 1518- 1582 MHz | 6/7 Gbps GDDR5 | 64-bit | 25W |
GeForce MX 250 | Pascal GP108 | 384 | 937- 1038 MHz | 6 Gbps GDDR5 | 64-bit | 10.5W |
GeForce MX 230 | Pascal GP108 | 256 | 1518- 1531 MHz | 6/7 Gbps GDDR5 | 64-bit | 25W |
GeForce MX 150 | Pascal GP108 | 384 | 1468- 1531 MHz | 6 Gbps GDDR5 | 64-bit | 25W |
GeForce MX 150 | Pascal GP108 | 384 | 937- 1038 MHz | 5 Gbps GDDR5 | 64-bit | 10W |
GeForce MX 130 | Maxwell GM108 | 384 | 1122- 1242 MHz | 6 Gbps GDDR5 | 64-bit | 25W |
GeForce MX 110 | Maxwell GM108 | 256 | 963- 993 MHz | 1.8 Gbps DDR3 | 64-bit | 10W |
Ryzen 6000 APUに採用されているのは、RDNA 2グラフィックス・アーキテクチャを採用したAMD Radeon 600Mシリーズの統合GPUで、最大12個のCompute Unitsで768コア、GPU周波数は最大2.4GHzを実現するものである。
Radeon 600M GPUは、初期のVega iGPUよりも50%大規模なコンピュートエンジン、50%高い帯域幅、2倍のL2キャッシュ、2倍のレンダーバックエンド(RB+)を搭載しています。
Radeon 600Mは2つのSKUに分かれており、Ryzen 9およびRyzen 7チップに搭載されるRadeon 680Mは、12 CUおよび2.4 GHzのフル構成(4 RB+)を搭載しています。
今回のレビューには、AMDのRyzen 7 6800Hが含まれており、Radeon 680MはハイエンドHXパーツの2.4 GHzではなく、2.2 GHzで動作しています。
Radeon 660Mは、最大6個のCU、1.9 GHzのクロック、2個のRenderバックエンドを備えたRyzen 5 APUの動力源です。両チップは、これらのベンチマーク内でテストされました。
AMD Ryzen 6000H 「Rembrandt」ノートブック用APUラインナップ:
APU名 | APUファミリ | アーキテクチャー | 製造プロセス | コア数/ スレッド数 | ベース クロック | ブースト クロック | L3 キャッシュ | グラフィック | TDP |
Ryzen 9 6980HX | Rembrandt H | Zen 3+ | 6nm | 8 / 16 | 3.3 GHz | 5.00 GHz | 16 MB | 12 CU RDNA 2 (2400 MHz) | 45W+ |
Ryzen 9 6980HS | Rembrandt H | Zen 3+ | 6nm | 8 / 16 | 3.3 GHz | 5.00 GHz | 16 MB | 12 CU RDNA 2 (2400 MHz) | 35W |
Ryzen 9 6900HX | Rembrandt H | Zen 3+ | 6nm | 8 / 16 | 3.3 GHz | 4.90 GHz | 16 MB | 12 CU RDNA 2 (2400 MHz) | 45W+ |
Ryzen 9 6900HS | Rembrandt H | Zen 3+ | 6nm | 8 / 16 | 3.3 GHz | 4.90 GHz | 16 MB | 12 CU RDNA 2 (2400 MHz) | 35W |
Ryzen 7 6800H | Rembrandt H | Zen 3+ | 6nm | 8 / 16 | 3.2 GHz | 4.70 GHz | 16 MB | 12 CU RDNA 2 (2200 MHz) | 45W |
Ryzen 7 6800HS | Rembrandt H | Zen 3+ | 6nm | 8 / 16 | 3.2 GHz | 4.70 GHz | 16 MB | 12 CU RDNA 2 (2200 MHz) | 35W |
Ryzen 5 6600H | Rembrandt H | Zen 3+ | 6nm | 6 / 12 | 3.3 GHz | 4.50 GHz | 16 MB | 6 CU RDNA 2 (1900 MHz) | 45W |
Ryzen 5 6600HS | Rembrandt H | Zen 3+ | 6nm | 6 / 12 | 3.3 GHz | 4.50 GHz | 16 MB | 6 CU RDNA 2 (1900 MHz) | 35W |
AMD RDNA 2 Radeon 600M iGPU vs NVIDIA GeForce MX550 dGPU(シンセティックベンチマーク):
AMD Radeon 680Mは、3DMark Fire Strikeで25%、Time Spyで5%速く、NVIDIAディスクリートGPUと違ってレイトレーシング機能を備えているので、Port Royalベンチマークでは文句なく勝利したわけである。
一方、演算ユニットが半分のRadeon 660Mは、Iris Xeグラフィックスを搭載したIntel Alder Lake Core i7-1280PのCPUに性能で匹敵する程度だった。
※ 画像をクリックすると別Window・タブで拡大します。
AMD RDNA 2 Radeon 600M iGPU vs NVIDIA GeForce MX550 dGPU (ゲーミングベンチマーク)
合成ベンチマークからゲームベンチマークに移行し、AAAゲームとeスポーツゲームの両方を含む、さまざまなタイトルを1080pでテストしました。
14本のゲームのうち9本で、AMD Radeon 680M iGPUは、NVIDIA GeForce MX550を上回る性能を発揮しました。
Radeon 660Mは、14タイトル中、合計13タイトルでIntel Iris Xe iGPUに勝つことができました。
全体として、NVIDIA GeForce MX550は、ディスクリートでより高いTDP設計にもかかわらず、AMD Ryzen 7 6800Hの統合ソリューションであるRadeon 680Mよりも5%高いパフォーマンスを提供することができたに過ぎなかったのです。
Ryzen 5 6600Hは、IntelのIris Xe iGPUに対して39%のアップリフィケーションを実現することができた。2.4 GHzのRadeon 680Mは、GeForce MX550を超える可能性を持っており、消費電力が約35WのディスクリートGPUと競合する統合チップであることが印象的です。
※ 画像をクリックすると別Window・タブで拡大します。
また、RDNA 2グラフィックス搭載のAMD Radeon 680M iGPUは、TechEpiphanyの新しいチャンネル「AMD APU Gaming」で、複数のタイトルで見事なゲーム・パフォーマンスを発揮しています。
この記事では、彼のテストのいくつかを取り上げましたが、現在PCで利用可能な最も強力な統合GPUのパフォーマンステストについては、新しいチャンネルをぜひチェックしてみてください。
解説:
当サイトではあまりモバイル関連の話題を取り上げていません。
ノートPCはちょっと前まで筐体の設計によっては搭載しているSoCの性能を100%発揮できない状態(デチューン)になっている可能性があるため、見かけ上のスペックでは実態がわからないことが多いからです。
最近ではさすがに搭載SoCの足を引っ張るような筐体の設計をしているモデルはほとんどなくなった様ですが、モバイル機器と言うのはスペック表の通りには動かないことが多いです。
また、スペック表も最大性能で掲載されていることが多いです。
今回敢えてこの話題を取り上げたのはここで、Switch Pro(次世代Switch)の性能について面白い考察が出来ると思ったからです。
まずSwitch Proに搭載される予定だったチップはT239と呼ばれnVidiaの車載向けSoCであるOrinがもとになっていると言われています。
OrinはARM64bitHeracules12コア+Ampere2048CDUAコアの組み合わせになります。
では、上の記事の表のGeforce MX570を見てみましょう。
チップにはGA107が採用され、2048CUDAコア、クロックは1155MHzです。これでTDP25Wです。
現行Switchに搭載されている、TegraX1は元々TDP15Wですが、これをデチューンしてドック時で9W、単独時で5Wで稼働していると言われています。
TegraX1のフルモードのFP32演算性能は1TFLOPSといわれていますが、Switchの性能は0.4-0.5TFLOPSとかなり低くなっているのはこれが原因です。
GA106を採用しているRTX3050は2560CUDAコアを1780MHzで駆動してTDP130Wです。これでFP32演算性能が130Wです。
RTX3050はGTX1660Ti/SUPERくらいのラスタライズ性能と言われていますが、これでもDLSSを使った4K出力は厳しいでしょう。
Switch Proに搭載されるとされていたT239の元になったOrinを搭載したJetson AGXのスペックは以下のようになります。
nvidia公式HPより引用
AI 性能 | 200 TOPS (INT8) |
GPU | NVIDIA Ampere architecture with 2048 NVIDIA® CUDA® cores and 64 Tensor Core |
最大 GPU 周波数 | 1 GHz |
CPU | 12-core Arm® Cortex®-A78AE v8.2 64-bit CPU 3MB L2 + 6MB L3 |
最大CPU 周波数 | 2 GHz |
DL アクセラレーター | 2x NVDLA v2.0 |
Vision アクセラレーター | PVA v2.0 |
メモリ | 32GB 256-bit LPDDR5 204.8 GB/s |
ストレージ | 64GB eMMC 5.1 |
CSIカメラ | Up to 6 cameras (16 via virtual channels*) 16 lanes MIPI CSI-2 D-PHY 1.2 (up to 40Gbps) | C-PHY 1.1 (up to 164Gbps) |
ビデオ エンコーダー | 2x 4K60 | 4x 4K30 | 8x 1080p60 | 16x 1080p30 (H.265) |
ビデオ デコード | 1x 8K30 | 3x 4K60 | 6x 4K30 | 12x 1080p60| 24x 1080p30 (H.265) |
USB物理層 | 2 x8 (or 1x8 + 2x4), 1 x4, 2 x1 (PCIe Gen4, Root Port & Endpoint) 3x USB 3.2 Single lane UFS |
有線ネットワーク | 1x GbE 4x 10GbE |
ディスプレイ | 1x 8K60 multi-mode DP 1.4a (+MST)/eDP 1.4a/HDMI 2.1 |
その他I/O | 4x USB 2.0 4x UART, 3x SPI, 4x I2S, 8x I2C, 2x CAN, DMIC & DSPK, GPIOs |
消費電力 | 15W | 30W | 50W |
寸法 | 100mm x 87mm 699-pin Molex Mirror Mezz Connector Integrated Thermal Transfer Plate |
2048CUDAコアと64Tensorコア、12ARM64bitコアを搭載して、15Wから50Wです。
15Wがどの程度の性能になるかわかりませんが、恐らくはほとんどのCPUコアを休止させるかクロックをかなり落とした時の消費電力でしょう。
それでも15Wです。
Switchのようなタブレット端末はSoCの他に液晶とバッテリーと言う2つの熱源とコスト増の要因があるため、据え置き機のように100%SoCに性能をつぎ込めません。
上の表を見ただけでもフルスペックのOrinを搭載するのは難しいのが理解できるのではないでしょうか。
- Switch Pro(後継機)が4Kに対応するとしたら、ドックに冷却ファンを装備してドック使用時のみにTDPを跳ね上げる
- PCで言えば、グラフィック設定、「ミドル」や「ロー」で表示する
こういった工夫が必要になると思いますし、フルでは楽しめないと思います。
そんなに熱に対して敏感になる必要性があるのか?と疑問に感じる方もいると思いますが、有機ELの前の型のSwitchによく出る症状のブルースクリーンは熱や手に持ってプレイした時の圧力によって変形し、基盤やフレームが反って中のチップ(BGA)のはんだが外れることが原因と言われています。
動画にもありますが、この症状は素人ではほぼ治せません。
5Wや9Wで動作するTegraX1ですらこのような症状が出るのですから、子供の手にもなじむあのサイズでTDPを上げるのが如何に難しいのかよくわかるのではないかと思います。
ノーマルSwitchのドックも本体吸気口に合わせた通気口が空いて冷却しやすくなっていますので、ドック自体にファンを搭載して冷却性能を上げる可能性はあるのではないかと思います。
本体の補強などもなされるかもしれませんが、価格は$400は超えない(超えられない)と思いますので、フルオプションの4Kゲーミングが楽しめるかと言えば難しいと言わざるを得ないでしょう。