NVIDIAのDGX Sparkは同社にとって画期的な製品でしたが、同時にAMDはオンデバイスAIで圧倒的な性能を発揮するプラットフォームを構築するためにAPUシリーズの開発を進めており、そのためStrix Halo APUは様々なAIワークロードにおいてNVIDIAのGB10チップよりも優れた性能を発揮するとされています。
NVIDIAのDGX Sparkはスループット重視なら有力な選択肢だが、Strix Haloは最高のコストパフォーマンスを実現するプラットフォーム
NVIDIAのDGX Sparkシステムは、同社初のAIワークロード向け小型デバイスであり、NVIDIA独自のカスタムチップであるGB10の開発も伴うことから、「唯一無二」の製品と言えるでしょう。
しかし、その優れた性能にもかかわらず、消費者はDGX Sparkの価格設定に不満を表明しており、「法外な」4,000ドルという価格はDGX Sparkの魅力を損なうと主張しています。
一方、AMDの最も評判の高いミニPCメーカーの一つであるGMKtecは、DGX Sparkのほぼ半額で魅力的な代替製品を提供しています。
GMKtecは公式ブログで、NVIDIAのDGX Sparkミニスーパーコンピューターに対し、同社のミニPC「EVO-X2」がトークン生成速度と応答時間においてより優れたパフォーマンスを発揮すると主張し、挑戦状を叩きつけた。
EVO-X2はAMDのStrix Halo APUを搭載している。
GMKtecは、Llama 3.3 70B、Qwen3 Coder、GPT-OSS 20B、Qwen3 0.6Bといったオープンソースモデルを用いて、複数のワークロードでEVO-X2とDGX Sparkの性能を比較テストした。その結果は以下のとおりだ。
| テストモデル | メトリック | EVO – X2 (Strix Halo) |
NVIDIA GB10 | 勝者 |
| Llama 3.3 70B | Generation Speed (tok/sec) | 4.9 | 4.67 | AMD |
| First Token Response Time (s) | 0.86 | 0.53 | NVIDIA | |
| Qwen3 Coder | Generation Speed (tok/sec) | 35.13 | 38.03 | NVIDIA |
| First Token Response Time (s) | 0.13 | 0.42 | AMD | |
| GPT-OSS 20B | Generation Speed (tok/sec) | 64.69 | 60.33 | AMD |
| First Token Response Time (s) | 0.19 | 0.44 | AMD | |
| Qwen3 0.6B Model | Generation Speed (tok/sec) | 163.78 | 174.29 | NVIDIA |
| First Token Response Time (s) | 0.02 | 0.03 | AMD |
社内テストに基づくと、Strix Haloプロセッサ、特にRyzen AI Max+ 395は、大規模パラメータモデルにおいてGB10チップを上回る性能を発揮します。
ただし、Qwen3 0.6Bのようなモデルでは、その差は縮小します。
これらの結果は、最初のトークン応答時間に関しては、多くの場合AMDが明らかに優位であることを示しています。
これは主に、CPU+GPU+NPU構成によって出力開始時のレイテンシが低減され、XDNA 2エンジンが優れたAI性能を発揮するためです。
NVIDIAが優位に立つケースもありますが、これはテスト対象のモデルがメモリレイテンシよりもスループットを重視するかどうかに左右されます。
DGX Sparkは、FP4で1 PFLOPの性能を誇るGB10 Superchipを搭載しているため、「高スループット、大規模モデル」構成を求めるユーザーにとって理想的な選択肢であることは間違いありません。
しかし、AMDプラットフォームにおけるリアルタイム推論ワークロードに関しては、特にレイテンシに敏感なワークロードの場合、AMDははるかに低コストで「同等の」パフォーマンスを提供します。
これを裏付けるように、GMKtecのEVO-X2は最上位構成(128GB+2TB)で2,199ドルですが、DGX Sparkは4,000ドルで販売されており、予約販売価格はさらに高額になっていることから、Strix HaloとGB10の価格対性能比には大きな差があることがわかります。
モデルをローカル環境で、しかも「予算を大幅に超えない」価格で運用したいのであれば、EVO-X2のようなワークステーションを選択するのは賢明な選択肢と言えるでしょう。
解説:
DGX SparkとStrix HaloのLLM対決比較
これによると驚くべきことに価格が半分程度のStrix Haloが多くのワークロードで勝利をしています。
これは「CPU+GPU+NPU構成によって出力開始時のレイテンシが低減され、XDNA 2エンジンが優れたAI性能を発揮するため」のようです。
CPU+ミドルレンジGPUという構図はかわらないものの、両者の価格は大幅に違います。
- DGX Spark(RAM 128GB+SSD 4TB) 604,000円
- EVO-X2(Strix Halo/RAM 128GB+SSD2TB) 328,990円(amazon実売)
価格は倍近く違います。
では何が違うのかというと、DGX Sparkは2台連結して倍のメモリを使うことができます。
これはAIにおいて結構大きな差だと思います。
要はDGX Sparkはスケーラビリティがあるということです。
限られた予算の一般人が使う場合、Strix Haloは魅力的ですが、開発力が全く期待できない個人向けのAI市場はNVIDIAに偏っていることと40万も出せばもっと高性能な単体GPUが購入できることもあって、EVO-X2の立ち位置は非常に微妙でしょう。
また、今回はLLMでのみ比較していますが、画像生成を計算に入れると、この優位性はちょっと怪しくなってくると思います。
DGX Sparkは販売チャンネルを見ても価格にこだわるような貧乏人は相手にしていない感じですね。
最初から2台を連結して巨大なメモリを自由に使える用途を前提にしている感じです。
またDGX SparkはCPUがGrace(ARM)なのでLinux前提です。
決して一般向けの機材というわけではないでしょう。
開発などをしない人は最初から対象外なのではないですかね。
似たような仕様ですから、比較はできますが、用途が全く違うため、比較しても意味がないそういうことなのでしょう。
非常に残念なことですが、特に小さくなければいけないという人以外は普通に自作してRTX5070Tiくらいを組み合わせたほうが幸せになれると思います。