自作PCユーザーがゲーム用PCの解説をします

自作ユーザーが解説するゲーミングPCガイド

8年前のサーバーGPUが復権中:AMD Radeon Instinct MI50は32GB HBM2でRTX 3060と互角、LLMでMac miniを超える

投稿日:

※ 画像は記事の内容をもとにしたイメージです。必ずしも現実を反映しているわけではありませんので注意してください。

 

■事実

AMD Radeon Instinct MI50は、2018年11月に発表されたデータセンター向けアクセラレーターである。

GPUコアはVega 20(GCN 5.1アーキテクチャ、7nmプロセス)で、民生向けRadeon VII(最大16GB HBM2)と同一ダイを使用している。

MI60(フルダイ、4,096ストリームプロセッサ)から約6.5%ダウンした3,840ストリームプロセッサを搭載する。

搭載VRAMは16GBまたは32GB HBM2で、4,096ビットバス・メモリ帯域幅は最大1TB/s。

TDP 300W、パッシブ冷却仕様で、サーバーラックに組み込んでラック全体のエアフローで冷やすことを前提とした設計となっている。

MI50/MI60はInstinctシリーズ中で唯一、ディスプレイ出力端子(Mini DisplayPort)を持つ最後の世代にあたる。

CDNA世代以降はグラフィクス関連リソースが完全に削除されており、MI50がデスクトップ転用できる最後のInstinctとなっている。

AIブームによる中古市場での価格高騰

ロシア語系テックYouTubeチャンネル「Pro Hi-Tech」は、2024年秋にこのカードを12,000ルーブル(当時レートで約150ドル前後)で入手し検証を行った(https://www.youtube.com/watch?v=0kJk3AtbZLk)。

動画公開時点(2026年3月)では、32GB版が35,000〜40,000ルーブル(約500ドル相当)前後まで値上がりしている。

16GB版は比較的入手しやすく、11,000〜12,000ルーブル程度で流通している。

大容量VRAMへの需要急増によって、旧世代のデータセンターアクセラレーターにまで価格上昇の波が及んでいる。

動作環境の制約

本カードはパッシブ冷却仕様のため、デスクトップ利用には3Dプリンターで製作したカスタムケースへの組み込みと外付けファンの追加が必要となる。

高負荷時のGPU温度はストレステストで80℃超、メモリ温度は90℃未満に留まった。

Linuxでは標準ROCmドライバーが認識され問題なく動作する。

Windowsでは非公式のカスタムドライバーが必要で、BIOSの種類によっては導入できないケースがある。

カード上のMini DisplayPortから映像出力が機能しないため、CPUの内蔵グラフィクス経由で映像を出力する変則構成が必要となった。

HW Infoはカードを正しくMI50として認識するが、ドライバーの種類によってはRadeon VIIとして表示される場合もある。

ゲーム性能

Assassin’s Creed: Shadows、Indiana Jones and the Great Circle、Resident Evil: Requiemといった最新タイトルは非公式ドライバーの制約から起動しなかった。

Shadow of the Tomb Raider(4K/高設定/アンチエイリアスなし)では平均60fpsを記録し、RTX 2080・RTX 3060と誤差の範囲内で並んだ。

Kingdom Come: Deliverance IIではQHD設定で平均61fpsを記録し、RTX 3060(64fps)に近く、RTX 4060(72fps)には及ばなかった。

Counter-Strike 2ではRTX 3060を上回り、RTX 4060に僅差で敗れた。

The Last of Us Part IIではRTX 3060と実質同等の結果だった。

Clair Obscur: Expedition 33ではRTX 3060比で約16%遅く、非公式ドライバーに起因する性能低下が確認された(ゲーム側が起動時に「このドライバーは非推奨」と警告を出すが、正規ドライバーでは起動自体ができない)。

Cyberpunk 2077(FHD/高設定/FSRなし/内蔵ベンチ)ではMI50が平均72fps、RTX 3060が82fps、RTX 4060が93fpsとなり、約14%の差が生じた。

Path Tracing(フルレイトレーシング)モードでは、内蔵GPU経由映像出力という構成の影響か、通常のデスクトップGPUでは見られない大幅な性能低下が発生した。

タイトル 設定 Mi50(平均fps) RTX 3060(平均fps) RTX 4060(平均fps)
Shadow of the Tomb Raider 4K 高設定 60 60
Kingdom Come: Deliverance II QHD 61 64 72
Cyberpunk 2077(ベンチ) FHD 高設定 72 82 93

クリエイティブ・業務用途での性能

Adobe Premiere Proでの複雑プロジェクト最終レンダリングでは、MI50はRTX 3060と同等の結果を出し、Mac mini M4 Proも上回った。

この要因として、HBM2の1TB/sというメモリ帯域幅がPremiereのレンダリング性能に直結していることが指摘されている(RTX 5090は1.8TB/s、AMD 8060Sの内蔵グラフィクスは256GB/s)。

Blenderはカードを正しく認識できず、内蔵グラフィクス経由で動作しようとした。

DaVinci Resolveは複数バージョンで起動すらしなかった。

Topaz Video AIはノイズ除去+フレームレート変換の組み合わせタスクで、内蔵GPU(AMD 8060S相当)の2倍以上遅い結果となった。

ローカルAI(LLM推論)での性能

12Bパラメーターモデル(Gemma 3 Q4K)の推論では、Intel Arc B580とRTX 4060 Tiの中間に位置し、消費電力あたりの効率ではRX 7900 XTSに近い水準だった。

35Bパラメーターモデル(Qwen 3.5 MoE型)では、32GB VRAMにモデル全体が収まり、ユニファイドメモリ64GBを搭載したMac mini M4 Pro(約200,000ルーブル)より高速な推論を記録した。

ただし長いコンテキスト(35,000トークン超)処理時には最初のトークン生成までの待ち時間が急増し、Mac mini M4 Proを下回る場面もあった。

Hermes 3 Nモデル(30Bパラメーター)では105,000トークンの長文コンテキストでも比較的安定した性能を維持した。

RTX 5090との二枚差し構成(合計VRAM 32GB+32GB)でOpenAI GPT-OSS 120Bパラメーターモデル(MXFP4量子化)を実行したところ、128GBメモリのHolus-X相当システムを上回り、RTX 5080単体比で当該タスクの速度が約2倍向上したと報告されている。

ROCmサポートの現状

AMD公式ROCmサポートマトリクスでは、MI50はすでに「サポート外(Unsupported)」に分類されている。

ROCm 7.0(2025年9月リリース)では、ROCm Compute ProfilerからMI50/MI60のサポートが削除された。

AMD AI SoftwareのVPはこの変更を把握しておらず、後日見直しを検討すると表明した。

コードベース自体にはMI50向けコードが引き続き存在するため、コミュニティビルドやフォークを通じた動作は継続可能とされているが、今後は新機能・最適化が追加されないことを意味する。

■解説

「150ドルのサーバーカード」が2026年に話題になるという皮肉

正直、この動画が2026年3月にTechPowerUpで取り上げられているのを見たとき、「ああ、ついにここまで来たか」と思いました。

MI50は2018年発売の、スパコンのラックに差して強制冷却してもらう前提のカードです。 ファンすら付いていない。 それが3Dプリントのカスタムケースに詰め込まれてAI推論に使われている。

笑い話ではなくて、VRAMの供給不足と価格高騰がいかに深刻かを示す証拠です。 民生向けで32GBを手頃な価格で買えるカードが市場に存在しないから、7年前のサーバー廃棄品に群がることになる。

HBM2の1TB/s帯域幅という本当の武器

MI50の強みはシェーダー数でも消費電力でもなく、帯域幅にあります。

RTX 3060が336GB/s、RTX 4060が288GB/sのところ、MI50は1TB/s。 この数字はRTX 5090(1.8TB/s)に次ぐ水準で、民生向けGDDR6X世代の多くのカードを圧倒します。

Premiereのレンダリングでは、この帯域幅がそのままスコアに反映されました。 Mac mini M4 Proを超えたのは「ダイ性能」ではなく「メモリの太さ」の勝利です。

LLM推論でも同様で、35BモデルをVRAMに丸ごと収めて200,000ルーブルのMac miniより速く処理できるという事実は、「VRAMの量と帯域幅こそが推論速度の決め手」という話の説得力ある実演になっています。

私自身ローカルLLMを日常的に動かしていますが、KVキャッシュがVRAMを食い続ける構造上、VRAMが大きければ大きいほど長いコンテキストを扱えるのは確かです。 ただしその「VRAMの大きさ」が価格として適正に反映されていないのが今の市場の問題で、MI50の需要爆発はその歪みの産物でもあります。

ゲーム用途では「今買う選択肢にならない」

動画テスターが言うように、150ドル時代に購入できていたなら話は別でした。 今の500ドル、日本円で言えばeBayで32GB版がすでに100,000円前後(https://www.ebay.com/itm/146669335049)になっており、ゲーム用途として買うかと言われたら、答えはNOです。

RTX 3060(12GB GDDR6)なら現時点でどこでも手に入り、新しいゲームも動き、ドライバーの心配もない。 非公式ドライバーで起動しないタイトルが続出するMI50とでは、ゲーム専用途として比較の対象にもならない。

おまけにDisplayPortが動かず内蔵GPU経由で映像を出す構成は、Cyberpunk 2077のPath Tracingで謎のモバイル級性能低下を引き起こしました。 データセンター向け製品をデスクトップ転用することの限界が出た典型例です。

ROCmサポートの実情——公式発表と実態の乖離

本記事で「ROCmサポートが打ち切られた」と書くのは、正確には語弊があります。 この点、ROCmのセットアップバッチファイルを公開・配布している立場から補足しておきます。

AMDが管理するTheRockのナイトリーリポジトリ(https://rocm.nightlies.amd.com/v2-staging/)を確認すると、gfx906(MI50のGPUターゲット)向けのディレクトリが現時点でも存在し、中身にはtorchtorchaudiotorchvisiontritonjaxlibrocm-sdk-corerocm-sdk-develrocm-sdk-libraries-gfx906など、LLM/ML用途に必要なスタックがほぼ揃っています。

「ROCm 7.0のプロファイラーからMI50サポートが削除された」という事実と、「PyTorchやJAXを含むMLスタックのビルドが継続されている」という事実は、別の話として切り分ける必要があります。

ROCm本体についてはWindows向けバイナリも同リポジトリ内にビルドされており、同世代に近いRDNA1(gfx101X)向けにはWindows用バイナリも確認されています。

要するに、これは建前と本音の二重構造です。 公式サポートマトリクスという建前の外側に、実態としてのビルドが存在する——こういう構造はしばしばあることで、建前を超えて踏み込める人間にしか果実は味わえないということでもあります。

将来性がないのは事実で、あと数年は動くでしょうが、その先の保証はない。 すべてを自己責任として、リスクを受け入れられる超上級者向けの選択肢、というのが正直な評価です。

加えて、Windowsで使いたい場合はRadeon Pro向けBIOSを書き換えてMI50に適用するという強引な方法を実践している猛者も存在します。 積極的には推奨できませんが、技術と覚悟がある人間にとっては、geek的な視点で見れば明らかに穴場のGPUです。

「VRAM32GBを確保したい」ならLinux前提で今でも検討に値する

ゲーム目的なら今すぐ候補から外す。Premiere一本用途なら面白いが、BlenderとDaVinciが動かないと実務では使えない。

純粋なLLM推論機として「Linuxで使う」と割り切れる技術者には、今でも費用対効果が成立する可能性はある。 TheRockナイトリーにPyTorchまで揃っている以上、ソフトウェア面の心配は当初思われていたより小さい。

ただしeBayで100,000円を超えた現在、「格安のVRAM確保」という最大の魅力は薄れつつあります。

LLM的な評価軸——サポート状況、ドライバーの安定性、公式エコシステムへの適合度——で採点すれば、このカードはかなり低い点数になるでしょう。 しかし何に重点を置くかで評価は大きく変わります。 150ドルで買えたものが今や600ドル弱まで値上がりしているという事実は、市場がそのポテンシャルに対してそれだけの票を投じたということです。

DRAMの高騰がなければ見向きもされなかったカードが、同じメモリ価格高騰の恩恵で値上がりするという皮肉な構図でもある。

「2026年に8年前のサーバーカードが話題になる」という状況が示しているのは、現在の消費者向けGPU市場が大容量VRAMをいかに高値で囲い込んでいるかという構造的な問題に他なりません。