3年前のAPUをAI用にリサイクル
新しいRyzen 5 5600G(Cezanne)は、Ryzen 5 4600G(Renoir)に代わって、ゲームに最適なCPUの1つとなった。
しかし、あるトリックがRyzen 5 4600Gに新たな命を吹き込み、格安のZen 2 APUをLinux上でAIアプリケーションを実行するための16GBグラフィックカードに変身させた。
誰もがAIを試すためにNvidia H100(Hopper)を購入したりレンタルしたりする予算があるわけではない。
AIに特化したグラフィックス・カードに対する現在の需要では、お金があっても手に入れることができないかもしれない。
幸運なことに、高価なH100やA100(Ampere)、AIに最適なグラフィックカードは必要ない。あるRedditorは、95ドルで販売されているRyzen 5 4600Gで、さまざまなAIワークロードを実行できることを実証した。
2020年に登場したRyzen 5 4600Gは、ベースクロック3.7GHz、ブーストクロック4.2GHzのZen 2コアを搭載したヘキサコア、12スレッドのAPUだ。65Wのこのチップは、最大1.9GHzのクロックを持つ7つのコンピュートユニットを備えたRadeon Vega iGPUも搭載している。APUは専用メモリを持たず、システムメモリを共有することを覚えておいてほしい。
メモリの容量はマザーボードのBIOSで確認できる。
この場合、Redditorは32GBのDDR4を搭載しており、Ryzen 5 4600Gに16GBを割り当てた。
通常、16GBがiGPUに割り当てられるメモリの最大量だ。
しかし、一部のユーザー報告によると、ASRock AMD マザーボードの一部では、最大 64GB と噂される、より大きなメモリ割り当てが可能だそうです。
このトリックは、Ryzen 5 4600Gを16GBの「グラフィックカード」に変換するもので、Nvidiaの最新のGeForce RTX 4000シリーズSKU(GeForce RTX 4070やGeForce RTX 4070 Tiなど)よりも多くのメモリを誇示している。
論理的には、APUはハイエンドのグラフィックスカードと同じ性能を発揮するわけではないが、少なくともAIワークロード中にメモリ不足に陥ることはないだろう。
AMDのRadeon Open Computeプラットフォーム(ROCm)は、Ryzen APUを公式にはサポートしていない。BruhnBruhn Holdingなどのサードパーティ企業は、APUで動作するROCmの実験的パッケージを提供している。つまり、APUはPyTorchやTensorFlowフレームワークで動作し、ほとんどのAIソフトウェアへの門戸を開くことができる。
DDR5メモリーを利用するPhoenixのようなAMDの最新モバイルRyzenチップが動作可能かどうか、そしてどのようなパフォーマンスをもたらすのか、気になるところだ。
このRedditorは、Ryzen 5 4600Gが、Stable Diffusion、FastChat、MiniGPT-4、Alpaca-LoRA、Whisper、LLM、LLaMAを含む多数のAIアプリケーションを実行できると主張するYouTubeビデオを公開した。
残念ながら、彼がデモを提供したのは、テキスト入力に基づくAI画像ジェネレーターであるStable Diffusionだけだ。
彼は、Ryzen 5 4600GをLinuxシステム上のAIソフトウェアでどのように動作させたかについては詳しく説明していない。
このYouTuberは、セットアッププロセスの徹底的なビデオを公開することを約束している。
パフォーマンスに関しては、Ryzen 5 4600Gは、デフォルト設定の50ステップで512×512ピクセルの画像を生成するのに約1分50秒しかかからなかった。
これは95ドルのAPUとしては素晴らしい結果であり、いくつかのハイエンドプロセッサーに匹敵する。
筆者はDDR4メモリを使用したと述べているが、スペックは記載していない。Ryzen 5 4600GはネイティブでDDR4-3200をサポートしているが、多くのサンプルはDDR4-4000を達成することができる。
この実験は、Ryzen 5 4600GまたはRyzen 5 5600Gを所有し、AIで遊んでみたい人にとっては素晴らしいものだ。
そうでない人にとっては、より優れたパフォーマンスを提供するディスクリート・グラフィックスカードが手に入るかもしれないのに、APUビルドに500ドルを投入するのはあまり意味がない。
例えば、AMDのRadeon 16GBグラフィックカードは499ドルからであり、Nvidiaは最近、GeForce RTX 4060 Ti 16GBを発売したが、これは同様の開始価格だ。
ソース:Tom's Hardware - $95 AMD CPU Becomes 16GB GPU to Run AI Software
解説:
Linux上のRenoirでAIワークロードが実行できる?
Stable Diffusionにおいて、50ステップで512X512の画像出力1枚が1分50秒だそうです。
正直、最新のGPUからするとかなり遅いです。
RTX3060 12GBのネイティブよりかなり遅いです。
ステップ28のアスカベンチ(10枚出力)で
- RTX3060 CUDAネイティブが49秒
- RTX3060 DirectMLが2分43秒
ですから、当サイトで配布しているバージョンを使ったことがある方なら実感できると思います。
実用的な速度は言い難いものがありますが、現在Renoirを使っている方は試してみる価値はあるかと思います。
手軽さで言えば当サイトで配布しているDirectML版には遠く及びませんが、Linux上で実行できますので一般ユーザーでもトライできなくは無いでしょう。
どのような方法を使っているかは近いうちに公開されるようです。
該当の動画は上となっています。
気になる方はチャンネル登録をして更新通知ボタンをクリックして続報を待ちましょう。
Ryzen 9000シリーズ
Ryzen 7000X3Dシリーズ
Ryzen 8000GシリーズAPU(GPU内蔵)
Ryzen 5000/4000シリーズ