その他

インテル・シリコンに最適化された安定した拡散により、Arc A770のパフォーマンスが54%向上

更新日:

AIが生成した画像をさらに高速に作成

Automatic1111のStable Diffusion WebUIは、インテルのOpenVINOツールキットの統合により、インテルGPUハードウェアで動作するようになりました。

我々は、Stable Diffusionの最新リリースを再テストし、以前の結果と比較してインテルのGPUがどれだけ高速になったかを確認した。

Stable Diffusion(現在、結果の更新に取り組んでいるが、我々の以前のテストがある)は、テキスト記述から画像を生成するために使用されるディープラーニングAIモデルである。

Stable Diffusionが特別なのは、ローカルの消費者向けハードウェアで実行できることだ。

AIコミュニティには多くのプロジェクトがあり、中でもStable Diffusion WebUIは最も人気がある。

使いやすく、実験しやすいブラウザ・インターフェースを提供している。

数ヶ月に及ぶ水面下での作業(私たちは以前からこの噂を耳にしていた)を経て、最新のアップデートがIntel Arcオーナー向けに提供され、パフォーマンスが大幅に向上した。

 

https://twitter.com/bobduffy/status/1691974854705320111

翻訳

Stable Diffusion A1111 webui for Intel Siliconをチェックしてください。

私のA770で動作しますし、CPUやiGPUでも動作します。

OpenVINOを使用しているので、最適化されています😃

右の画像の例、純粋なプロンプト。

左はInPaintingを使って目のディテールを増やした同じ画像...

以下は、Stable Diffusionの前回および最新のテスト結果です。

前回のテストでは、少し手を加えたStable Diffusion OpenVINOを使用し、Automatic1111 webuiのフォークとOpenVINOで再テストを行いました。

また、Nod.aiのSharkベースのStable Diffusionの新しいビルドで、AMDのGPUのいくつかを再テストしました。

Nvidiaの結果はまだ更新されていませんが、近い将来、最新バージョンでの再テストを検討する予定です(終了次第、Stable Diffusionベンチマークのメイン記事を更新します)。

プロンプトも変更した。(新しいプロンプトは "messy room "で、AIが生成するためにより多くの労力を必要とする小さなディテールが画像に多く含まれる傾向があります)。

実行ごとにばらつきがあり、特に今Arcに適用される注意点がありますが、以下が実行前と実行後の結果です。

インテルARCとAMD GPUはいずれも性能向上を示しており、ほとんどのGPUが大幅な向上を実現している。

Arc A770 16GB(リミテッド・エディション、現在は販売終了)は54%向上し、A750は同じシナリオで40%向上した。

Nod.aiもじっとしていない。AMDのRX 6800、RX 6750 XT、RX 6700 10GBはすべて高速化し、特に6800と6700 10GBは大きな向上を示している。

なぜ6750 XTがそれほどうまくいかなかったのかはわからないが、RX 6800は34%、RX 6700 10GBはさらに76%も性能が向上している。

RX 6750 XTは、3つのAMD GPUがすべて同じRDNA2アーキテクチャを共有しているにもかかわらず、なぜかわずか9%しか向上しなかった。

(近い将来、AMDの新しいRX 7000シリーズを含む他のGPUも再テストする予定です)。

繰り返しになるが、3つのNvidia RTX 40シリーズGPUの再テストは行っていないため、2つのグラフの性能統計は同じままである。

それでも、新しいOpenVINO最適化により、IntelのArc A750とA770はRTX 4060を上回ることができるようになり、A770 16GBはRTX 4060 Tiに迫っている。

インストールをより簡単にしたり、他の画像解像度やStable Diffusionモデルが動作するように修正したりと、現在進行中の作業はまだたくさんある。より新しい "v2-1_512-ema-pruned.safetensors "と "v2-1_768-ema-pruned.safetensors "は意味のある出力を生成できなかったため、"v1-5-pruned-emaonly.safetensors "のデフォルトモデルに頼らざるを得ませんでした。

また、768x768の生成は現在Arc GPUで失敗している。

720x720まではできたが、744x744は結局CPUベースの生成に切り替わった。

768x768サポートの修正は比較的近いうちに行われると聞いているので、Arcユーザーはそのアップデートに注目してほしい。

ソース:Tom's Hardware - Stable Diffusion Optimized for Intel Silicon Boosts Arc A770 Performance by 54%

 

 

 

 

解説:

イラストAIの話題が上がっていたので取り上げてみます。

ARC A770の実行結果が最大で54%高速になったとのこと。

この話題を見て私の感想は「ふうん」でした。

理由は以下に書きます。

OpenVINO版のStable DiffusionはGUI無しです。

当サイトで配布対象としているStable DiffusionはWebUIです。

それ以外のStable Diffusionはネット上にあるノウハウを適用するのが難しく、ホビイストの実用性として疑問符が付くからです。

Sharkも対象にしているようですが、同じ理由でSharkもホビイストが活用するには難があります。

結局、Stable DiffusionはWebUIが一番使いやすいですし、各種のノウハウも簡単にそのまま実行できますので、それ以外の派生バージョンでいくら速くなったと言っても実用性はありません。

ちなみにですが、最新のROCm5.6でRX7900XTXの結果はRTX4070Tiと同程度ですから、ARC A770より圧倒的に速く、何なら、元記事の結果で一番速いRTX4070よりも圧倒的に高速です。

今後、ROCm5.7がロンチされればさらに速くなることが期待できますので、イラストAIでもっとコスパの良い選択は24GBものメモリを搭載し、Linux上でネイティブにStable Diffusion WebUIを実行できるRX7900XTXを使うことだと思います。

ROCm5.6でStable Diffusion WebUIを実行する解説記事はこちら

RX7900XTXはRTX4080よりメモリ搭載量が多く、演算性能も高いですから、最終的にはRTX4090とRTX4080の中間くらいの性能になるのではないかと思います。

現時点でもかなりお買い得ですが、今後さらにお買い得になることが期待できるということです。

 

 

 

 

AMDのGPU Radeonシリーズ

Radeon 7000シリーズ

 

Radeon RX 6000シリーズ

 

※ SAPPHIREはAMD Radeon専業のメーカーであり、Radeonのリファレンス的なメーカーです。

 

-その他
-

Copyright© 自作ユーザーが解説するゲーミングPCガイド , 2024 All Rights Reserved.