AIが生成した画像をさらに高速に作成
Automatic1111のStable Diffusion WebUIは、インテルのOpenVINOツールキットの統合により、インテルGPUハードウェアで動作するようになりました。
我々は、Stable Diffusionの最新リリースを再テストし、以前の結果と比較してインテルのGPUがどれだけ高速になったかを確認した。
Stable Diffusion(現在、結果の更新に取り組んでいるが、我々の以前のテストがある)は、テキスト記述から画像を生成するために使用されるディープラーニングAIモデルである。
Stable Diffusionが特別なのは、ローカルの消費者向けハードウェアで実行できることだ。
AIコミュニティには多くのプロジェクトがあり、中でもStable Diffusion WebUIは最も人気がある。
使いやすく、実験しやすいブラウザ・インターフェースを提供している。
数ヶ月に及ぶ水面下での作業(私たちは以前からこの噂を耳にしていた)を経て、最新のアップデートがIntel Arcオーナー向けに提供され、パフォーマンスが大幅に向上した。
https://twitter.com/bobduffy/status/1691974854705320111
翻訳
Stable Diffusion A1111 webui for Intel Siliconをチェックしてください。
私のA770で動作しますし、CPUやiGPUでも動作します。
OpenVINOを使用しているので、最適化されています😃
右の画像の例、純粋なプロンプト。
左はInPaintingを使って目のディテールを増やした同じ画像...
以下は、Stable Diffusionの前回および最新のテスト結果です。
前回のテストでは、少し手を加えたStable Diffusion OpenVINOを使用し、Automatic1111 webuiのフォークとOpenVINOで再テストを行いました。
また、Nod.aiのSharkベースのStable Diffusionの新しいビルドで、AMDのGPUのいくつかを再テストしました。
Nvidiaの結果はまだ更新されていませんが、近い将来、最新バージョンでの再テストを検討する予定です(終了次第、Stable Diffusionベンチマークのメイン記事を更新します)。
プロンプトも変更した。(新しいプロンプトは "messy room "で、AIが生成するためにより多くの労力を必要とする小さなディテールが画像に多く含まれる傾向があります)。
実行ごとにばらつきがあり、特に今Arcに適用される注意点がありますが、以下が実行前と実行後の結果です。
インテルARCとAMD GPUはいずれも性能向上を示しており、ほとんどのGPUが大幅な向上を実現している。
Arc A770 16GB(リミテッド・エディション、現在は販売終了)は54%向上し、A750は同じシナリオで40%向上した。
Nod.aiもじっとしていない。AMDのRX 6800、RX 6750 XT、RX 6700 10GBはすべて高速化し、特に6800と6700 10GBは大きな向上を示している。
なぜ6750 XTがそれほどうまくいかなかったのかはわからないが、RX 6800は34%、RX 6700 10GBはさらに76%も性能が向上している。
RX 6750 XTは、3つのAMD GPUがすべて同じRDNA2アーキテクチャを共有しているにもかかわらず、なぜかわずか9%しか向上しなかった。
(近い将来、AMDの新しいRX 7000シリーズを含む他のGPUも再テストする予定です)。
繰り返しになるが、3つのNvidia RTX 40シリーズGPUの再テストは行っていないため、2つのグラフの性能統計は同じままである。
それでも、新しいOpenVINO最適化により、IntelのArc A750とA770はRTX 4060を上回ることができるようになり、A770 16GBはRTX 4060 Tiに迫っている。
インストールをより簡単にしたり、他の画像解像度やStable Diffusionモデルが動作するように修正したりと、現在進行中の作業はまだたくさんある。より新しい "v2-1_512-ema-pruned.safetensors "と "v2-1_768-ema-pruned.safetensors "は意味のある出力を生成できなかったため、"v1-5-pruned-emaonly.safetensors "のデフォルトモデルに頼らざるを得ませんでした。
また、768x768の生成は現在Arc GPUで失敗している。
720x720まではできたが、744x744は結局CPUベースの生成に切り替わった。
768x768サポートの修正は比較的近いうちに行われると聞いているので、Arcユーザーはそのアップデートに注目してほしい。
ソース:Tom's Hardware - Stable Diffusion Optimized for Intel Silicon Boosts Arc A770 Performance by 54%
解説:
イラストAIの話題が上がっていたので取り上げてみます。
ARC A770の実行結果が最大で54%高速になったとのこと。
この話題を見て私の感想は「ふうん」でした。
理由は以下に書きます。
OpenVINO版のStable DiffusionはGUI無しです。
当サイトで配布対象としているStable DiffusionはWebUIです。
それ以外のStable Diffusionはネット上にあるノウハウを適用するのが難しく、ホビイストの実用性として疑問符が付くからです。
Sharkも対象にしているようですが、同じ理由でSharkもホビイストが活用するには難があります。
結局、Stable DiffusionはWebUIが一番使いやすいですし、各種のノウハウも簡単にそのまま実行できますので、それ以外の派生バージョンでいくら速くなったと言っても実用性はありません。
ちなみにですが、最新のROCm5.6でRX7900XTXの結果はRTX4070Tiと同程度ですから、ARC A770より圧倒的に速く、何なら、元記事の結果で一番速いRTX4070よりも圧倒的に高速です。
今後、ROCm5.7がロンチされればさらに速くなることが期待できますので、イラストAIでもっとコスパの良い選択は24GBものメモリを搭載し、Linux上でネイティブにStable Diffusion WebUIを実行できるRX7900XTXを使うことだと思います。
ROCm5.6でStable Diffusion WebUIを実行する解説記事はこちら
RX7900XTXはRTX4080よりメモリ搭載量が多く、演算性能も高いですから、最終的にはRTX4090とRTX4080の中間くらいの性能になるのではないかと思います。
現時点でもかなりお買い得ですが、今後さらにお買い得になることが期待できるということです。
AMDのGPU Radeonシリーズ
Radeon 7000シリーズ
Radeon RX 6000シリーズ
※ SAPPHIREはAMD Radeon専業のメーカーであり、Radeonのリファレンス的なメーカーです。