※ 2025/5/3 V33を公開
※ 2025/4/19 V32を公開
※ 2025/4/7 V31を公開
※ 2025/3/27 最初のバージョン(V30)を公開
まず最初に謝罪しておきます。申し訳ございません。
RX9070/XTでStable Diffusion WebUI ZLUDAが動く(かもしれない)記事です。
なぜ「かもしれない」なのかは私が実機を持ってないからです。
実機がありませんので、動作は確認しておりません。
しかし、多分動くでしょう。
※ x.comにて動作報告をいただきました。RDNA3(RX7900XTX)よりかなり遅い(4-4.5倍)ですが、とりあえず動くようです。現状、HIP SDKがRDNA4に対してはまだ最適化されてないようです。
テスト環境
- CPU:Core i7-13700K
- マザーボード:Asrock Z690M-ITX/ac
- メモリ:DDR4-3600 16GBx2=32GB
- SSD:NVMe Gen3 SSD 256GB
- OS:Windows 11 24H2
- GPU:Radeon RX7900XTX 24GB
というわけでいつものテスト環境になります。
配布ファイル(ZLUDA_V33.zip) 215 MB (225,948,478 バイト)
※ クリックで新しいWindow・タブが開きますのでダウンロードしてください。
今回、ファイルサイズが大きいのは今までダウンロードしていたファイルを一部を除き中に収めたからです。
全てオープンソースで全部または一部を再配布可能もなことを確認しておりますが、何かありましたらご連絡ください。
迅速に対応いたします。
上のような変更で今まで以上にセットアップが高速になりました。
※ Stable Diffusion ZLUDA 対応GPU一覧
V33変更点
- "HIP_Extention.zip"が存在するかしないかの処理ををpre_r624.batからHLCT_r624.batに移行
- gfx1200の発売に備えてHLCT_r624.batのメニュー構成を変更
- HLCT_r624.batのダウンロード処理がwgetのままだったため、curlに書き換え
- HLCT_r624.batのメニュー項目にgfx906を追加
- Tritonのインストール処理を削除
- 作者(lshqqytiger)様からの回答により、pytorchを2.2.2から2.6.0に変更し、それに伴いバッチファイルの処理書き換え
- その他軽微なバグを修正
- "ai-dat"の"models"配下のフォルダに"VAE-approx"を追加(ジャンクション処理を変更)
- venvフォルダの削除に対してvenvを再インストールするように修正
既知の不具合
- gfx906のrocblas.dllがカスタム版でよいのか、変更なしでよいのか未確認
移行方法
- V32からの移行に当たっては、新しいフォルダを作って旧フォルダからデータフォルダ「.\ai-dat」を移動した後、V33付属の「.\misc\ai-dat.zip」を解凍して上書きしてください。(VAE-approxを追加したため)
- 「.\misc\HS_r624_org.7z」、「.\misc\amdhip64_6_org.7z」、「.\misc\downloads\HIP-SDK-extension.zip」をコピー
V32変更点
- 学習済みモデルデータ等ダウンローダーを実装
- gfx906(Radeon VII)のライブラリファイルのインストール処理が抜けていたためメニューから削除。後日余裕があったら実装します。
- 見やすくするためLCM Lora用のpngファイルを透過png(32bit)から24bit pngに変更
- 一部のextentionを2回git cloneしていた箇所を修正
- python3.10のモジュール[include,libs]をインストールするように追加(Tritonエラー対策)
既知の不具合
- Tritonのエラーメッセージが表示され、機能しない(WebUIは普通に動作しますので修正の優先順位は低いです。)
- gfx906(Radeon VII)のライブラリの一部が正常にインストールされていない状態です。(修正予定だが、優先順位:低)
移行方法
- 今回は上書きでOKです。
- LCM LoRAのpngファイルが透過pngであることが気になる人は自分で「.\misc\ai-dat.zip」を解凍して上書きしてください。
V31変更点
- ダウンロードに使用するコマンドを外部のGNU wgetからWindows内蔵のcurlに変更。それに伴い、バッチファイルを全面的に書き換え
- outputsフォルダの設定の間違いを修正
- pipモジュールのbasicsrがインストールされないエラーに対応
- webui-usdr.batに「TF_ENABLE_ONEDNN_OPTS=0」を設定(エラー対応)
- ZLUDAのバスを「.\system\zluda」から「.\sd-wui-zld\.zluda」に変更。それに伴い、「.\system\zluda」を廃止
- 正常に機能しないため、クロスアテンションにFlash Attention V2を設定するextentionを削除
移行方法
- V30からの移行に当たっては、新しいフォルダを作って旧フォルダからデータフォルダ「.\ai-dat」を移動させてください。
- その際、「.\misc\HS_r624_org.7z」と「.\misc\amdhip64_6_org.7z」も移動してください。(追記しました)
- ※ 「.\misc\downloads\HIP-SDK-extension.zip」も必要ですので移動してください。(追記しました)
- 今回もダウンローダーは間に合いませんでした。次回以降に実装予定です。
使い方
重要!!!!
事前準備です。
Radeonのドライバを25.4.1にしてください。
ZLUDAは現在最新のドライバに対応していないようです。
Adrenalin Edition 25.4.1ダウンロードページ(英語)
まず、HIP SDK6.2.4/6.1.2をインストールしてください。
HIP SDK6.1.2は直接使いませんがインストールされるファイルを使います。
インストールされていないと途中で止まります。
必ずインストールしてください。
インストール後以下を確認してください。
インストール後「設定」-「システム」-「バージョン情報」-「システムの詳細設定」
「システムのプロパティ」ウィンドウがポップアップしますので、「環境変数」をクリックしてください。
上の画像のように、HIP_PATH、HIP_PATH_61、HIP_PATH_62が設定されていことを確認してください。
上はデフォルトのインストール位置です。
デフォルトのインストール位置から変更した人は適宜読み替えてください。
※ わからない方はインストール位置を変更しないことをお勧めしておきます。
ダウンロードした「ZLUDA_V32.zip」を解凍してください。
好きな場所にコピペすればインストール可能です。
いつも通りポータブル版ですので、どの位置にインストールしても構いません。
できる限り「浅い階層の、2バイト文字やスペースの含まれていないフォルダ(パス)」にインストールすることをおすすめしておきます。
解凍すると上のようなファイルとフォルダが出てきます。
この中の「.\misc\downloads」に以下のファイルをダウンロードしてからコピーしてください。
予備リンク (公式のリンクがダウンロードできない場合にお使いください。)
1.5GBありますのでさすがに配布ファイルに含めるのは無理でした。
事前準備はこれで終わりです。
あとは「sd-wui-zld.bat」をダブルクリックすれば自動でインストール・設定されます。
初回セットアップ時のみ、途中で管理者権限での動作の許可を求めるWindowsがポップアップし、許可するとHLCT=HIP Library Customization Toolが起動します。
メニューは2ページあり、自分のGPUに合ったカスタムライブラリをインストールしてください。
ミスをしても後で修正できますから、心配しなくてもよいです。
この記事の末尾にオマケとしてメニューナンバーとGPUの対応表をつけておきますので活用してください。
なお当然ながら、RX7900XTX以外は動作確認しておりませんので、ご了承ください。
ファイルをセットアップするだけで、動くかどうかの確認はしておりません。
動作確認する環境がございませんので、悪しからずご了承ください。
メインメニュー
さて、すべてが終わったら上のようなメニューが出ます。
メインメニューも2ページあります。
適宜必要なものを選択して使ってください。
(V32変更点)
お待たせしました。ダウンローダーを実装しました。
メニュー2ページ目の1から選択できます。
※ CivitAIのAPI Keyが必要です。
※ 画像をクリックすると別Window・タブで拡大します。
メニューの2-1を選ぶと上の画面が表示されます。
ここでなんでもよいのでキーを押すと
上のように表示されますのでCivitAIのAPIキーをコピーして貼り付けしてください。
コマンドプロンプトに貼り付けするには右クリックだけでOKです。
自動的にダウンロードが始まります。
ダウンロードにあたっては非常に時間がかかります。
すでにファイルを持っている方は同名ファイルが存在する場合スキップしますので高速ですが、まったく持っていない場合は4-5時間かかります。
これはウェイトと速度制限をBAN対策で長めにかけているためです。
バッチファイルが理解できる方でもウェイトと速度制限を解除しないでください。ほぼ確実にBANされます。
ダウンローダーはスリープや休止状態、ハイバネーションを解除して夜寝る前とか仕事に行く前に実行して朝起きたら、帰ってきたら終わってるかなくらいのイメージで使ってください。
CivitAIのAPIキーの取得方法
まず、CivitAIのアカウントを作成してください。現在CivitAIは登録しないと表示されないコンテンツが多数ありますので利用されている方は大体が登録されていると思います。
CivitAIにログインしたら上にこのような部分があります。
赤線で囲った場所をクリックしてください。
表示されるメニューの一番下に赤線で囲った歯車のマークがありますのでクリックしてください。
アカウントの設定画面が開きます。
下の方に上のようにAPI Keyを作成する部分がありますので、赤線で囲った「+ Add API key」をクリックしてください。
上の画面がポップアップしますのでAPIキーの名前を入力して青地の「Save」をクリックしてください。
何でもよいです。海外のサービスですから、全角ではなく、半角英数字にしておきましょう。
すると1の部分にAPIキーが表示されます。2をクリックするとクリップボードにコピーされます。
以上です。
注意事項としてはAPIキーは複数作れます。(作成の上限個数は不明です。)
一度しか表示されませんので、APIキーを忘れてしまった場合は再度作成してください。
その他の注意事項
最初にsd-wui-zldを起動したとき、起動するまでにも非常に時間がかかり、最初の1枚目だけ15-40分程度生成に時間がかかります。
最初に生成するときは必ず1枚だけにしてください。
初回のみアプリケーションキャッシュを作成し、作成後(2回目以降)は高速に処理されます。
ZLUDAのアプリケーションキャッシュフォルダ
C:\Users\[ユーザー名]\AppData\Local
本スクリプトのパックアップフォルダ
[インストールパス]\misc\zbkup
(V33変更点)
pytorch2.6.0のクロスアテンション毎の生成タイムと使用メモリ
pytorch2.6.0に変更した際、デフォルト設定での生成タイムが1.5倍ほどになってしまいましたので、WebUI内でクロスアテンションを変更して生成速度とメモリ使用量を調べてみました。
設定 - Optimizations - Cross attention optimizationにて設定、変更後「設定を反映」をクリックするのを忘れないようにしてください。
※ 「animagine-xl-4.0 OPT」で「.\misc\Hello_aska_SDXL.png」のpng情報を読み取り、画像1枚生成したときの生成時間と使用メモリの状況を比較
クロス アテンション | Time taken (s) | A (GB) | R (GB) | Sys (23.9844 GB) | % |
Doggettx | 11.7 | 12.36 | 15.68 | 17.5 | 72.9 |
sdp-no-mem - scaled dot product without memory efficient attention (デフォルト) | 17.4 | 12.35 | 16.71 | 18.5 | 77.2 |
sdp - scaled dot product | 17.3 | 12.35 | 16.72 | 18.5 | 77.2 |
sub-quadratic | 13.1 | 12.35 | 14.99 | 16.8 | 70.0 |
V1 - original v1 | 29.0 | 12.35 | 16.56 | 18.4 | 76.6 |
InvokeAI | 11.3 | 12.35 | 17.68 | 19.5 | 81.2 |
None | 13.2 | 12.36 | 17.55 | 19.4 | 80.7 |
速度が一番優れているのが「InvokeAI」、メモリ使用量が一番少ないのが「sub-quadratic」、一番ではないが両方とも優れているのが「Doggettx」となりました。
あくまでも私の環境ですが、参考にしてください。
今回から「.\sd-wui-zld\VENV」を削除するとVENV環境をインストールし直す仕様に変更いたしました。
また、元々のWebUIの仕様ですが、「.\sd-wui-zld\.zluda」を削除するとzludaをインストールし直します。
zludaのバージョンはメニューの1-7を選んでコマンドプロンプトに降り、「zluda --version
」で確認できます。
旧版(V2X)からのデータ移行について。
今回からSD2.xのデータは対応しておりません。
悪しからずご了承ください。
旧版からのモデルデータ引継ぎに関しては\ai_datをそのままコピペしてください。
※ 事前にSD2xのデータは移動もしくは削除しておいてください。
なお、データの引継ぎにあたっては上の画面のようにデータフォルダがSDXLになっていることを確認してください。
また、移行元のデータもSDXLにしておいてください。
これでそのまま使えるはずです。
データ移行される方は、操作ミスを防ぐ意味でも最初に上のメニューが立ち上がったらいったん上のメニュー画面を閉じことをお勧めします。
データフォルダは
旧版(現在のデータがSDXLの場合)
- sd
- sd2x
- sd1x
上の3つになっているはずです。
今回(現在のデータがSDXLの場合)
- sd
- sdpy
- sdil
- sd1x
仕組みを説明すると、sdの中身のフォルダに「sd-wui-zld」のモデルデータのフォルからジャンクションが張ってあります。
ジャンクションのターゲットは動かさずに、「フォルダ名」の方をsdに変更することによって、データフォルダの切り替えを実現しています。
実に単純な方法ですが、こんな方法でもちゃんとデータの切り替えが実現可能です。
そのため「現在のデータフォルダ」のフォルダ名がsdにリネームされます。
つまり、sdに変換され、存在しないものが現在のデータフォルダということになります。
デフォルトではsdxlがsdにリネームされています。
今回から、生成した画像データのフォルダ「outputs」もai_datの中に移動しました。
こちらもちょっと強引な方法で実現しています。
保存場所は「sd\images\outputs」になります。
「\misc\HLCT_r624_default.bat」を管理者権限で実行すると、HIP の中身をデフォルトに戻すことができます。
初回に起動したHIP Lib Customization Toolに関してはメニュー2-2からいつでも起動でき、間違ってインストールした場合でも再度起動して正しいGPU用のライブラリをインストールできます。新しいライブラリをインストールする前にいったん書き換えた部分をすべてを削除してからバックアップを取ったファイルからまっさにな状態にしてインストールしなおしますので、何度選びなおしても大丈夫です。
転売品が横行していますのでご注意ください。転売品は保証が受けられません。
おまけ:
HLCTのメニューと対応GPU、インストールする追加ファイルの内容
MENU No. | GFX No. | 世代 | GPU名 | Aditional Library | MIOpen (cudnn) | hipblaslt (cublaslt) |
1-1 | gfx1201 | RDNA4 | RX 9070/XT | 〇 | 〇 | 〇 |
1-2 | gfx1151 | RDNA3.5 | Radeon 8060S Radeon 8050S | 〇 | 〇 | |
1-3 | gfx1150 | RDNA3.5 | Radeon 890M Radeon 880M | 〇 | 〇 | 〇 |
1-4 | gfx1103 | RDNA3 | Radeon 780M Radeon 760M Radeon 740M | 〇 | 〇 | 〇 |
1-5 | gfx1102 | RDNA3 | Radeon RX7600/XT | 〇 | 〇 | 〇 |
1-5 | gfx1101 | RDNA3 | Radeon RX7700/7800XT | 〇 | 〇 | 〇 |
1-5 | gfx1100 | RDNA3 | Radeon RX7900 GRE/XT/XTX | 〇 | 〇 | 〇 |
1-6 | gfx1036 | RDNA2 | Radeon Graphics 128SP (Ryzen 7000/9000 iGPU) | 〇 | × | × |
1-6 | gfx1035 | RDNA2 | Radeon 680M Radeon 660M | 〇 | × | × |
1-6 | gfx1034 | RDNA2 | RX6500XT RX6400 | 〇 | × | × |
1-7 | gfx1032 | RDNA2 | RX6650XT RX6600/XT | 〇 | 〇 | × |
1-8 | gfx1031 | RDNA2 | RX6750XT RX6700/XT | 〇 | 〇 | × |
2-1 | gfx1030 | RDNA2 | RX6950XT RX6900XT RX6800/XT | 〇 | 〇 | × |
2-2/2-4 | gfx1010 | RDNA1 | RX5700/XT | 〇 | 〇 | × |
2-3 | gfx1011 | RDNA1 | Radeon Pro V540/V520 | 〇 | × | × |
2-3,2-5 | gfx1012 | RDNA1 | Radeon 5500XT Radeon 5300/XT | 〇 | × | × |
2-6 | gfx90c | Enhanced Vega | Ryzen 5000G Ryzen 4000G iGPU | 〇 | × | × |
2-7 | gfx906 | Vega20 | Radeon VII | 〇 | × | × |
2-8 | gfx900 | Vega10 | RX Vega56/64 | 〇 | × | × |
2-8 | gfx803 | Poloris | RX500/400 | 〇 | × | × |
※ RDNA1世代のxnakとは・・・AMD GPU では、マネージド メモリを使用する HIP コードの実行、または統合共有メモリ (USM) を使用する SYCL コードの実行に、XNACK 機能が不可欠です。XNACK がないと、パフォーマンスが最大 4000% 低下する可能性があります。
ZLUDAの機能上の制限について
ZLUDA を使用するアプリケーションの起動は遅いです。
初回起動時に、ZLUDA はアプリケーションの GPU コードをコンパイルする必要があります。
これは 1 回限りのコストで、コンパイルされた GPU コードは Windows では %LOCALAPPDATA% に、Linux では $XDG_CACHE_HOME または $HOME/.cache にキャッシュされます。
一部のアプリケーションでは、使用時に GPU コードを徐々にロードします。
これが望ましくない場合は、環境変数 CUDA_MODULE_LOADING=EAGER を設定してみてください。
アプリケーションのプログラミング方法によって異なりますが、使用されているかどうかに関係なく、起動時にすべてのカーネルを強制的にロード (およびコンパイル) する場合があります。
ZLUDA を実行するアプリケーションは、わずかに異なる値を生成する可能性があります
まず、ZLUDA はカーネル内に存在する浮動小数点の非正規化および丸めモード情報の一部を無視します。
次に、CUDA の特定の近似 (IEEE 754 ではない) NVIDIA 浮動小数点演算では、ZLUDA は近似 AMD 浮動小数点演算を盲目的に使用します。
この 2 つの精度は異なる場合があります。
PyTorch: torch.stft は常に正しい結果を返すとは限りません。
CUDA 12+
CUDA 12 でビルドされ、Thrust を使用しているアプリケーションは、「LLVM エラー: サポートされていない libcall の合法化」でクラッシュします。
これは ROCm/HIP のバグです。現在、CUDA バージョン 12 より前のバージョンでビルドされた CUDA アプリケーションが最もうまく機能します。
CUDA 12 と CUDA 12 より前のバージョンの Thrust でビルドしても機能する可能性があります。
CUDA 12+ 用にビルドされた PyTorch は機能しません。
cuBLASLt
Windows では、AMD がまだ Windows で hipBLASLt をリリースしていないため、cuBLASLt サポートはデフォルトで無効になっています。
ただし、Nightly ZLUDA は、hipBLASLt の非公式ビルドで cuBLASLt をサポートしています。
cuDNN
Windows では、AMD がまだ Windows で MIOpen をリリースしていないため、cuDNN サポートはデフォルトで無効になっています。
ただし、Nightly ZLUDA は、MIOpen の非公式ビルドで cuDNN をサポートしています。
ただし、MIOpen 自体は非常に不安定で不完全であるため、以下に示すようにいくつかの制限があります。
rocMLIR と構成可能なカーネルのない MIOpen のカスタム ビルドはテストのみ。 バグ多数。
システムに統合 AMD GPU と専用 AMD GPU の両方が存在する場合、ZLUDA は統合 GPU を使用します。
これは、基盤となる ROCm/HIP ランタイムのバグです。
統合 GPU を無効にすることで回避できます。
Windows では、環境変数 HIP_VISIBLE_DEVICES=1 を使用するか (詳細はこちら)、デバイス マネージャーでシステム全体で無効にすることをお勧めします。
Linux では、環境変数 ROCR_VISIBLE_DEVICES=<UUID> を使用することをお勧めします。
ここで、<UUID> は、rocminfo コマンドライン ツールによって報告される専用 GPU の UUID です (HIP_VISIBLE_DEVICES=1 を使用することもできますが、これは安定していないようです)。
または、カーネル オプションに pci-stub.ids=<DEVICE_VENDOR>:<DEVICE_CODE> を渡すことで、統合 GPU をシステム全体で無効にすることもできます。
Ubuntu では、/etc/default/grub のオプション GRUB_CMDLINE_LINUX_DEFAULT に追加することで、追加のカーネル オプションを渡すことができます。
lspci -nn を使用すると、<DEVICE_VENDOR>:<DEVICE_CODE> を見つけることができます。
これにより、統合 GPU に一致する行が 1 つある一連の行が生成されます。
たとえば、次のようになります:
1b:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Device [1002:164e] (rev c1)
<DEVICE_VENDOR>:<DEVICE_CODE> ar が最後に追加されます (この場合は 1002:164e)。
ウイルス対策は ZLUDA をマルウェアとしてフラグ付けします。
ZLUDA ランチャー (zluda.exe) は、マルウェアが使用するテクニックの一部を使用しますが、これは正当なものです。
zluda.exe はプロセスをハイジャックし、元の NVIDIA の CUDA ライブラリの使用をすべてリダイレクトして、代わりに ZLUDA の CUDA を使用します。
アンチチートを使用するゲームでは zluda.exe を使用しないでください。
ZLUDA は CUDA ゲーム ワークロード (PhysX または DLSS) をサポートしておらず、アンチチートは zluda.exe をマルウェアまたはチートと誤認する可能性があります。
プリインストールしているStable Diffusion WebUIのExtention(拡張機能)について
Stable Diffusion WebUIのExtentionのインストールは単に.\extenstionフォルダの中に各extentionをgit cloneするだけです。
そのため、インストール過程でgit cloneしておけばいくらでも事前にインストール可能になります。
ただし、やりすぎると起動するのに時間がかかったり思わぬエラーを吐いたりするので注意しましょう。
一応当サイトの事前インストールextentionの吐くエラーは可能なものはすべて潰してあるつもりです。
一応、メニュー1-6の「WebUIアップデート」では、extention内のディレクトリ名を取得してすべてUpdateするようにしてあります。
これは、なぜかWebUI内のUpdateが機能しないことがあったからです。
たまにアップデートをしておいた方がよいでしょう。
※ リンクをクリックすると使い方をGoogleで検索します。
- animatediff
- controlnet
- regional-prompter
- tagcomplete
- easy-prompt-selector
- adetailer
- sd-webui-ar(Aspect Ratio selector)
- multidiffusion-upscaler
- Civitai-Helper
- prompt-all-in-one
- model-toolkit
- images-browser
- canvas-zoom
- openpose-editor(fkunn1326)
- photopea-embed
- Config-Presets
- OneButtonPrompt
- freeu
- localization-ja_JP
- cutoff
- openpose-editor(huchenlei)
- prevent-artifact
- ultimate-upscale
- dynamic-prompts
- sd_katanuki
- wd14-tagger
- dataset-tag-editor
- negpip
ダウンロードするファイル一覧
ダウンロードするデータ群はすべて「生成した画像(コンテンツ)の販売可能」ライセンスから選んでいます。
ただし、個人向けの話であり、法人や組織ではライセンスの内容が変わるケースがありますので注意してください。
リンクから説明欄に飛べますので一通り確認してみてください。使用にあたっては自己責任でお願いします。
SDXL
SDXLは現在の主流のデータ形式
学習済みモデルデータ
SDXL 1.0 ArienMixXL Asian portrait
VAE
Pony(.\ai-dat\sdpy\models\VAE)とIllustrious(.\ai-dat\sdil\models\VAE)にもコピー
embedding
Negative_for_anime shape balance version/v3.0(failed)/v2.0/v1.0
SDXL Negative Embedding by E&D
ImgFixer | Negative TI Pre V0.3/Pre V0.1
bad X (bad sdxl negative embedding)
Aissist XL - Negative Embedding v2.0/v1.0
SDXL General Negative Embedding
LoRA/LyCORIS
ファインチューニングと言われる追加学習を実現するものです。
LCM LoRAとIPAdaptor Face IDは機能性LoRAのためPonyとillustriousでも流用可能
その他のLoRAは使用プロンプトが大きく異なるため流用不可です
基本的に書き込み量を増やす、瞳の書き込み量を増やす、背景のぼかしを除去する、肌の瑞々しさやテカリを調整するLoRAを入れてます。
一般的によく使うものを入れていますが、その他自分の好みで追加してください。
※Pony(.\ai-dat\sdpy\models\Lora)、illustrious(.\ai-dat\sdil\models\Lora)にもコピー
Controlnet IPAdaptor Face ID V2 SDXL LoRA
※Pony(.\ai-dat\sdpy\models\Lora)、illustrious(.\ai-dat\sdil\models\Lora)にもコピー
SPO-SDXL_4k-p_10ep_LoRA_webui
※ 書き込み量を増やすLoRAですが、従来のものとは違う理論で作られています。
詳細は説明ページを参照してください。
DwarfoilXL: Ez oiled Skin and cloth with Really shiny For U XL
Control Net Model
Controlnet model XL
kohya_controllllite_xl_blur.safetensors
kohya_controllllite_xl_blur_anime.safetensors
kohya_controllllite_xl_canny.safetensors
kohya_controllllite_xl_canny_anime.safetensors
kohya_controllllite_xl_depth.safetensors
kohya_controllllite_xl_depth_anime.safetensors
kohya_controllllite_xl_openpose_anime_v2.safetensors
kohya_controllllite_xl_scribble_anime.safetensors
sai_xl_recolor_128lora.safetensors
sai_xl_recolor_256lora.safetensors
t2i-adapter_diffusers_xl_lineart.safetensors
t2i-adapter_diffusers_xl_sketch.safetensors
bdsqlsz_controlllite_xl_canny.safetensors
bdsqlsz_controlllite_xl_depth.safetensors
bdsqlsz_controlllite_xl_dw_openpose.safetensors
bdsqlsz_controlllite_xl_lineart_anime_denoise.safetensors
bdsqlsz_controlllite_xl_mlsd_V2.safetensors
bdsqlsz_controlllite_xl_normal.safetensors
bdsqlsz_controlllite_xl_recolor_luminance.safetensors
bdsqlsz_controlllite_xl_segment_animeface.safetensors
bdsqlsz_controlllite_xl_segment_animeface_V2.safetensors
bdsqlsz_controlllite_xl_sketch.safetensors
bdsqlsz_controlllite_xl_softedge.safetensors
bdsqlsz_controlllite_xl_t2i-adapter_color_shuffle.safetensors
bdsqlsz_controlllite_xl_tile_anime_alpha.safetensors
bdsqlsz_controlllite_xl_tile_anime_beta.safetensors
bdsqlsz_controlllite_xl_tile_realistic.safetensors
ip-adapter-faceid-plusv2_sdxl.bin
※ Pony(.\ai-dat\sdpy\ControlNet)、illustrious(.\ai-dat\sdil\ControlNet)にもコピー
4xUpscaler
4x Ultrasharp / 4x Animesharp
アップスケーラー(高解像度)
Pony(.\ai-dat\sdpy\models\ESRGAN)
illustrious(.\ai-dat\sdil\models\ESRGAN)
SDv1.5(.\ai-dat\sd1x\models\ESRGAN)
にコピー
Pony Diffusion XL
Pony DiffusionはSDXLの亜種。ただし、タグ付けされているワードが全く異なるため、プロンプトノウハウが大きく異なる。
一部を除きSDXLとはembeddings、LoRAには互換性がありません。
アダルト画像に強いが、不得意な画像を生成しようとすると途端に低品質になる。
得手不得手がはっきりしているので人によって好みが分かれると思います。私はSDXLの方が使いやすいです。
学習済みモデルデータ
ChacolRealPonyMixXL (Asian Version)
embeddings
Negative Embeds for Pony XL - PonyXL_NegScore
Negative Embeds for Pony XL - PDXLneg-NoAniPny
Negative Embeds for Pony XL - VDiffPDXL_Neg
Negative Embeds for Pony XL - SFWPnyNegXL
Negative Embeds for Pony XL - PonyXL_NegScore-SAFE
Negative Embeds for Pony XL - PnyXLno3dRLNeg Safetensor
Negative Embeds for Pony XL - PDXLneg-NoAniPny SAFE
Negative Embeds for Pony XL - SFWPnyNegXL-Safetensors
General Negative Embedding PonyXL
DogeNeg - PDXL (negative embedding) DogeNegXL
Comic Aesthetic Positive & Negative Embedding Set PonyXL - ComiAesthNEG-PXL
Comic Aesthetic Positive & Negative Embedding Set PonyXL - ComiAesthPXL
Comic Aesthetic Positive & Negative Embedding Set PonyXL - ComicsAesthetic_PDXL
***
LoRA & LyCORIS
illustrious
版権キャラに強く、キャラの描写は精緻なものの背景は簡素になるSDXLの亜種
こちらもタグ付けが全く違うので一部を除いてembeddingsやLoRAに互換性がありません。
出力結果のほとんどは商用に使えませんので人によっては微妙なモデルデータ群です。
学習済みモデルデータ
Alchemist Mix (Illustrious Realism)
embeddings
Stable_Yogis_Illustrious_Negatives
Stable_Yogis_Illustrious_Positives
Illus Scores IllusP0s/IllusN3g
Illustrious Embeddings - IllustriousQual
Illustrious Embeddings - NeonIlst
Semi-real anime style for WAI-NSFW-illustrious-SDXL Positive_Color/Positive_DoF/Negative
Illustrious Embeddings - Illust_Neg
Watercolor Manga Aesthetic for Illustrious
Illustrious Embeddings - ENDXL_Neg_V2
Illustrious Comic Art Style Aesthetic Embedding Set - ComiAesth_ILLS
Experimental style embeddings for WAI-NSFW-illustrious
Cinematic for XL - Pony - IllustriousXL (embedding) - Illustrious
Manga Aesthetic Embedding for Illustrious
Illustrious Comic Art Style Aesthetic Embedding Set - ComiAesthILLS
LoRA & LyCORIS
Enchanting Eyes (Detailed Eyes)
SD V1.5
既に古くなったバージョンのデータ。
基本的にほぼすべてのデータの更新が終わっており、徐々に使われなくなっていますが、今でも古いGPUなどではある程度の速度で使えるため、根強い人気があります。
学習済みモデルデータ
animefull-final-pruned(Hello Aska Benchmark用モデル)
※ 推奨設定は「.\misc\Hello_Aska_SD15.png」のPNG情報から読み取ってください。
chilled_remix_v2 & chilled_reversemix_v2
VAE
mse840000_klf8anime_klf8anime2.vae.pt
vae-ft-mse-840000-ema-pruned.safetensors
embeddings
veryBadImageNegative v1.3/v1.2-6400/v1.1-6400/v1.0-6400
Async’s Negative V14/V13/V12/V12-linght/V11/V11-linght/V10/V9/V8/V7/V6/V5/V4
bad-picture negative embedding for ChilloutMix
Fast Negative Embedding (+ FastNegativeV2)
BadDream + UnrealisticDream (Negative Embeddings)
Boring_e621 Negative Embedding: Enhance Images Stylistically AND Topically
Negfeet : improve feet quality
LoRA &LyCORIS
SPO-SD-v1-5_4k-p_10ep_LoRA_webui
Controlnet IPAdaptor Face ID V2 SD1.5 LoRA
Intricate Background & Background Blur
Neg4All!Both Positive High quality、Details and Negative worse quality、bad hand in one LoRA!
control_v11e_sd15_ip2p_fp16.safetensors
control_v11e_sd15_shuffle_fp16.safetensor
control_v11f1e_sd15_tile_fp16.safetensors
control_v11f1p_sd15_depth_fp16.safetensors
control_v11p_sd15_canny_fp16.safetensors
control_v11p_sd15_inpaint_fp16.safetensors
control_v11p_sd15_lineart_fp16.safetensors
control_v11p_sd15_mlsd_fp16.safetensors
control_v11p_sd15_normalbae_fp16.safetensors
control_v11p_sd15_openpose_fp16.safetensors
control_v11p_sd15_scribble_fp16.safetensors
control_v11p_sd15_seg_fp16.safetensors
control_v11p_sd15_softedge_fp16.safetensors
control_v11p_sd15s2_lineart_anime_fp16.safetensors
control_v11u_sd15_tile_fp16.safetensors
ip-adapter-faceid-plusv2_sd15.bin
技術的な話・・・など。
私が配布しているスクリプトにはpythonのembeddable版を使用しています。
pythonのポータブル版です。
このポータブル版は「pipが使えない」「venvが使えない」という欠点があります。
※ ほかにも様々な機能が使えません。
pipの有効化
pipに関してはネットにさまざまな情報がありますので比較的簡単にインストールできます。
python embeddableをインストールしたフォルダの中に「python310._pth」というファイルがあります。
これの5行目「#import site」を「import site」に書き換えます。
そのあと、
https://bootstrap.pypa.io/get-pip.py
からpython scriptをダウンロードしてきて実行すればpipがインストールされます。
私の配布している\misc\pre_r624.batのコードの該当部分は
ファイルの書き換え部分
sed -i 's/#import site/import site/g' .\system\python\python310._pth
get-pip.pyのダウンロード部分
curl -LOJ "https://bootstrap.pypa.io/get-pip.py"
pip機能インストールはダウンロードした「get-pip.py」をそのまま実行します。
python get-pip.py
となります。
sedはWindowsの標準のコマンドではなく、minGitに付属しているコマンドです。
minGitをインストールした上でpathが通っていないと使えませんので注意してください。
virtualenvのインストール
さて、python embeddableをインストールしpipも有効化出来ましたが、このままではvenvが使えません。
python embeddableは環境ごとにpipをインストールすることを前提に作られているのでvenvの使用は考えられていないようです。
WebUIによってはvenv必須のものもあるため、困っている方もいるのではないでしょうか?
私も困りました。
いろいろと調べた結果、venvのもとになったvirtualenvというコマンドが現在も存在していることが分かりました。
上の手順でpipをインストールした後
pip install virtualenv
でインストールできます。
使い方は
python -m virtualenv [venv環境名]
です。
venvと違うのはvenv環境を作る上のコマンドだけで後は全く同一となります。
少なくとも私は今まで使用していて一度もvenv環境由来の不具合が起きたことはないです。
事実上のvenvといってもよいと思います。
何かものすごい苦労をしてpython embeddableにvenvと同じような機能を実装している方がいますが、こちらの方がごくわずかな労力で実現できますのでこちらを活用した方が良いと思います。
唯一の欠点は公式のvenvとvenv環境を作るコマンドが違いますので、かならずセットアップの過程でvenvを作成しなくてはなりません。
alias機能などを使って何とかできないかとやってみましたが、無理でした。
各WebUIでは大抵venv環境がなければ自動で作ってくれますが、virtualenvの場合、WebUIをgit gloneしたあとにディレクトリに入り、明示的に上のコマンドでvenv環境を作らなくてはいけません。
venv環境のactivateとdeactivate
venv環境を呼び出すときコマンドを実行すると思いますが、Windows版はactivateとdeactivateはバッチファイルになっているため
venv有効化
call .\venv\Scripts\activate.bat
venv終了
call .\venv\Scripts\deactivate.bat
上のようにcallしないとdeactivateを実行した瞬間にコマンドプロンプトが終了してしまいます。
私も少し悩みましたので、一応書いておきます。
実験環境などを作られている方は活用してみてください。
Python3.10.6の呪い?
Stable diffusion WebUIはpython3.10.6で使うのが良いとされています。
現在python3.10はpython3.10.13まで出て、更新が終了しています。
このうち、python3.10.12とpython3.10.13はソースのみの提供で実行できる形では配布されていません。
実行できる形で配布されているのはpython3.10はpython3.10.11が最後のバージョンになります。
python3.10.6が良いとされていたのは当時のpytorchが3.10.6でビルドされていたからだと思います。
※ ビルドされたpythonと違うバージョンのpythonを使うと警告が表示されることがあります。
その後pytorchも3.10.6以降のpythonでビルドされるようになり、特にこだわる理由はなくなったと思います。
python3.10自体がすでに更新が終わっていますので、現在は最新のpython3.10.11を使うのが正解だと思います。
他の理由をご存じの方がいましたらx.comのわたくしのアカウントまで教えていただけると幸いです。
pipコマンドのキャッシュ機能について
テストなどで何度もインストールと削除を繰り返している方は二度目以降のpip installはキャッシュからインストールしているのをご存じだと思います。
このpip cacheはデフォルトだと
%LocalAppData%\pip\Cache
で保存されています。
しかし、
PIP_CACHE_DIR
を設定することによって任意の位置に移動可能です。
「%LocalAppData%\pip\Cache」だとすべての環境でキャッシュを共有することができて、便利なのですが、ユーザーが意識することがありません。
pip cacheが消費する容量をユーザーが意識できる方が良いと思いますので、わたくしはWebUIのインストールフォルダの中にあえて移動しています。
これだとpython実行環境が複数ある場合、pip cacheの環境をまたいだ共有はできなくなり、容量が無駄になりますのでその旨ご了承ください。
pip cacheをすべて削除したい場合、メニュー1-7からコマンドプロンプトに降りて、「pip cache purge
」ですべてのwheelキャッシュを削除します。
PS.
噂のROCm Windows版が出たらStability MatrixがRadeonに対応し、アナーキー(?)なZLUDAの役割も終わりだと思います。