今回はStable Diffusion WebUIのモデルデータについての話です。
モデルデータとは
モデルデータとはStable Dussusion WebUIの使用において必須のものです。
正式名称は「学習済みモデルデータ」でどのようなモデルデータを使うかによってどのような画像が生成されるかが決まります。
ゲーム機で言えば、本体がStable Dussusion WebUIで、カセットが「学習済みモデルデータ」のようなイメージになります。
そう、カセットが無いとゲームが遊べません。
つまり「学習済みモデルデータ」が無いと画像が生成できないということになります。
モデルデータは作者様の考えによって商用利用可能かどうかの判断が分かれます。
今回は商業利用可能なもののみを少尉します。
※ 調査は十分にしておりますが、ライセンスの解釈について「間違っているよ」と言うご意見はメールフォームでいただければ幸いです。
モデルデータは2GB弱から8GB弱程度の容量です。
モデルデータは全てオンメモリに収める必要があり、最低でもGPUのメモリは10GB以上無くては画像生成するのに苦しいと言われているのはそのためです。
「学習済みモデルデータ」は現時点ではほとんどが無料で公開されています。
しかし、私は将来的には有料になると考えています。
モデルデータを作るのには非常に手間がかかります。
また、画像の学習においては(恐らくは)ネットの画像を無断で使用していると言われていますので著作権上非常に問題があると言われており、そう言った問題を解決するためにも徐々に受益者負担をする必要が出てくるのではないかと私は考えています。
\StableDiffusionwebUIのインストールフォルダ\models\Stable-diffusion
上がモデルデータの保存先になります。
VAEとは
モデルデータを単体で使うと彩度が失われた状態で画像が生成されることがあります。
VAE無し
VAE有り
このような場合、VAEを使うことによって普通の美しい画像を生成することが出来るようになります。
モデルデータによってはVAEが必要ない(最初から含まれている)ものもありますが、現在のところ大抵はVAEが必要になります。
\StableDiffusionwebUIのインストールフォルダ\models\VAE
上がVAEの保存先になります。
モデルデータとワンセットなので、今回は一緒に取り扱いします。
正直、私がやらなくても素晴らしい内容の記事がネット上には溢れているのですが、1点だけどうしても「これはどうか?」と思う点がありましたので、そこをこの記事で解消していきたいと思います。
まずは普通にモデルデータの紹介をしていきます。
chilled-remix V2
- 商用利用可能(生成した画像の販売OK)
リアル系で最も有名だったモデルChiloutmixが公開停止の後、商用利用不可になりましたので、その後継と目されるモデル。
chilloutmixとよく似た画像を生成するモデルです。
余談ですが、chilloutmixやbasil mixなど各著名モデルのライセンス変更があって、将来的には無料で商用利用できるモデルは無くなるかもしれないなと感じさせる出来事でした。
ツイッターの意見を見ていると、「AIで生成した画像にも著作権が発生するのではないか」という議論をしている人がいますが、少し能天気すぎるのではないでしょうか?
chilloutmixも有名なマージモデルですが、マージモデルは元になっているモデルがライセンスの変更をすると否でも引っ張られますので、マージしているモデルが多ければ多いほどリスクが高いということになります。
将来的には受益者負担を嫌がる人は収益化が出来なくなる、そう言う世界が来るて思います。
無料でモデルが使えるのは黎明期である今だけだと思います。
モデルカードの引用
私も最初は真面目に読んでませんでしたが、超重要であり、恐らく多くの人に知れ渡った方が良いことだと思いますので、丸々引用します。
【告知】
chilled_remix及びreversemixは2023年5月21日にVersion変更を行い、v2へ移行いたしました。
伴いv1は削除致しました。なお既にDL済みの方は引き続き、v1をご利用いただくことは問題ございません。License:CreativeML Open RAIL-M
Additional Copyright: sazyou_roukaku (TwitterID @sazyou_roukaku) as of May 21, 2023このモデルは『CreativeML Open RAIL-M』でLicenseそのものに変更はありません。
しかし追加著作者として鎖城郎郭の名前が追加されています。
なお『CreativeML Open RAIL-M』に記載されている通り、
本モデルを使用しての生成物に関してはLicenseの使用制限Aの事例を除き、当方は一切関与致しません。
犯罪目的利用や医療用画像など特定専門的な用途での利用は使用制限Aで禁止されています。
必ず確認しご利用ください。
また当方は一切責任を持ちません。免責されていることをご了承の上、ご使用ください。制限
OK
著作者表記を入れずにモデルを使用する
Use the model without crediting the creatorOK
このモデルで生成した画像を商用利用する
Sell images they generateOK
商用画像生成サービスに、このモデルを使用する
Run on services that generate images for moneyOK
このモデルを使用したマージモデルを共有・配布する
Share merges using this modelOK
このモデル、または派生モデルを販売する
Sell this model or merges using this modelOK
このモデルをマージしたモデルに異なる権限を設定する
Have different permissions when sharing mergesなお、上記のモデルそのものの販売や商用画像生成サービスへの利用は、
『CreativeML Open RAIL-M』のLicense上、使用制限Aに追記記載しない限り、
制限することが本来できない為、マージ者への負担も考慮し、civitai制限表記上OKとしているだけであり、
積極的な推奨は行っておらず、またそれにより何らかの問題が生じても当方は一切責任を持ちません。
その点、ご留意いただくようお願いいたします。推奨設定・モデルの違い・プロンプト
Version2はfp16でVAE焼き込み版のみ配布といたしました。
基本的にはchilled_remixをメインとし、好みに合わせてreversemixも検討というのがスタンスです。
※chilled_remixはchilled_re-genericユーザーをある騒動での混乱から守るために生み出されたモデルです。
性質上全てのユーザー出力に対応できなかった為、サブとしてreversemixが作られました。
reversemixはLORAなしでも顔のセミリアル感は薄いですが、全体的に幼くなる傾向があります。chilled_remixはLORA愛用者の多いchilled_re-genericユーザー向けに生み出された為、
顔はLORAを使うとリアル感が一定になるよう設計されています。
プロンプトだけでもリアル化は可能ですが、LORAを少し使ってリアル化したほうが簡単です。CLIP設定:clip skip:2を推奨。
badhand系のnegativeTI無し、手系のネガティブも入れない出力と、
badhand系のnegativeTIを使った場合、正直大差ない感覚があります。
お好みでご利用ください。自然言語的な文章プロンプトにかなり強いですが、シチュエーション以外の詳しい顔造形などは、
好みに合わせてワードプロンプトで指定するのが私のスタイルです。
ワードだけ構成でも問題があるわけではないので使いやすいスタイルで使ってください。クオリティプロンプトは、high qualityなどは有効性を感じていません。
masterpieceは顔造形が変化する感覚ありますが、クオリティアップとしては微妙です。ただhigh resolutionは背景や質感に効果あります。high res、Hiresなど色々ありますが、
一番high resolutionを信頼しています。私が必ず入れるプロンプト
(symmetrical clear eyes:1.3)は絶対入れてます。 目の色等や他の追加と合わせて分割したりもしますが、このプロンプト自体は入れるのをデフォルトとしています。愛用ネガティブプロンプトベース
nipple,(manicure:1.2),(worst quality:2),(low quality:2),(long neck:2),(undressing:1.5),
マージ利用モデル一覧
real-max-v3.4
(https://civitai.com/models/60188/real-max-v34) ©dawn6666
fantasticmix_v10(旧モデル名fantasticmixReal_v10)
(https://civitai.com/models/22402/fantasticmixreal) ©michindreamshaper_5Bakedvae
(https://civitai.com/models/4384/dreamshaper) ©Lykon
epicrealism_newAge
(https://civitai.com/models/25694) ©epinikion
diamondCoalMix_diamondCoalv2
(https://civitai.com/models/41415) ©EnthusiastAIFAQ
Q1:何故v2を公開し、v1の配布を中止したのか
A2:
v1は元々マージ後も制限変更を禁止する表記になっているモデル(realbiter_v10)を使用していた為、
NG:Have different permissions when sharing mergesというcivitai制限を継承していました。
これは制限を追加することも解除することも不可という意味に取れます。一方でその他は全てOKでした。
つまり例えば
NG:Sell this model or merges using this model
NG:Have different permissions when sharing merges
こういうモデルとマージした時に制限の矛盾が発生し、理屈上公開不可という問題がありました。マージをする者にとってこれは非常に厄介な制限で、また『CreativeML Open RAIL-M』にある
Licenseを逸脱しない範囲であれば制限等を追加することができるという文言にも抵触しています。
これが非常に気持ち悪く、嫌でした。
今回はその制限を解除する為のVersionアップです。v1の配布中止は、制限が異なる為、ややこしくトラブルの原因となる可能性がある点。
また『CreativeML Open RAIL-M』には
『更新に伴い、基本的に使用者は最新版を使う努力をすること』 の文面があります。
権利者は最新版を使わせるようにする権利を持ち、使用者は努力義務があるという内容です。
ただし私はこの権利を行使致しませんので引き続きv1をお使いいただくことは問題ありません。
しなしながらこの文面があるのに旧版を公開し続けるのは合理性に欠けることもあり、
誠に勝手ながら公開終了とさせていただきました。
ご理解のほどよろしくお願いいたします。なおv1の再配布等は『CreativeML Open RAIL-M』に準拠致します。
Q2:今回の制限に問題や矛盾はないのか。
A2:fantasticmix_v10、diamondCoalMix_diamondCoalv2、dreamshaper_5Bakedvaeは
OK:Have different permissions when sharing mergesとなっており解除可能。
epicrealism_newAgeとreal-max-v3.4は制限なしの為、今回全て制限なしとし公開しております。なおマージ利用モデル側にLicense変更・制限変更等が生じた際も
5/17時点のLicenseや制限を前提として公開している為、creativeml-openrail-mに準じます。 こちらはMergeModel_LicenseSS_v2に該当モデルのSSを保管しております。なおマージ利用モデル側に重大な問題が発生した場合は、モデルの公開停止を行い、
利用停止を呼びかける可能性はありますが、当方側を理由とした追加制限を設けることは致しません。
説明書きはあまり詳しく書いてありませんが、基本的にはVAE込みなのだと思います。
BRA(Beautiful Realistic Asians) V5
- 商用利用可能(生成した画像の販売OK)
こちらも非常に著名なモデルです。
アジア人の美しい女性の画像が生成できます。
chilled-remixが2.8次元くらいだとするとこちらはキッチリ3次元と言う感じの画像を生成してくれます。
私はどちらかと言うとchilled-remixの方が好きですが、BRAV4も非常に素晴らしい画像を生成してくれるモデルだと思います。
甲乙つけがたく、どちらが優れているかというよりどっちが好みかと言うレベルだと思います。
ライセンスはDreamlike License1.0に感染している疑いがありますので、10人以上のチームでは商用利用が不可の可能性があります。
私は全く関係ありませんが、該当する人は注意してください。
説明の引用
誰が私のモデルの名前を変えたのかわからないが、ちょっと変な感じだ。
https://Ko-fi.com/bankaiplease
私を応援してくれる方、他のモデルやBRAv6のトレーニングのためのgpu費用をサポートしてくれる方はこちらでサポートお願いします。
技術的には革命的な要素を含んでいるようですが、私には全くわかりません。
以前はもっときちんと説明書きがあったのですが、何か説明書きが非常に簡素になってしまっています。
VAEは必要なしと言うことでよいのだと思います。
7th_test_jp
- 商用利用の可否不明
LisenseがOthersとなっているのですが、どこかで商用利用可能であるという情報を見たような気がしますので一応上げておきます。
もしライセンスの形態をご存知の方がいたら教えてください。
説明はどのような画像が生成されるかの比較表が載っている以外には不明です。
こちらもchilloutmixが商用利用不可になった後に出た後継モデルと言う位置づけです。
更新はchilled_remixの方が活発なので、ライセンスがよくわからないこともあって、比較のためにちょっと見てみるくらいがいいかもしれません。
VAEは「vae-ft-mse-840000-ema-pruned.safetensors」を使用します。
VAE
vae-ft-mse-840000-ema-pruned.safetensors
Stable Diffusion公式が作ったVAEで、多くのモデルに適用することができます。
現時点で必要なかったとしてもダウンロードしておいて損はありません。
ダウンロードファイルとハッシュ
学習済みモデルデータは中に悪意のあるプログラムが仕込まれていることがあるそうですので、アップロードされているファイルが悪意あるものに書き換えられていないかどうかはきちんとチェックする必要があります。
ファイルの同一性を確認する仕組みとしてあるのがハッシュです。
ハッシュはハッシュ関数と言う関数を用いて計算したファイルごとに違った数値です。
このハッシュを比較することによってファイルが同じものであるかどうかをチェックすることができます。
今回、この記事でハッシュ・チェッカー・スクリプトを配布いたします。
実際、こんな記事を書かなくてももっとわかりやすく、詳しくモデルデータの紹介をしている記事は他サイトさんでも沢山あるのですが、どこもハッシュをチェックする仕組みを提供していなかったので、ここで提供しようと思います。
ハッシュ値の算出はOSが標準で持っている機能のため、私の知る限りでは(多分当たり前すぎて)2値のチェックをするような気の利いたフリーソフトは見たことがありません。
バッチファイルでも非常に簡単に作成できるのですが、初心者の方では無理でしょう。
恐らく、初心者の方は目視で確認をしていると思うのですが、パソコンを使っていてハッシュ値の比較を目視でやるのはあまりに惨めですしナンセンスだと思いますので、必要ないかなとも思ったのですが、念のために配布することとしました。
イラストAIは初心者に厳しい世界だなあと思いつつ、解説します。
上のファイルをダウンロードしてください。
使い方
使い方はとても簡単です。
上でダウンロードしたスクリプトの上にハッシュをチェックしたいファイルをドラッグして落とします。
上の画像のような画面が出ます。
「入力してください:」と表示されたら、ハッシュ値をコピーしてから右クリックしてください。(コマンドブロンプのペーストは右クリックオンリーです。)
コピペしてから「ENTER」キーを押すと一致していた場合、「ハッシュ値が一致しました」と表示されます。
一致していなかった場合「ハッシュ値が一致しませんでした。」と表示されます。
なお、このスクリプトではハッシュ値は英字の大文字小文字は関係ありません。
たったこれだけの非常に簡素な作りになっています。
簡単なだけにわかりやすいのではないかと思います。
「続行するには何かキーを押してください」と表示されたら何かキーをおしてください。
黒い画面(コマンドプロンプト)が閉じます。
コピペするハッシュ値の確認方法
HugungFaceの場合
ここでは「7th_test_jp」の「7th_ralJP_A.safetensors」を例にして説明します。
赤線の部分をクリックします。
上の画像のように表示されますので、
1.でファイルをダウンロード
2.の部分がハッシュになります。
ダウンロードした後にコピペしておきましょう。
CIVITAIの場合
ダウンロード
ダウンロードはモデルデータページの右側の上の画像のような部分がありますので、赤線で囲った部分をクリックしてください。
ハッシュ値のコピー
上の画像の赤線で囲った「>」の部分を一回クリックしてください。
すると上の画像のように「AUTOV2」から「SHA256」に変わりますので、赤線で囲った部分を左クリックするとハッシュ値がコピーされます。
以上です。