Animaの本環境が出ましたので、4月27〜28日頃にリリースされたZ-Animeと比較してみました。
※ Z-Animeはオフィシャルモデルではなく、コミュニティモデルです。
アーキテクチャ・モデル本体
| 項目 | Anima v1.0 | Z-Anime |
|---|---|---|
| パラメータ数 | 2B | 6B |
| ベースモデル | NVIDIA Cosmos-Predict2-2B | Alibaba Z-Image Base (S3-DiT) |
| 本体サイズ(BF16) | 4.18 GB | 12.3 GB |
| 本体サイズ(FP8) | — | 6.15 GB |
| GGUF Q8_0 | — | 6.73 GB |
| GGUF Q4_K_S | — | 4.2 GB |
| Distillation版 | なし(Turbo LoRAで代替) | 4-step / 8-step あり |
テキストエンコーダー
| 項目 | Anima v1.0 | Z-Anime |
|---|---|---|
| TEモデル | Qwen 3 0.6B(qwen_3_06b_base.safetensors) |
Qwen 3 4B(qwen_3_4b-bf16.safetensors / FP8版あり) |
| 代替TE | なし | Engineer V4(BennyDaBall製、多様性が増す) |
| VAE | qwen_image_vae.safetensors |
ae.safetensors |
| AIOファイル(全込み) | なし | あり(BF16/FP8×3バリアント) |
TEの差が大きいのが特徴で、AnimaのQwen 3 0.6Bは軽量、Z-AnimeのQwen 3 4Bはかなり重い分、プロンプト理解力に差が出やすいです。
必要スペック・推奨設定
| 項目 | Anima v1.0 | Z-Anime |
|---|---|---|
| 最低VRAM | 8GB | 8GB |
| 推奨解像度 | ~1MP(1024×1024等) | 832×1216 / 1024×1024 / 最大2048×2048 |
| ステップ数 | 30〜50、CFG 4〜5 | Base: 28〜50、CFG 3〜5 / Distill-8: 8step CFG1.0 / Distill-4: 4step CFG1.0 |
| プロンプト形式 | Danbooruタグ+自然言語混在 | 自然言語推奨(タグ羅列は非推奨) |
ライセンス・その他
| 項目 | Anima v1.0 | Z-Anime |
|---|---|---|
| ライセンス | 非商用限定(CircleStone + NVIDIA) | Apache 2.0(商用可) |
| ComfyUIサポート | ネイティブ対応 | 対応 |
| Diffusers対応 | △(DiffSynth経由) | ◎(from_pretrained()対応) |
確認できたファイルサイズを整理します。
Z-AnimeのTE(Qwen 3 4B)は BF16が8.04GB、FP8が4.02GB。
これを踏まえてまとめます。
ファイルサイズ一覧
| ファイル | サイズ |
|---|---|
| Anima 拡散モデル(BF16のみ) | 4.18 GB |
| Anima TE(Qwen 3 0.6B) | ~1 GB未満 |
| Z-Anime 拡散モデル BF16 | 12.3 GB |
| Z-Anime 拡散モデル FP8 | 6.15 GB |
| Z-Anime GGUF Q8_0 | 6.73 GB |
| Z-Anime GGUF Q4_K_S | 4.2 GB |
| Z-Anime TE BF16(Qwen 3 4B) | 8.04 GB |
| Z-Anime TE FP8(Qwen 3 4B) | 4.02 GB |
※ ComfyUIはTE処理後にTEをオフロードしてから拡散モデルをロードするため、ピーク VRAM ≒ max(TE, 拡散モデル) で考えます。
VRAM別推奨構成
Anima v1.0(現時点でBF16のみ存在、FP8・GGUFなし)
| VRAM | 構成 | 評価 |
|---|---|---|
| 16GB | BF16(4.18GB)+ TE 0.6B | ✅ 余裕 |
| 12GB | BF16(4.18GB)+ TE 0.6B | ✅ 余裕 |
| 10GB | BF16(4.18GB)+ TE 0.6B | ✅ 余裕 |
| 8GB | BF16(4.18GB)+ TE 0.6B | ✅ 余裕 |
Animaはどの環境でもBF16そのまま動く。FP8・GGUFは不要。
Z-Anime
| VRAM | 拡散モデル | TE | GGUF | 評価 |
|---|---|---|---|---|
| 16GB | BF16(12.3GB) | FP8(4.02GB) | 不要 | ✅ TE FP8+BF16で合計ピーク12.3GB → OK |
| 16GB | BF16(12.3GB) | BF16(8.04GB) | 不要 | ⚠️ 同時ロードは不可、ComfyUIの順次オフロードで動く可能性あり |
| 12GB | FP8(6.15GB) | FP8(4.02GB) | 不要 | ✅ ピーク6.15GB → 安定 |
| 12GB | BF16(12.3GB) | FP8(4.02GB) | 不要 | ⚠️ ギリギリ、オフロード依存 |
| 10GB | FP8(6.15GB) | FP8(4.02GB) | 不要 | ✅ ピーク6.15GB → OK |
| 8GB | ~~FP8(6.15GB)~~ | FP8(4.02GB) | Q4_K_S(4.2GB)推奨 | ⚠️ FP8はオフロード必須で低速。GGUFならピーク4.2GBで安定 |
まとめ
- Anima:どの環境でもBF16一択、FP8・GGUFは存在しない
- Z-Anime 16GB:拡散モデルはBF16でOK、TE はFP8(4.02GB)を選ぶのが現実的
- Z-Anime 12GB・10GB:拡散モデルを**FP8(6.15GB)**に落とす、TE FP8とセットで安定動作
- Z-Anime 8GB:GGUFのQ4_K_S(4.2GB)が最も安全。TE FP8(4.02GB)との合計でも順次オフロードで動作可能
- どちらもSDXLの後継を狙っているプラットフォームではあるが、FP8迄使うことを考えるとZ-Animeでもほとんど影響がないと考えてよい。
- 8GBのGPUを使うならAnima一択だろう。
Huggingfaceオフィシャルページ
- Anima v1.0:https://huggingface.co/circlestone-labs/Anima
- Z-Anime:https://huggingface.co/SeeSee21/Z-Anime