AMD、XDNA 2 AI NPU向けに設計された世界初のBF16 NPUモデル「SD 3 Medium」を発表。

AMDは、XDNA 2 NPU向けに世界初のBF16 NPUモデル「SD 3 Medium」を発表しました。

このモデルは、テキストから画像への高速かつ妥協のない生成を実現します。

AMDのSD 3 Mediumは、XDNA 2「AI」NPU向けに最適化されたBF16モデルで、Amuse 3.1で試用可能です。

プレスリリース：Computex 2024において、AMDは世界初のブロックFP16安定拡散モデル「SDXL Turbo」を発表しました。

この画期的なモデルは、FP16の精度とINT8の性能を兼ね備えており、AMDとStability AIの共同開発によるものです。

AMDはStability AIとの新たなコラボレーションを発表できることを誇りに思います。

世界初のブロックFP16 SD 3.0 Mediumモデルは、画質を大幅に向上させ、AMD Ryzen AI XDNA 2 NPU向けに最適化されています。

そして何より、TensorstackのAmuse 3.1をダウンロードし、対応するRyzen AI搭載ノートPCでHQモードで実行すれば、今すぐお試しいただけます。

以下の3つの簡単な手順で、24GB以上のメモリを搭載したAMD Ryzen AI 300シリーズまたはRyzen AI MAX+搭載ノートPCで、SD 3.0 Medium（BF16精度）を今すぐお試しください。

SD3 Medium（NPU）ハードウェア要件：50TOPS以上のAMD XDNA 2 NPUと24GB以上のシステムRAMを搭載したAMD Ryzen AI 300シリーズまたはRyzen AI MAX+搭載ノートPC。

AMD XDNA 2 NPU向けに設計された最初のBlock FP16 SD 3 Mediumモデルは、Stable Diffusion 3 Mediumのメモリ要件も削減されており、24GBのノートPCでもわずか9GBのメモリ消費で動作します。

このデータタイプを使用することで、32GB未満のメモリを搭載したノートPCでも、高精度フォーマットで過剰な量子化なしに、高品質なローカルAI画像生成が可能になります。

さらに、AMD XDNA 2 NPU を搭載した 2 段階パイプラインにより、SD 3 Medium モデルの出力 2 MP (1024×1024) イメージが 4MP 解像度 (2048×2048) に拡張され、外出先でも仕様に合わせた印刷品質のイメージを提供します。

サブスクリプション料金*やWi-Fi不要で、ストック品質の画像を作成できます。

AMD Ryzen AI搭載PCなら、グラフィックデザインのニーズに応えるストック画像として使用できる高品質な画像を作成できます。

さらに、ストック画像をブランドに合わせてカスタマイズできるため、迅速なデザインイテレーションとマーケティングアセットのスピーディーな作成が可能になります。

例えば、以下は「NPU」ブランドの仮想的な例です。

常に変化し、要求が厳しくなる生成 AI ワークロードに対応できる AI PC を持つことは優れたパートナーであり、AMD XDNA 2 NPU は電力効率を維持しながら AI 操作に優れているため、電源に接続しているときでも高度 30,000 フィートにいても、最高のパフォーマンスを発揮できます。

解説：

Amuse3.1がSD3 mediumに対応。

SD3はSDXLの上位の高画質モデルということになります。

SD3はmidiumのほかlarge、large turbo、Stable Imager Ultraがあります。

それぞれパラメーター数などが違っています。

SD3は初期のライセンスの不透明さから一般のモデルデータ作成者から嫌われて、後発のFlux.1にメジャーローカル画像生成AIとしての座を奪われてしまいました。

今日現在のCivitAIに登録されているモデルデータの数を参考までに記載しておきます。

※ 検索ワードを入れないと数が出ないためそれぞれ「SD3」と「Flux.1」で検索

とまったく勝負にならない結果になっています。

amuse3.1のようなどちらかといえば用途のはっきり決まったソフトウェアだと提供元とのライセンスが重視され、人気があるかどうか、多様性のあるデータがあるかどうかというのは重視されません。

そのため、本気度が高いユーザーであればあるほどあまり魅力的に映らないということになります。

日本でローカル生成AIを使おうとするならば最も需要が高いのはアジア人の女性の画像を生成する用途でしょう。

その場合、満足度の高い結果になるのはFlux.1の方でしょう。

Amuseは私の目には余り魅力的に映りませんが、多くのユーザーがライトに使うには十分な性能があると思います。

Windowsで生成する結果としてはNPUが十分に使えるということになるのでしょう。

しかし、可能ならば、広く流通しているデータを使えるようになるよう、pytorchやtensorflowなどが使えるようになってほしいものです。

モデルデータは100万円以上するAIアクセラレーターを数本使って2週間なり1か月なり作成するのにかかります。

ぶら下げるPCもワークステーションクラスのものが必要でしょう。

そうして多大な手間と電気代を使った貴重なモデルデータを無償で公開してくれているわけですから、できるだけこうした草の根の活動をしている方に避けられるような妙な制限はつけてほしくないところです。