GPU情報 その他

TenstorrentのBlackholeサーバー、5秒のAI動画を2.4秒で生成——リアルタイムの壁を超えた動画AIデモ

投稿日:

近未来的なAIサーバーラックのコンセプトアート

■事実

今回のデモの概要

最短記録では同条件の5秒動画を2.4秒で生成、「競合比10倍高速」と主張しています。

TenstorrentがEETimes向けのライブデモとして、AI動画生成モデル「Wan2.2-14B」の最適化版を公開しました。

構成はGalaxy サーバー4台、合計256基のBlackholeアクセラレータを使用しています。

デモ結果は720p・81フレーム・40ステップの動画を5秒で生成——生成された動画自体も5秒であり、リアルタイム生成を達成しています。

 

ベースモデル:Wan2.2について

RTX 4090での動作も可能だが、5秒・720p動画の生成に約9分を要する。

Wan2.2はAlibaba(阿里巴巴)のWan-AIチームが2025年7月28日に公開したオープンソースの動画生成モデルです。

Apache 2.0ライセンスで商用利用可能です。

アーキテクチャはMoE(Mixture of Experts)を動画拡散モデルに初めて導入——パラメータ総数約270億だが、1推論ステップあたりの実動作パラメータは約140億です。

 

Tenstorrentが使用した最適化版

今回動かしたWan2.2-14Bの最適化版は、AI推論サービス企業「Prodia」が作成したものです。

Tenstorrent自身の開発ではなく、パートナー企業との最適化成果です。

Blackholeアクセラレータの仕様

プロセス:TSMC 6nm、ダイ面積約600mm²

演算コア:Tensixコア×120基(当初140基から変更)+768基のRISC-Vコア

メモリ:32 GB GDDR6(512 GB/s)

ネットワーク:4×QSFP-DD(800GbE)をカード内蔵——外部スイッチなしにチップ間直結が可能

TDP:300W

単体PCIeカード(p150)の価格:1,399ドル

Galaxyサーバーは32基のBlackholeを4×8メッシュトポロジーで接続する構成

ソフトウェアスタック

完全オープンソースで、TT-Forge(AIコンパイラ)、TT-Metalium(低レベルSDK)、TT-LLK(カーネルソフトウェア)、Apache 2.0ライセンスです。

CUDA非依存——RISC-VアーキテクチャとEthernetでスケーリングする設計思想となります。

スケールアウトはNVLinkやInfiniBandではなく標準Ethernetを採用です。

今後の予定

今回はプレビューであり、次世代クラスタースケールシステムの発表に向けて追加デモを準備中です。

QuietBox 2(Blackhole搭載、4基構成)は2026年Q2に9,999ドルから出荷予定です。

解説

「リアルタイム超え」の意味

映像制作・ゲーム・広告など「出力を待つ時間」がなくなる可能性を示す。

ただし256基のBlackholeを束ねたサーバーシステム(≒相当な規模のインフラ)での達成であり、誰でも手に入る話ではない。

5秒の動画を5秒以内で生成できる=生成速度が再生速度を上回る——動画AIにとって一つの概念的な節目だ。

 

「競合比10倍」とは何を指すのか?

サーバー規模のクラウド推論サービス同士での比較と考えるのが妥当だ。

Tenstorrentのパフォーマンス主張は自社測定値であり、独立検証はまだない。

比較対象が「競合他社の何と比べているのか」を明示していない——RTX 4090での9分と比較すれば「225倍」になるが、そこは言わない。

 

Ethernetスケーリングの意義

256基を束ねるのにベンダー固有のスイッチを必要としない設計は、インフラコストと汎用性の面で差別化要因だ。

ただしNVLinkの帯域(NVL72で最大1.8 TB/s以上)と比べると、Ethernetでの実効帯域は異なる次元の話である。

NVIDIAのNVLinkは専用・高コスト・NVIDIA限定——対してBlackholeは標準Ethernetでチップ間をつなぐ。

 

ProdiaとTenstorrentの関係

今回の主役はTenstorrent単独ではなく、Prodiaによる最適化込みの成果だ。

「ハードウェアの性能+専門チームによるモデル最適化」の組み合わせがあって初めて出た数字——ハードウェアのスペックだけで評価すべきでない。

オープンソース戦略の一貫性

Bolt Graphicsと同じくRISC-Vを採用しているが、Tenstorrentはすでに実製品を出荷して実績を積んでいる点が根本的に異なる。

「Blackholeに吸い込まれて2.4秒で出てくる」——ネーミングセンスは満点である。

Jim Keller率いるTenstorrentは「CUDAモノカルチャーからの脱却」を一貫して主張している。

ソフトウェアスタックをApache 2.0で全公開し、Wan2.2(Alibaba、Apache 2.0)のようなオープンモデルとの親和性も高い。

 

注目すべき次のポイント

今回はプレビューであり、数字の独立検証が今後の焦点だ。

Galaxyサーバーの正式発表・価格・調達性が実用化の鍵である。

Wan2.2のさらなる最適化余地(量子化、バッチ処理など)でどこまで速くなるか。

動画AIが「待つもの」から「即座に出るもの」に変わる日は、少なくともサーバールームの中ではもう来ている。

 

さて、ここからは少し余談だ。

今日は意図的にBolt GraphicsのZeusとtensetorrentのBlackholeという2つの大手ではない会社の製品を取り上げてみた。

そしてtensetorrentは実物のシリコンがあり、販売もしている。

資金調達は12億ドル、Jim Kellerという看板もある。

それでもエンタープライズの本番採用実績はまだない

単に「作る」ことと、「売れるものを作る」ことの間にいかに距離があるのかよくわかる話だろう。

当サイトの読者はこの視点は忘れないでほしい。

-GPU情報, その他
-

Copyright© 自作ユーザーが解説するゲーミングPCガイド , 2026 All Rights Reserved.