NVIDIAがジェネレーティブAIを追加し、2倍の性能向上を実現。
NVIDIAはこのGTC 2024で、TSMCとSynopsysが、High-NA EUVのような最新の最先端チップ製造ツールで製造される2nm以下のトランジスタに移行する際に、チップメーカーが制限を回避するのに役立つ重要なワークロードであるコンピュテーショナル・リソグラフィを高速化するために、同社のcuLithoソフトウェアを製造現場で採用したと発表した。
NVIDIAは、今日のチップ製造に必要な演算性能は、新しいノードが登場するたびに増加しており、350個のH100 GPUを搭載したcuLitho搭載システムが、通常4万個のCPUシステムが最大3000万時間またはそれ以上の計算時間をかけて処理する必要があるワークロードに対して、60倍の性能向上を実現した例を紹介した。
NVIDIAは昨年cuLithoを発表したが、同社は今回、ワークフローにジェネレーティブAIを統合したことで、すでに目覚ましい成果を上げているところをさらに2倍高速化した。
全体として、NVIDIAはcuLithoがあらゆる種類の重いコンピュテーショナル・リソグラフィ・ワークロードに必要な時間を劇的に短縮すると主張しており、シノプシスがこの技術を自社のソフトウェア・ツールに統合したことで、他のチップ・メーカーにも浸透する可能性が高い。
ナノメートルスケールの特徴をチップに印刷するには、フォトマスクと呼ばれる透明な石英の塊が必要だ。
この石英にはチップ設計のパターンが刻印されており、ステンシルのような働きをする。
露光と呼ばれる紫外線をマスクに当てることで、チップ設計をウェハー上にエッチングすることができ、こうして最新のチップを構成する何十億もの3Dトランジスタやワイヤー構造を作り出すことができる。
初期のチップ製造ツールでは、1枚のフォトマスクでウェハ全体を印刷していましたが、新しいチップでは、フォトマスクとレチクルを使ってウェハ上の各ダイを個別に印刷するため、高い解像度が要求されます。
各チップの設計には、チップの設計を層状に構築するために複数回の露光が必要であり、チップ製造プロセスで使用されるフォトマスクの数はチップによって異なり、100枚を超えることもある。
しかし、露光に使用される紫外線の波長よりも微細な印刷機能を持つツールの登場により、新たな問題が浮上してきた。
フィーチャーの縮小が続くと、回折の問題が発生し、シリコン上にプリントされるデザインが本質的に「ぼやける」ようになる。
このような光学的欠陥の問題は、ミラーの曲率、化学的特性、位置のずれなど、さまざまな要因によって発生する。
解像度向上技術(RET)とコンピュテーショナル・リソグラフィーを組み合わせた技術は、複雑な数学的演算を行うことでマスク・レイアウトを最適化し、チップメーカーが以前よりも高い解像度を達成できるように光を曲げることで、鮮明度の問題に対処します。
しかし、この作業は、機能がさらに縮小し、各設計に何十億ものトランジスタが追加されるにつれて、ますます計算負荷が高くなり、新世代のチップごとに増大する計算負荷を生み出している。
この問題に対処する鍵は、これまで以上に洗練されたマスクを作成することにあるが、マスクは非常に複雑である。
例えば、インテルによれば、マスク1枚あたり5ペタバイトという驚異的なデータ量に相当し、これはIMAX映画の10倍のデータ量に相当する。
高NA EUVと、曲線マスクを採用するインバース・リソグラフィー技術(ILT)のような新しい技術は、今後数年間でマスクのデータ処理量を10倍に増やすと予想されている。
マスク作成ツールの新しいクラスであるマルチビームライターの登場は、マスク作成プロセスをより細かく制御することを可能にし、曲線マスクに見られるようなはるかに複雑なデザインを可能にした。
しかし、これにはより強力な計算が必要となる。NVIDIAのcuLithoは、計算リソグラフィの作業負荷をGPUに移行し、同社のソフトウェア・ライブラリを通じて、任意の作業負荷を完了するのに必要な時間を短縮するように設計されている。
cuLithoライブラリは、ILT(曲線形状)、Optical Proximity Correction(OCP、「マンハッタン」形状を使用)、Source Mask Optimization(SMO)を使用してマスクを設計するコンピューテーショナルリソグラフィソフトウェアに統合することができる。
cuLithoがジェネレーティブAIを採用し、実稼働に移行した現在、NVIDIAはテスト結果を共有しており、マンハッタンワークロードでは58倍、曲線マスク設計では45倍、Nvopcワークロードでは40倍の速度向上が確認されている。
TSMCのCEOであるC.C.Wei博士は次のように述べています。
「TSMCのワークフローにGPUアクセラレーテッド・コンピューティングを統合するためのNVIDIAとの取り組みは、性能の飛躍的な向上、劇的なスループットの改善、サイクルタイムの短縮、および電力要件の削減をもたらしました。我々はNVIDIA cuLithoをTSMCでの生産に移し、このコンピュテーショナル・リソグラフィ・テクノロジを活用して、半導体の微細化に不可欠な要素を推進しています。」
シノプシスの社長兼CEO Sassine Ghaziは、次のように述べている。
「シノプシスには、これまで解決できなかった課題を解決するためにエンジニアリング・チームを支援してきた歴史があり、今回、AIとアクセラレーテッド・コンピューティングのパワーを活用することで、それを次のレベルに引き上げようとしています。」
シノプシスとTSMCはcuLithoを採用した最初の企業であるが、他のEDA企業やチップ製造企業もマスク製造業務にこのソフトウェアを採用することができるため、省電力とコスト削減を実現しながら、新しいマスクの製造に要する時間を改善することができる。
解説:
先にお断りしておきますが、40倍、58倍など景気の良い数字が並んでいますが、これはマスクパターンを処理する時間であり、出来上がる半導体の性能がそれだけ上がるわけではありません。
わたくしもこの話を聞いたとき、「高々半導体の配線パターンだろう」と思っていましたが、なんとマスク1枚当たり5ペタバイトという莫大な情報量だそうで、これだけ情報量が多ければそりゃ時間がかかるよなと感じました。
ちなみに、ペタバイト(PB)はなじみの無い単位ですが、テラバイト(TB)の次の単位で1PB=1000TBです。
※ 念のためにお断りしておきますが、1024単位の桁上がりの場合、表記上はTiB(ティビバイト)、PiB(ピビバイト?)が正しいです。
今我々が個人で所有できるストレージの容量をはるかに超える容量のデータ処理というとですから、GPUを使って高速に処理することは理にかなっていると思います。
生成AIの得意とするところの一つとして画像処理がありますが、世界最先端のAI/ML企業であるNVIDIAの面目躍如といったところでしょう。
具体的な説明がありませんが、冒頭にもこうあります。
NVIDIAがジェネレーティブAIを追加し、2倍の性能向上を実現。
わたくしも含めて、PCマニアが気になるこのツールを使ってどのくらい半導体の性能が向上するかは上の通り、2倍程度なのでしょう。
というわけで、説明がなさすぎにちょっとわかりにくいですが、40-60倍弱の半導体設計能力向上と2倍の半導体性能向上をもたらすということでFAだと思います。
間違いがあったら私的してください。
一桁ナノメートル時代に入ってもはやマスク1枚当たりのデータ量が5PBというのは驚き以外の何物でもありません。
今後も飛躍的に向上していくのでしょうから、AIによるアシストは必須になっていくのでしょう。