NVIDIAは、NVIDIAの次世代GPUアーキテクチャ、ARM Hercules CPUコア、および多くのAIパフォーマンスを搭載したチップであるOrin SOCを搭載した最新のDRIVE AGX Orinプラットフォームを発表しました。
このプラットフォームは、自動運転車とロボットを対象としており、DRIVE Pegasusボードよりもはるかに優れたパフォーマンスと効率を提供するはずです。
NVIDIAの次世代GPUアーキテクチャとARM HerculesコアがThe Orin SOCをDRIVE AGX Orinとして紹介
プラットフォームは、Drive PX Pegasusに代わる次世代のOrin SOCで構成されています。
Drive PX Pegasusボードは、複数のXavier SOCとTuring GPUで構成され、500 Wで320のTOPを備えていました。
単一のOrin SOCは、1つのチップで200 TOPのパフォーマンスを実現することを目指しており、170億個もの巨大なトランジスタを搭載し、NVIDIAのXavier SOCの約7倍のパフォーマンスを実現しています。
比較のために、現在生産されている最大の消費者グレードGPU、Volta GV100、およびTuring TU102のトランジスタ数は、それぞれ211億および186億です。
NVIDIAは、Orin SOCでどの次世代GPUを使用しているかを明確に述べていません
ただし、NVIDIAのAmpere GPUは、来年の発売が予定されており、12nmより進んだプロセスノードを搭載し、VoltaからTuringへのアップグレードよりもはるかに大きなアーキテクチャアップグレードを提供します。
Xavier SOCは、Volta GPUを公表した最初の発表された製品でもあるため、後継のOrinが次世代Ampere GPUで発表された最初の製品になることは驚くことではありません。
Xavierは、16nmダイに合計70億個のトランジスタと8個のカスタムARM64コアを搭載しました。
Orin SOCは、Xavierよりもはるかに高密度のチップであり、12nmの縮小ではなく、トランジスタ密度の大幅な向上を可能にする7nm(EUV)部品であることを確認しています。
ARMはロードマップで、Hercules CPUは7nmまたは5nmプロセスで作成できることを示しており、NVIDIAにOrin SOCの構築に必要な柔軟性を与えています。
Herculesコアは、Deimos 7nmコアよりも10%高速であるとも述べられています。
NVIDIAの創設者兼CEOであるジェンセン・ヒュー(Jensen Huang)は、次のように述べています。
「自動運転車を提供するために必要な投資量は飛躍的に増加し、タスクの複雑さは、Orinのようなスケーラブルでプログラム可能なソフトウェア定義のAIプラットフォームを必要とします。」
「革新的なエンドツーエンドのプラットフォームとツールとともに、輸送業界へのNVIDIAの長期的なコミットメントにより、広大なエコシステムが実現しました。AVに取り組んでいるほぼすべての企業は、計算スタックでNVIDIAを利用しています」とNavigant Researchの主任研究アナリストであるSam Abuelsamid氏は述べています。
「Orinは、この進化し続けるテクノロジーストーリーの次の素晴らしい章を実現するのに役立つはずです。」
NVIDIAより
NVIDIAは、DRIVE AGX Orinはレベル2およびレベル5の自動運転車と互換性があり、拡張可能であると述べています。
また、ISO 26262 ASIL-Dなどの体系的な安全基準を達成しながら、多数のアプリケーションとDNN / AIワークロードを処理するように設計されています。
それ以前のXavierと同様に、Orin SOCは、発表から1年後の2022年に生産される車両に搭載される予定です。
これは、Orinの生産がそれより早く、より可能性の高い2021年後半に開始されることを意味します。
NVIDIA Drive PX世代の比較:
製品名 | NVIDIA Drive PX | NVIDIA Drive PX 2 | NVIDIA Drive Xavier | NVIDIA Drive Pegasus | NVIDIA Drive AGX Orin |
SoC名 | Tegra X1 | Parker | Xavier | Xavier | Orin |
製造プロセス | 20nm SOC | 16nm FinFET | 12nm FinFET | 12nm FinFET | 不明 |
SoC トランジスタ数 | 2 Billion (Tegra X1) | N/A | 7 Billion (Xavier) | 7 Billion (Xavier) | 17 Billion (Orin) |
GPU アーキテクチャー | Maxwell (256 Core) | Pascal (256 Core) | Volta (512 Core) | Volta (512 Core) | Ampere? |
CPU | 16 Core ARM CPU | 12 Core ARM CPU | 8 Core ARM CPU | 16 Core ARM CPU | 不明 |
CPU アーキテクチャー | 8x Cortex A57 8x Cortex A53 | 4x Denver 8x Cortex A57 | Carmel ARM64 8 Core CPU (8 MB L2 + 4 MB L3) | Carmel ARM64 8 Core CPU (8 MB L2 + 4 MB L3) | ARM Herclues Cores |
演算性能 DLTOPs | N/A | 20 DLTOPs | 30 TOPs | 320 TOPs | 200 TOPs |
トータル チップ数 | 2 x Tegra X1 | 2 x Tegra X2 2 x Pascal MXM GPUs | 1 x Xavier | 2 x Volta 2 x Turing | 1 x Ampere |
システム メモリ | LPDDR4 | 8 GB LPDDR4 (50+ GB/s) | 16 GB 256-bit LPDDR4 | 不明 | |
グラフィックス メモリ | N/A | 4 GB GDDR5 (80+ GB/s) | 137 GB/s | 1 TB/s | LPDDR4+GDDR6 |
TDP | 20W | 80W | 30W | 500W | 不明 |
解説:
TOPsとはTera Operations Per Secondの略で、Deep Learningの演算ユニットの性能指標に使われているようです。
この一見ゲーミングPCとは全く関係ない記事を翻訳したのは、この記事の推測が当たっているとすると既にAmpereを使った製品は動き出しているということを言いたかったからです。(笑
それ以外の意味はありません。
あまり興味はありませんが、自動運転用のSoCはTegraX1なども使われていたようですが、現在はそんなかわいらしいものではなく、PCのGPU以上に電力バカ食いの高性能になっているのは表からもわかるのではないでしょうか。
TDP500Wって何事という感じです。
Turingを使ったSoCもありますが、ここでのGPUは主にAI関連の機能に使われているようで、VoltaなどゲーマーにはあまりなじみのないGPUが使われています。
この最新のSoCはOrinという名前で、GPU部分にはAmpereを内蔵するという推測が出ています。
とするとAmpereはAI関連の演算性能もそれなりに高いということになります。
Xavierも低消費電力版と高性能版二つがありますので、Orinがどうなるのかわかりませんが、Ampereの足音は確実に近づいていることだけは確かです。
nVidia RTX4000SUPER nVidia RTX4000 nVidia RTX3000シリーズGPU RTX3060 12GB GDDR6 RTX3050 6GB