前書き
AMD Ryzen 9 3900Xは、あなたが今買うことができる最も強力な主流のデスクトッププロセッサです、そして我々のチップの包括的なレビューは、それがマルチコアにまたがることができるマルチスレッドタスクに関して競争を打ち破ることを打ち破ることを示します。
それはまた、ゲームにおけるインテルの製品に非常に近いパフォーマンスを発揮します。
過去10年間で、ゲームはマルチコアプロセッサをより有効に活用するようになりましたが、それでもHEDTのようなコア数は必要ありません。
たとえば「Battlefield V」は、最大12個の論理プロセッサを活用するようにコーディングされています。
“Metro Exodus”と “Assassin’s Creed Odyssey”は、さらに数コア上に拡張できます。
あまりにも多くのコアを必要とせず、単に高いCPUクロック速度またはIPCから利益を得るゲームがまだ残っています。
これが、IntelがほとんどのデスクトッププロセッサにHyperThreadingを提供することをよしとしなかった理由であろう。
6コア/ 6スレッドのCore i5-9600KはまだゲーマーのCPUとして販売されています。
SMT、または同時マルチスレッディングのおかげでRyzen 9 3900Xは、24個の論理プロセッサ、つまりスレッドをあなたのマシンに与えることができます。
概念的にはIntelのHyperThreadingと同じで、SMTは各物理CPUコアを2つの論理プロセッサとして扱うので、その機構はより最適に利用されることができます。
理論的には、SMTまたはHTTがプロセッサの消費電力を増加させますが、待ち時間がある特定の古いソフトウェア、またはそれを使用するにはコーディングが不適切なソフトウェアとの互換性の問題を引き起こす可能性があります。
マルチコアプロセッサ用に設計されたほとんどすべてのPCプラットフォームでは、BIOSセットアッププログラムに2つの重要な設定があります。SMTまたはHTTを無効にする機能と、マルチコアプロセッサ内のコアを無効にする機能です。
これら2つの設定は、特にコードを最適化またはテストしようとしているソフトウェア開発者である場合、互換性またはトラブルシューティングに役立ちます。
ほとんどの人にとって、設定はあまり意味がないので、マザーボードはデフォルトでそれを特徴とするプロセッサ上でSMT / HTTを有効にします。
物理CPUコア数が12にもなるため、SMTを無効にするとRyzen 9 3900Xのパフォーマンスにどのような影響があるか、またプロセッサが特定の種類のアプリケーションまたはゲームの無効化から何らかの利益を得るかどうかを考えました。
SMTを無効にすると、オペレーティングシステムのスケジューラが対処しなければならない論理プロセッサの数の半分が削り取られます。
それが仕事をディスパッチするすべてのプロセッサは、そのL1 / L2キャッシュを備えた完全な物理コアであることが保証されており、整数とFPUパイプはそのワークロード専用です。
理論的には、これはあまりにも多くの論理プロセッサにまたがって拡張しないソフトウェアにとって有益なはずです。
各コアのスケジューラは2つのスレッド間でリソースを調整していないため、待ち時間も短くなるはずです。
このレビューでは、SMTを無効にしてRyzen 9 3900Xをテストし、12コア/ 12スレッドのプロセッサにしました。
プロセッサは私達の全体のCPUテストベンチと多くのゲームを通して置かれます。
SMTを無効にした3900Xが、ユーザーがゲームと生産性の向上に重点を置いている、ハイエンドのゲーム用PCビルドに適した日常的なソリューションになるかどうかを調査します。
私たちは2つの理論をテストしています。マルチスレッドテストにおけるパフォーマンスの低下の程度と、並列化されすぎていないテストにおけるパフォーマンスの向上(もしあれば)です。
テスト設定
Test System “Zen 2” | |
CPU | All AMD Ryzen 3000 |
マザーボード | ASRock X570 Taichi AMD X570, BIOS v1.30 |
メモリ | 2x 8 GB G.SKILL Flare X DDR4 DDR4-3200 14-14-14-34 |
グラフィックスカード | EVGA GeForce RTX 2080 Ti FTW3 Ultra |
ストレージ | 1 TB SSD |
電源 | Seasonic SS-860XP |
OS | Windows 10 Professional 64-bit Version 1903 (May 2019 Update) |
ドライバ | NVIDIA GeForce 430.63 WHQL AMD Chipset 1.07.07.0725 |
- すべてのアプリケーション、ゲーム、およびプロセッサは、上記のドライバとハードウェアでテストされています。テストシステム間でパフォーマンスの結果が再利用されることはありません。
- すべてのゲームとアプリケーションは同じゲームバージョンを使用してテストされています。
- 特に指定のない限り、すべてのゲームは最高品質の設定に設定されています。
アプリケーションベンチマーク
個々のアプリケーションスコア
SuperPi
SuperPiは、オーバークロックと調整を伴う最も人気のあるベンチマークの1つです。
それ以来ずっと、世界記録の競技会で使われてきました。
これは純粋にシングルスレッドのCPUテストで、円周率を3200万桁まで計算します。
1995年にリリースされ、x86の浮動小数点命令のみをサポートしているため、シングルスレッドのレガシアプリケーションのパフォーマンスを確認するのに役立ちます。
シングルスレッド、低いほうが良い
wPrime
SuperPiはPiの計算に重点を置いていますが、wPrimeは別の数学的問題、素数の発見に取り組んでいます。
そのためにニュートン法を使用しています。
wPrimeの設計目標の1つは、プロセッサ上で使用可能なすべてのコアとスレッドを最大限に活用できるように設計することでした。
マルチスレッド、低い方が良い
レンダリング – Cinebench
Cinebenchは、MaxonのCinema 4Dソフトウェアのレンダラを中心に構築されているため、最も人気のある最新のCPUベンチマークの1つです。
AMDとIntelの両社は、さまざまな公共イベントでこのパフォーマンステストを実施しており、ほぼ業界標準になっています。
Cinebench R20を使用して、シングルスレッドとマルチスレッドの両方のパフォーマンスをテストします。
高い方が良い
レンダリング – Blender
Blenderは、フリーでオープンソースの両方である数少ないプロフェッショナルグレードのレンダリングプログラムの1つです。
その事実だけでも、ソフトウェアを中心に強力なコミュニティを構築するのに役立ち、その使いやすさからも、非常に人気のあるベンチマークプログラムとなっています。
テストには、Blenderの “BMW 27″ベンチマークシーンを使用しています。
低い方が良い
レンダリング – Corona
Corona Rendererは、Autodesk 3ds MaxおよびCinema 4Dで利用可能な最新のフォトリアリスティックレンダラです。
現実的な照明アルゴリズム、グローバルイルミネーション、美しい素材のおかげで、物理的に妥当で予測可能な出力が得られます。
CoronaはGPUレンダリングをサポートしていないため、CPUパフォーマンスはすべてのユーザーにとって非常に重要です。
低い方が良い
レンダリング – KeyShot
スタンドアロンのKeyShotレンダリングソフトウェアは、可能な限り最短の時間枠で高品質の現実的な製品ショットを得るのに役立つ、迅速で効率的なワークフローを備えています。
リアルタイムレイトレーシング、マルチコアフォトンマッピング、アダプティブマテリアルサンプリング、およびダイナミックライティングコアにより、シーンをインタラクティブに操作している場合でも即座に更新される高品質の画像が提供されます。
KeyShotはCPU上での使用に最適化されているため、GPUベースのレンダラーよりも複雑なアルゴリズムを使用できます。
他のレンダリングテストとは異なり、レンダリング中にKeyShotに「1秒あたりのフレーム数」を記録するので、数値が大きいほど優れています。
ゲーム開発 – Unreal Engine 4
Unreal Engine 4は業界でも有数のマルチプラットフォームゲームエンジンの1つで、高度な機能だけでなく、競合製品よりも迅速に結果を得ることができます。時間は金なりです。
ゲームが出荷される前に、「ライトベーキング」の長いプロセスが実行されなければなりません。
シーン内のすべての静的ジオメトリと固定光源を受け取り、それらのライトマップテクスチャを事前計算します。これにより、これらの計算をユーザーのシステムでリアルタイムで実行する必要がなくなるため、最終的なゲームのパフォーマンスが大幅に向上します。
私たちのベンチマークのために、私たちは比較的単純なシーンのためにベイクドライトマップを生成しましたが、それは通常数時間かかります。
Unreal Engine 4、ベイクドライトマップ、低い方が良い
ソフト開発 – Visual Studio C++
Microsoft Visual C ++は、おそらくプロのWindowsアプリケーションを作成するための最も人気のあるプログラミング言語です。
これはMicrosoftのVisual Studio開発スイートの一部であり、長い歴史があり、IDEに関しては「ゴールドスタンダード」として広く受け入れられています。
ソフトウェアのコンパイルは、プログラムコードを最終的な実行可能ファイルに変換する比較的長いプロセスであり、プログラマはそれが完了するのを待つのが嫌いです。
C ++コンパイラとリンカを介して中規模のアプリケーションを実行し、リソースコンパイラも実行します。
ビルドは、すべての最適化がオンになっていてマルチプロセッサコンパイルが有効になっている「リリース」モードで実行されます。
Microsoft Visual Studio 2019 C++、低い方が良い
ウェブブラウジング – Google Octane
Google Octaneは、今日の動的でインタラクティブなWebアプリケーションの典型的なユースケースを表す一連のJavascriptベースのテストを実行することによって、Webブラウザのパフォーマンスをテストします。
高いほうが良い
ウェブブラウジング – Mozilla Kraken
Mozilla KrakenはJavascriptの実行時間を測定するという点でOctaneと似ていますが、SunSpiderベンチマークに基づいて異なる一連のテストを使用します。
テストケースには、音声処理、検索アルゴリズム、画像フィルタリング、JSON解析、および暗号化が含まれます。
低い方が良い
ウェブブラウジング – WebXPRT
WebXPRT 3は、写真補正、AIを使用したメディア管理、ストックオプション価格設定、暗号化、OCR、チャート作成、生産性など、一般的なWebアプリケーションのパフォーマンスを測定するブラウザベンチマークです。
これは、特定のアルゴリズムをテストする、マイクロベンチマークに重点を置いている他の2つのブラウザベンチマークとは対照的です。
高い方が良い
機械学習 – Tensorflow
人工知能は最近どこにでもあります。
機械学習ベースのアルゴリズムは、これまでは人間しか実行できなかった多くの手作業の作業から厄介な作業を取り除きます。
Deep Learning AIが問題を解決するには、最初に多数のトレーニングデータを繰り返し使用して学習し、後で有効にできるニューラルネットワーク(推論とも呼ばれる)を生成する必要があります。
GoogleのPythonベースのTensorflowは、CPUとGPUの両方をサポートする最も人気のある機械学習ソフトウェアパッケージの1つです。
GPU用にTensorflowを設定するのは少し複雑です。そのため、小さなデータセットのアルゴリズム開発とトレーニングがCPU上で行われます。
問題サイズが一般的なGPUメモリ容量を超えると、CPUのトレーニングパフォーマンスもGPUを上回る可能性があります。
低い方が良い
物理シミュレーション
工学は、最終製品が設計要件を満たすことができるかどうかを検証するために、液体の流れ(CFD)、熱伝達、および構造安定性をシミュレートできる有限要素法(FEM)を広く使用します。
このような問題を解決すると、システムは有限要素と呼ばれる多数の単純な部分に分割され、それらはすべて相互作用することができます。
これは非常に複雑な数学的作業であり、多くの処理能力を必要としますが、GPU上で並列化するのは非常に困難です。
当社のEuler3Dベンチマークテストは、複数のCPUコアを最大限に活用するために完全に並列化されていますが、メモリサブシステムにも多くのストレスがかかります。
低い方が良い
脳神経シミュレーション
脳がどのように機能するのかをよりよく理解するために、生物学および医学研究はニューロンとそれらの相互作用をシミュレートするためのソフトウェアを使用します。
科学者は、これが最終的にどのように生物学的知性が出現するかの理解につながることを願っています。
物理シミュレーションテストと同様に、これは非常に複雑でメモリ集約型の問題で、CPUで最もよく解決できます。GPUはこれらのアルゴリズムにはあまり適していません。
低い方が良い
マイクロソフトオフィス
MicrosoftのOfficeスイートは、業界を問わずすべてのオフィスコンピュータにインストールされている、おそらく世界で最も広く使用されているPCソフトウェアであるため、導入の必要はありません。
私たちのテストは、Word、PowerPoint、そしてExcelでの幅広い編集と作成のタスクをカバーしています。
※ この表現はちょっと大げさだと思います。
低い方が良い
画像編集 – Adobe Photoshop
Adobe Photoshopは、写真および画像処理の業界標準となっています。
画像のサイズ変更、さまざまなぼかし、鮮明化、色と明るさの調整、画像のエクスポートなど、一連の典型的な編集作業を通じて最新のPhotoshop CCを実行します。
低い方が良い
動画編集 – Adobe Premiere Pro
Adobe Premiere Pro CCは、映画、テレビ、およびWeb用の高品質のコンテンツを作成するためのビデオ制作業界の主力製品です。
それはほとんどあらゆる記録されたファイルフォーマットを扱うことができて、フルHD、4K、8Kとバーチャルリアリティのコンテンツを編集するためのワークフローをサポートします。
残念ながら、Premiere Proの大部分はシングルスレッドであり、メディアエンコーディングは非常に高速なGPUアクセラレーションであるため、CPUでのベンチマーク「エクスポート」は意味がありません。
テストでは、ソフトウェアの「オブジェクトトラッキング」機能を使用しています。これは、ビデオを自動的にスキャンして特定の人物やオブジェクトを追跡するためのものです。このタスクでは実際にコア以上のものが使用されます。
このプロセスでは大量のメモリが消費され、アクセスされます(テストシーンでは10 GB以上)。
オブジェクトトラッキング、低い方が良い
写真からの3Dモデル生成
3Dモデルの作成は、時間がかかり、経験豊富なアーティストを必要とする面倒で複雑な作業です。
したがって、一連の写真から3Dモデルを再構築するのは、3Dモデリングの聖杯です。
それがまさに写真測量が行うことです。
この方法は、空中ドローンによって撮影された写真から地形ジオメトリを再構築するためにも使用されます。
低い方が良い
OCRテキスト認識 – Google Tesseract
光学式文字認識(OCR)は、スキャンした画像や写真のテキストを実際の文字に変換して保存したり、さらに処理したり、編集したりする作業です。
ほとんどのOCRソフトウェアはシングルスレッドですが、GoogleのTesseractエンジンは一度に複数ページのスキャンした文書を処理できるため、複数のプロセッサコアに負荷がかかります。
入手可能な最も正確なオープンソースのOCRパッケージの1つと考えられているこのソフトウェアは、最初の認識結果に対して自動的にスペルチェックを実行するため、ワークロードが複雑になります。
PC仮想化 – VMWare Workstation
仮想マシンは、ホストPCから完全に独立した、コンピュータ内のシミュレートされたコンピュータです。
これによりセキュリティが向上するだけでなく、異なるオペレーティングシステム用に書かれたソフトウェアを1台の物理マシン上で実行することも可能になります。
仮想化は「クラウド」の基盤であり、仮想マシンを複数のコンピュータに動的に分散して特定のハードウェアリソースを最大限に活用することで、ハードウェアの所有コストを削減するのに役立ちます。
ハードウェア仮想化サポートをIntelとAMDの両方のプロセッサで有効にして、VMWare Workstationを使用してVMのパフォーマンスをテストしています。
不思議なことに、多くのAMD Ryzenマザーボードはデフォルトで “SVM”設定を無効にして出荷されているので、我々はそれを有効にしたことを絶対に確信しました。
低い方が良い
データベース – MySQL
今日では、これまで以上に多くのデータが保存され処理されています。
この革命のバックボーンは、大規模なデータセット全体でストレージと検索を管理するデータベースシステムです。
あなたがウェブサイトまたは他のデジタルサービスと対話するときはいつでも、それはあなたが探している結果を返すことに少なくとも1つのデータベースが関与することがほぼ保証されています。
TPC-Cテストで最も人気のあるデータベースシステム「MySQL」をベンチマークします。これは、多数の倉庫とそれらの絶え間なく変化する在庫をシミュレートします。
報告される数は「1秒あたりのトランザクション数」なので、大きいほど良いです。
高い方が良い
Java
Javaプログラミング言語は、プラットフォームに依存しない、高度にスケーラブルでフォールトトレラントになるように設計されているため、大量のデータと多数の同時ユーザーで動作するエンタープライズサービスに非常に人気があります。
私たちのテストスイートは個々のJavaベンチマークの多種多様なものから成り立っています。
それらのいくつかはシングルスレッドであり、あるものはいくらかスケールアップし、そしてあるものは利用可能な限り多くのコアまで完全にスケールアップします。
高い方が良い
ファイル圧縮 – WinRAR
ダウンロード時間と転送サイズを減らすためにデータが転送されるとき、データはほぼ常に圧縮されています。
WinRARは従来のZIPよりも高度な圧縮アルゴリズムを使用しているため、このテストではこれを選択しました。
複数のプロセッサコアにまたがることもできます。
WinRAR 1.5GB ファイル圧縮、低い方が良い
ファイル圧縮 – 7-Zip
もう1つの一般的な圧縮ソフトウェアは7-Zipです。これにはZIPアルゴリズムを使用して整数命令レート(MIPS)を測定するベンチマークが含まれています。
利用可能であれば、それはマルチスレッドを有効に利用します。
7-Zp圧縮、高い方が良い
7-Zip解凍、高い方が良い
暗号化 – VeraCrypt
暗号化は、今日のインターネット上のセキュリティの基礎であり、最終目的地に向かう途中でさまざまなルーターを通過する際に誰もが自分のデータを見ることができないようにします。
ディスク暗号化ソフトウェアTrueCryptをベースにしたVeraCryptは、バックドアなしであなたのディスクドライブのためのオープンソース暗号化を可能にします。
アプリケーションには、データを暗号化できる速度を測定するマルチスレッドパフォーマンステストが付属しています。
テストにはAESアルゴリズムを使用しています。
高い方が良い
動画エンコード – H.265 / HEVC
今日では、テレビ、物理メディア、インターネット経由のストリーミングなど、消費されるすべてのビデオがさまざまなコーデックを使用して圧縮されています。
私たちの最初のビデオエンコーディングテストはHEVCとしても知られているかなり新しいH.265コーデックを使います。
私達は8ビットの色深度、プリセット「遅い」、そしてcrf 20の品質設定で、最新バージョンのX265エンコーダーを使ってフルHDビデオを圧縮します。
低い方が良い
動画エンコード – H.264 / AVC
AVCとも呼ばれるH.264は、やや古い圧縮形式ですが、古いハードウェアでも十分にサポートされているため、最近ではおそらく最も広く使用されている圧縮形式です。
X.264エンコーディングソフトウェアを使用し、H.265テストと同じビデオをプリセット「より低速」でcrf 20に圧縮します。
低い方が良い
音声エンコード – MP3
MP3は他のテクノロジとは異なり、音楽業界に革命をもたらしました。
90年代に導入されて、それは音質に目立った影響なしでオーディオファイルサイズの大幅な縮小を可能にしました。
これにより、音楽のダウンロード、そして最終的にはストリーミングがインターネット上でのコンテンツ配信の実現可能な方法となりました。
ベンチマークとして、2.5時間の44.1 kHzステレオ録音を可変ビットレートのMP3ファイルに変換します。
MP3エンコーディングはシングルスレッドプロセスです。
低い方が良い
ゲームテスト 1280X720
過去のいくつかのCPUレビューに関するコメントからの一般的な要求に応じて、720p(1280×720ピクセル)の解像度でのゲームテストを含めています。
私達のCPUテストスイートからのすべてのゲームはRTX 2080 TiグラフィックスカードとUltra設定を使って720pを通して行われます。
ゲームはこの解像度では極端にCPU制限されているので、この低解像度は理論上のCPUパフォーマンスを強調するのに役立ちます。
もちろん、720pでゲームするためにRTX 2080 Tiを搭載したPCを購入する人はいませんが、720pで毎秒144フレームを処理できないCPUは高解像度ではそのマークに到達しないため、結果は学術的価値があります。
そのため、これらの数字は、120 Hzと144 Hzの高速モニタを搭載した、高リフレッシュレートのゲーミングPCビルダーにとっては興味深いものです。
したがって、これらの720pテストは、ゲームテスト自体が総合ではないにもかかわらず(720pは、実際のPCゲームの解像度ではなくなっている)、総合テストとして機能します(3Dベンチマークではなく、本物のゲームです)。
高い方が良い
個別のベンチマークスコア
平均FPS、高い方が良い
ゲームテスト 1920X1080
高い方が良い
個別のベンチマークスコア
平均FPS、高い方が良い
ゲームテスト 2560X1440
高い方が良い
個別のベンチマークスコア
平均FPS、高い方が良い
ゲームテスト 3840X2160
高い方が良い
個別のベンチマークスコア
平均FPS、高い方が良い
消費電力
消費電力 アイドル、システム全体、低い方が良い
シングルスレッド負荷時、SuperPi システム全体、低い方が良い
マルチスレッド、Cinebench システム全体、低い方が良い
ストレステスト、Prime95、システム全体、低い方が良い
ゲーミング、Witcher3、システム全体、低い方が良い
電力効率
このセクションでは、SuperPi実行(シングルスレッド)とCinebench(マルチスレッド)に消費されるエネルギーの合計量を測定します。
速いプロセッサであるほど作業をより早く完了するので、使用される総エネルギー量は低電力プロセッサよりも少なくなる可能性があり、それは消費電力が少なくなるかもしれません。しかし、(逆に、遅いプロセッサは)テストを終えるまでの時間が長くなります。
シングルスレッド、SuperPi、システム全体、低い方が良い
マルチスレッド、Cinebench、システム全体、低い方が良い
結論
SMTを無効にしても、Ryzen 9 3900Xはベンチで最速のプロセッサであり、マルチスレッドテストでCore i9-9900Kを凌駕しています。
SMTをオフにしたRyzen 9 3900Xはまた出たばかりのRyzen 7 3700Xを打ち倒しました。
その後、12の物理コアが8コア/ 16スレッドを上回ったことが判明しました。
ただし、SMTがないため、Ryzen 9 3900Xのパフォーマンスは大幅に低下しています。
これは、AMDによるSMTの実装が誠実なエンジニアリングの功績であり、明らかなパフォーマンスの向上をもたらすことを示しています。
「Zen」はSMTがなければ同じものにはならないでしょう。そしてAMDは、300ドル以上の価格帯に限定するのではなく、140ドル以上の価格ですべてのプロセッサモデルにこの機能を提供できるほど親切で賢明でした。
このような結果になったが、我々はもう一つの魅力的な現象に気付きました。
SMTが無効になっていると、 “Zen 2″コアのIPCは約2%上昇するようです。
これは、あまりにも多くのコアを必要としないソフトウェア、つまりゲームのパフォーマンスに直接影響します。
これは、プロセッサで発生している2つの異なることが原因であると考えられます。
1つは、SMTの負荷がなくなり、プロセッサの電力管理によって消費電力とPrecision Boostのヘッドルームが少数の論理プロセッサに分散されるため、各コアがより高いブースト周波数で動作し、コアあたりのパフォーマンスに良い影響を与えることです。
次に、小規模ですが、パフォーマンスは、2つの論理プロセッサ間でリソースを調整する必要がないオンコアスケジューラによっても恩恵を受けます。
SMTを欠いている8コアプロセッサであるCore i7-9700Kをテストし、それを8コア/ 16スレッドのi9-9900Kと比較すると、このヒントがわかりました。
わずかに低いクロック速度にもかかわらず、i7-9700Kはゲームでi9-9900Kに匹敵するか、またはそれをわずかに超えることができました。
Ryzen 9 3900Xにはこのような「負担のない」コアが12個あります。そのため、ゲームテストで2%のパフォーマンス向上が見られます。
プロセッサのIPCおよびCPUレベルのボトルネックに対する貴重な推測を提供する、学術的に重要な720pの解像度では、SMTをオフにした3900Xはすべてのゲームで平均2.2%のパフォーマンスを達成しています。
この増加は、 “Metro Exodus”のようなゲームでより顕著であり、これはフレームレートの9.6パーセントの驚くべき増加を見ます。
“Wolfenstein II”はほぼ5パーセントの増加を見ています、そして “Rage 2″は4.5パーセントの増加でそれほど遅れていません。
「Assassin’s Creed:Odyssey」と「The Witcher 3」は、SMTがないために0.5〜1.7パーセントのパフォーマンス低下を招いた唯一のタイトルです。
私たちは、特に4%以上の利益があるゲームで、恩恵があるとみなしています。
これらは、(SMTをオフにしたことによる)軽いオーバークロックから予想される性能向上です。
1080p(Full HD)では、720pで見たパフォーマンスの向上は、上記のゲームでも全く見られませんでした。
これはおそらく、1080pという解像度がCPUの制限を受けなくなったわけでも、テスト対象の強力なGeForce RTX 2080 Tiへの負担でもないためです。
1440p(WQHD)では、パフォーマンスのリードは回復し始めましたが、ほんのわずかです 。
– 1.2%がすべてのテストの平均で、SMTを無効にすることで恩恵を受けるゲームでは3%未満でした。
4K Ultra HD解像度では、テスト機のRTX 2080 Tiは徹底的に手を握っているので、私達にGPU制限のシナリオを与えます。
SMTオンとSMTオフとの間の性能の差異は、平均でわずか0.2%に薄められ、1%未満の変動がSMTまたはその無効化の影響を受けたゲームの間で見られました。
これらの違いは、ランダムな変動から簡単に割り引くことができます。
現実的な解像度でのパフォーマンスの数値にもかかわらず、720pのデータは私たちを惹きつけます。
SMTを無効にすると、ゲームのコアあたりのパフォーマンスが確実に向上するように見えますが、そのほとんどはまだあまり並列化されておらず、SMTで邪魔されていない12の物理コアに快適に分散できます。
そのため、3900Xで全力でゲームリグを構築し、マルチスレッドの生産性向上作業をそれほど使わない場合は、SMTをオフにして再起動すればFPSをいくらか上げることができます。
AMDは、SMTをRyzen Masterソフトウェアで切り替え可能にすることで、多少やりやすくしました。
Ryzen MasterソフトウェアにSMTトグルを入れることによって少し簡単にしました。
SMT切り替えを適用しても再起動が必要ですが、Deleteキーを押しながらセットアッププログラムでSMTを無効にしてからBIOSを再起動し、BIOSの設定を有効にするよりも確かに便利です。
ゲーム以外のアプリケーションに関するこのレビューの二つ目の、重要な部分があります。
ここでは、特にマルチスレッド環境で適切に拡張されるアプリケーションでは、SMTの損失がさらに顕著になります。
wPrimeは、31%という大幅なパフォーマンス損失を記録しています。これは、プロセッサのパフォーマンスの約3分の1です。
SMTのような無形の機能がそのような大きなパフォーマンスの向上につながると想像できますか?
Cinebench R20マルチスレッドは、そのパフォーマンスの21%(1/5以上)を低下させます。
SMTを無効にしたレンダリングテストでも、同様のパフォーマンスの低下があります。
パフォーマンスはBlenderとKeyshotで約31パーセント、Coronaで約27パーセント低下します。
SMTをオフにすると、3900XはTensorflow AIテストで3700Xとi9-9900Kの両方より遅れをとります。 7-Zip圧縮解除テストでは、39%のパフォーマンス低下が見られます。
H.265エンコーディングではわずか3パーセントのパフォーマンス低下にとどまり、動画のエンコードでは驚かされました。
ただし、H.264エンコーダでは20%の損失があります。
このレビューは心地よい驚きに満ちています。
多くのゲームをプレイし、クリエイティブな用途であまりマルチスレッドを必要としない場合、、Ryzen 9 3900XのSMTを無効化する利点があります。
あなたが本当に運が良ければ、ゲームのパフォーマンスは9パーセントもの上昇を見ます。
そして、結果として得られるプロセッサのマルチスレッドパフォーマンスは、8コア/ 16スレッドプロセッサよりも上です。
12個の物理コアにはまだ多くの価値があります。
ベンチマークを実行したり、任意の数のコアに対応できるワークロードに対処したりするとき、31%の大幅なパフォーマンスの向上は、当然のことながらRyzen Masterの切り替えのほんのちょっとした操作で可能です。
ソース:techpowreup – AMD Ryzen 9 3900X, SMT on vs SMT off, vs Intel 9900K