AMDのDavid McAfee氏が、RX 7900 XTXがDeepSeek R1ベンチマークでRTX 4090を最大13%上回る衝撃的な結果を公表。AI処理性能でNVIDIAの牙城が崩れる可能性が示唆された。長年NVIDIAが独占してきたAI処理性能の主導権が、ついにAMD側に移行する転換点となる可能性を秘めている。
驚異のベンチマーク結果
DeepSeek R1での複数モデル比較において、RX 7900 XTXは圧倒的な性能を示した
- Qwen 7B:RTX 4090比+13%、RTX 4080 SUPER比+34%
- Llama 8B:RTX 4090比+11%、RTX 4080 SUPER比+27%
- Qwen 14B:RTX 4090比+2%、RTX 4080 SUPER比+22%
ただし、Qwen 32BではRTX 4090が4%のリードを保持。大規模モデルでは依然としてNVIDIAに優位性がある。
RDNA 3アーキテクチャの真価
RX 7900 XTXに搭載される192基のAIアクセラレーターは、従来のゲーミングGPUの概念を覆す革新的な設計を特徴としている。特筆すべきは、BF16およびINT8演算に対する包括的なサポートだ。これにより、AIワークロードに最適化された効率的な処理が可能となっている。
マトリックス演算の高速化も見逃せない進化のポイントだ。AMDはRDNA 3世代で初めて「AI Accelerator」という用語を正式に採用し、AI処理性能への本格的な取り組みを示している。これは単なるマーケティング用語ではなく、実際の性能向上として結実していることが、今回のベンチマーク結果からも明らかとなった。
DeepSeek R1の革新性
DeepSeek R1は、従来のAIモデルと比較して11倍の処理速度を実現する画期的なモデルとして注目を集めている。この高速化を可能にしているのが、NVIDIAのPTXプログラミング言語を活用した最適化技術だ。
従来の西洋主導のAIモデルと比較して、はるかに少ない計算リソースで同等の性能を実現できる点も特筆に値する。これは、ハードウェアリソースを最大限に活用するための緻密な最適化の成果と言える。
今後の展望と注意点
ただし、これらのベンチマーク結果はAMDによる検証に基づくものであり、実環境では異なる結果となる可能性がある点には注意が必要だ。特にFP8計算の未使用や、TensorRTコードの活用状況が明らかにされていない点は、結果の解釈において重要な考慮事項となる。
また、NVIDIAのGPU設定の詳細が非公開であることも、このベンチマーク結果を評価する上での不確定要素となっている。Stable Diffusionのテストでも見られたように、すべてのAIワークロードがGPUの計算能力を最大限に活用できているわけではない。
しかし、これらの留保事項を考慮しても、RX 7900 XTXが示した性能は極めて印象的だ。特に、従来NVIDIAが圧倒的な優位性を保持してきたAI処理性能の分野で、AMDが確かな進化を遂げていることは明らかと言えるだろう。
※本記事はAMDの公式発表とベンチマーク結果に基づいています。実際の性能は使用環境や設定により大きく異なる可能性があります。
コメント