記事内にPRが含まれています。

DLSS 4.5「Preset M」がRTX 20でネイティブ解像度より重くなる技術的理由。第2世代TransformerモデルとTensorコアの世代差

NVIDIAが投入した最新アップデート「DLSS 4.5」は、画質の劇的な向上によって多くのゲーマーから称賛を受けている。
しかしその一方で、RTX 20シリーズなどの旧世代GPUを使用するユーザー層からは、耳を疑うような検証報告が上がっている。「DLSSを有効にすると、ネイティブ解像度よりもフレームレートが低下するケースがある」というものだ。

本来、レンダリング負荷を軽減し、パフォーマンスを底上げするために存在するはずのDLSSが、なぜ逆に重りとなってしまうのか。
その原因は、最適化不足といった単純な話ではない。DLSS 4.5で導入された新しいAIモデルの特性と、それを受け止めるTensorコアの世代差という、ハードウェア的な現実にあった。

第2世代Transformerモデルの導入

DLSS 4.5の最大のトピックは、画質設定における「Preset M」適用時に、従来のモデルとは異なる「第2世代TransformerベースのSuper Resolutionモデル」が採用される点にある。

従来の畳み込みニューラルネットワーク(CNN)ベースのモデルと比較して、このTransformerモデルは時間的な安定性や、微細なディテールの復元能力において圧倒的に優れている。これこそが「DLSS 4.5は画質が神」と言われる所以だ。

しかし、その代償としてAIの推論計算量は大幅に増加している。この重さこそが、今回のパフォーマンス逆転現象の引き金となっている。

Tensorコア世代による処理能力の差

ソフトウェアがいかに進化しようとも、それを処理するのは物理的なハードウェアだ。ここに決定的な世代差が存在する。

  • RTX 20シリーズ: 第2世代 Tensorコア
  • RTX 30シリーズ: 第3世代 Tensorコア
  • RTX 40/50シリーズ: 第4/5世代 Tensorコア(FP8対応など)

検証報告によれば、RTX 20シリーズ(第1世代Tensorコア)で高負荷なPreset Mを使用した際、「低解像度化によって短縮できた描画時間」よりも、「巨大化したAIモデルの推論処理にかかる時間」の方が長くなるというケースが確認されている。

通常、DLSSは「描画コスト」を下げて「AIコスト」を少し払い、トータルでお釣り(fps向上)をもらう技術だ。しかし今回のケースでは、AIコストが高すぎて赤字になっている状態と言える。
結果として、GPUのシェーダー(CUDAコア)側は描画を完了しているのに、Tensorコア側のアップスケーリング処理が終わらないというボトルネックが発生し、トータルのフレームレートがDLSS OFF(ネイティブ解像度)を下回る事態を引き起こしている。

なお、この現象はRTX 20シリーズに限らず、演算性能に余裕のない一部のRTX 30シリーズでも、条件次第で発生し得ると見られている。

DLSSは万能ではなくなった

この事実は、DLSS 4.5がもはや「導入すれば無条件で軽くなる魔法のツール」ではないことを示している。
AIモデルの要求スペックと、Tensorコアの処理能力。この2つの歯車が噛み合って初めて、性能向上と画質向上の両立が可能になる。

RTX 20/30ユーザーにとって、DLSS 4.5のPreset Mは「パフォーマンスを犠牲にしてでも最高画質を得たい」という特殊な状況での選択肢となるだろう。純粋にフレームレートを稼ぎたいのであれば、従来の軽量なモデル(Preset E等)を指定するか、設定を見直すのが現実的な解となる。

DLSS 4.5は、我々ゲーマーに対し、ハードウェアの世代交代とAI技術の進化の関係を改めて突き付けるアップデートと言えるだろう。

コメント

タイトルとURLをコピーしました