グラフィックボード(GPU)の構造や仕組みについて、正確に理解できている人は驚くほど少ない。PCショップの店員ですら怪しいレベルだ。

だからこそ、今回はスペック表の数字に騙されないための「GPUの本当の仕組み」をめちゃくちゃ分かりやすく解説していく。

まず大前提。グラボとは「並列計算に特化した追加パソコン」である

そもそもGPUとは何なのか。最も正確で分かりやすいイメージは、「並列演算に特化した、パソコンみたいなもの」だ。

我々がデスクトップパソコンの内部に取り付ける一般的なグラフィックボードのことを「ディスクリート型GPU(dGPU)」と呼ぶ。
このdGPUの基板上には、計算を行うチップ(コア)、メモリ(VRAM)、電源回路など、必要なパーツがすべてパッケージングされている。つまり、dGPUそのものがすでに「ほぼ一つのパソコン」として完成している状態なのだ。

単体ではうまく動かず、CPUという指揮官がいないと使えないため、マザーボードに取り付けるようにできている。
一般的なCPUだけのパソコンに、並列計算が得意な「内蔵型の追加パソコン」を連結している状態。これがGPUの正しい捉え方である。

RTX 5080と5070 Tiは同じチップ?「モデル型番」の罠に騙されるな

GPU選びにおいて、初心者が必ず落ちる落とし穴がある。それは「モデル型番(RTX 5060など)」と、内部の「チップ型番(GB202など)」は全くの別物だということだ。

CPUの場合は、コア数が同じでも性能を出せる優良個体とそうでない個体があり、それによって末尾の数字や文字が変わるため、型番を見れば直感的に性能がわかるようになっている。しかし、GPUはこの「モデル型番」と「チップ型番」がバラバラで非常にわかりにくい。

直近の代表的な例を挙げよう。NVIDIAの「GB203」というチップだ。
このチップを搭載している代表的なモデルは「RTX 5080」と「RTX 5070 Ti」である。モデルの数字が違うから全く違うチップだと思いきや、実際には同じ「GB203チップ」が使われているのだ。

では何が違うのか? それは「当たりコア」と「ハズレコア」の関係である。
GPUは並列計算を行うため、計算部分(CUDAコア)が超大量に搭載されている。製造段階でこのコアが「何個正常に動作するか」によって当たりハズレが決まる。

チップ内のコアがいっぱい動作するフルスペック版が「RTX 5080」。製造上の理由で使えない部分がある(無効化された)バージョンが「RTX 5070 Ti」として製品化されているのだ。

ちなみに、プロ向けの「RTX PRO 4000 Blackwell」は、メモリ以外はRTX 5070 Tiとほぼ同じ仕様(VRAMはECC対応の24GB)。
上位の「RTX PRO 4500 Blackwell」は少しだけCUDAコア数が少ないものの、ほぼRTX 5080に近い仕様(ECC対応の32GB)となっている。

何が言いたいかというと、GPUはモデル型番だけでなく、使われているチップの型番が重要ということだ。チップの名前が分かれば、そのGPUの本来の素性が丸わかりになる。

「RX 9070をOCすれば最強」は嘘。RDNA 4チップの絶対的な格付け

AMDのRDNA 4アーキテクチャを採用した「Radeon RX 90」シリーズについても触れておく。実はこのシリーズ、ベースとなるチップはシリーズを通してすべて同じものだ。

チップの性能をフルに引き出しているのが「RX 9070 XT」。そこからコアを4分の3に削ったバージョンが「RX 9070(無印)」。そして2分の1にまで削られたのが「RX 9060 XT」である。

以前、「RX 9070(無印)をオーバークロック(OC)したら、RX 9070 XTより性能が高くなった」というような記事が出回ったが、あれは単なる誤解だ。
なぜなら、RX 9070 XTをOCすればRTX 5080に迫る性能が出るからだ。それは単純に「RDNA 4チップ自体の素性が良い」というだけの話に過ぎない。

物理的に4分の3に削られているチップより、絶対にフルスペック版の「RX 9070 XT」の方が格上だ。もちろんコスパ重視で買うならRX 9070でも性能は十分だが、性能に対する誤った認識が広まっていたためここで訂正しておく。

コア性能より重要。GPUの足を引っ張る最大要因は「メモリバス幅」だ

次にメモリ(VRAM)について解説する。VRAMで重要なのは「容量・バス幅・メモリ速度」だが、最も重要なのは圧倒的に「バス幅」である。

GPUのメモリは、コアのすぐ近くに等長配線で直接はんだ付けされている。この通信速度が性能に直結するため、コアの計算力の次に大事な要素になる。
どんなにGPUコアの計算力が高くても、メモリの速度が遅いと、そこがボトルネックになって性能を出し切れないのだ。

バス幅というのは、一つのGPUに「何枚のメモリチップを接続しているか」で決まる。
メモリチップは1枚あたり「32bit」のバス(通信する道路の広さ)を持っている。つまり、搭載するメモリの枚数を増やすほど車線が増え、合計の通信速度が上がる仕組みだ。

  • 8GBモデル(エントリークラス):2GBチップ×4枚 = 128bit
  • 12GBモデル:チップ×6枚 = 192bit
  • 16GBモデル:チップ×8枚 = 256bit
  • 24GBモデル:チップ×12枚 = 384bit
  • 32GBモデル:チップ×16枚 = 512bit

勘のいい人はわかると思うが、バス幅は「メモリの容量」でほぼ決まってしまう。メモリの枚数を増やすと製造コストが嵩むため、安価な8GBモデルは必然的に128bit(4車線)になってしまうのだ。

昔のRTX 30シリーズなどは当時のメモリ自体の速度が遅かったため、物理的にバス幅(枚数)を増やして帯域幅を稼ぐ力技の設計だった。
3060 Ti等のミドルレンジ製品でも256bitバス仕様だった。
しかし今は、メモリの速度が上がり、さらに「キャッシュ(L2/L3)」と呼ばれる超高速メモリの容量を増やすことで実効帯域幅を稼ぐスマートな設計が主流になった。バス幅を増やすよりキャッシュを増やした方が安く性能を向上させられるからだ。(※RTX 5090のようなウルトラハイエンド帯は、メモリ速度もバス幅も狂ったようにコストが掛けられているが)

動画編集の快適さはここで決まる。「エンコーダー」と「デコーダー」の罠

最後に、動画編集で重要になる「エンコーダー」と「デコーダー」だ。
GPUには動画の変換専用の機能が物理的に実装されている。圧縮や書き出しを行うのが「エンコーダー」、圧縮の逆の展開(プレビュー表示など)を行うのが「デコーダー」だ。

これらは世代によって性能が変わり、上位モデルになるほど搭載される数が増える。

例えば、NVIDIAの「RTX 5070 Ti」はエンコーダーが2つ搭載されているが、デコーダーは1つだけ。一方、上位の「RTX 5080」になるとエンコーダーが2つ、デコーダーも2つ搭載される。コア自体は同じでも、ここで明確な差別化がされており、動画編集でのレスポンス(展開速度)に差が出る。(ちなみに5090はエンコーダーが3つ、デコーダーが2つだ)

さらに、エンコーダーの世代と数が同じでも、先ほど解説した「VRAMの帯域幅と容量」の違いで書き出し性能は変わってくる。
4K以上の高画質動画になればメモリ自体の容量と速度が必要になるため、バス幅が広く帯域に余裕があるGPUの方が圧倒的な性能を出せる。

呼称も覚えておこう。NVIDIAのエンコーダーは「NVENC」、デコーダーは「NVDEC」で分かりやすい。AMDはエンコーダーとデコーダーが統合されて「VCN」と呼ばれるが、旧称である「VCE(エンコーダー)」の方が有名かもしれない。

基本的にどちらも世代が新しいほど優秀だが、同世代ならNVIDIAの方が若干高機能で高画質な傾向がある。ただ、RX 90シリーズ以降なら素人の動画編集レベルでは大差ない。
余談だが、プロの現場で使う「4:2:2 10bit」のハードウェアサポートが必要な場合は、NVIDIAのRTX 50シリーズGPUか、Intelの12世代以降の内蔵GPU(QSV)、あるいはMac環境でないと対応できないので注意が必要だ。

最後は自分の知識だけが頼りだ

自身の用途に合ったこだわりの高性能マシンがほしいのであれば、PCショップに頼るだけでなく自分自身の知識が重要になる。

実際のところ、大手のPCショップにいる店長クラスであっても、このレベルの根本的な構造や仕様の違いを理解していない人は山のようにいる。秋葉原にある某有名大型PCショップの歴代店長ですら、この程度の知識を持ち合わせていないケースが多々あった(どこかは絶対に言わないが)。

PCショップの店員がおすすめするものをただ鵜呑みにするのではなく、本質的な構造を理解して、自分の目で後悔のないGPUを選び抜いてほしい。

GearTuneをチェックして最新ニュースをお見逃しなく。