RTX 3080/3090クラッシュ問題、何が原因だったか

ハードウェア
この記事は約6分で読めます。

先月末に NVIDIA から発売された新GPU「GeForce RTX 3080 / 3090」は、性能の誇大宣伝、GPUチップ自体の供給不足、クラッシュが頻発するという3つの問題があった。性能を過剰に宣伝したことはコストパフォーマンスの良さで批判をねじ伏せた格好だが、後の2つにはPCマニアやゲーマーから多くの不満が出た。

今回一番の問題と言って良いクラッシュ問題がなぜ起きたのか、 NVIDIA のパートナー企業や NVIDIA 内部とつながりがあるYouTuberが漏らした情報などを元にまとめた。

※NVIDIA は9月29日にこの問題を修正するドライバ(456.55)をリリースしており、解決している

キャパシタの問題ではない?

「Igors Lab」が9月25日付けで発表した 「RTX 3080/3090 のクラッシュの原因がパートナーボードに使われているキャパシタの問題ではないか?」とする記事が話題となり、またたく間にネット中に広まった。

キャパシタは GPU に安定した動作をさせるために電源のノイズを除去、フィルタリングする目的の部品だ。チップに電力を送る最終フェーズにこのノイズフィルタリングが行われることから多くのボート製造会社はチップの真後ろに装着していることが多い。これをパートナー企業がケチったのがクラッシュする原因ではないか。という考察記事だ。

POSCAP 4 + MLCC 2 の構成

RTX 3080 / 3090 には POSCAP(Conductive Polymer Tantalum Solid Capacitor、導電性高分子タンタル固体電解コンデンサ) という大型のキャパシタと MLCC (Multi-Layer Ceramic Capacitor、積層セラミックコンデンサ)という小型のコンデンサを多数集めたキャパシタのいずれかが採用されている。一概にどちらが良いのかは言えないが通常 MLCC のほうが何重にも分けてフィルタリングを行うため、性能が良いと言われている。MLCC 自体は安いのだが、基盤にはんだ付けする工数が POSCAP に比べ多い。このため結果的に MLCC のほうが製造コストが高い。

この安い方の POSCAP が多く使われているサードパーティ製ボードが問題を引き起こしているのではないか、というのだ。

しかし、 NVIDIA が自ら設計・製造した RTX 3080/3090 FE(ファウンダーズ・エディション)やすべてのキャパシタに MLCC が使われているボードでも同様のクラッシュが起きることが多数報告されており、読者の一部ではこの記事の内容に疑問を呈する意見が散見された。そこから色々なメディアでキャパシタを交換するなど様々な実験が行われたが原因が判明しなかった。

さらに NVIDIA の回答によればパートナー企業は NVIDIA のガイドラインに沿ってキャパシタを選択しており、設計上 POSCAP でなんら問題ないという。

ドライバが原因か

「Gear Seekers」という YouTuber も同様の問題に直面して原因を究明していた。そこで彼らは面白いことを発見した。

「Gear Seekers」がテストに使用したボードは「ASUS ROG STRIX RTX 3090 Gaming」というASUSのボードの中でも最上級のカードだ。このカードには MLCC しか使われていないがクラッシュが頻繁に起こったという。

そこで Linux OS がインストールされたシステムで GPU ベンチマークやゲームのテストを行った結果、全くクラッシュすることがなかった。しかも 2100 Mhz までブーストしたにもかかわらずシステムが不安定になることが一切なかったそうだ。

動画の中では Linux と Windows のベンチマーク結果も比較しているが、単純に Linux  のドライバのほうが出来が良さそうだ。 Windows 版のドライバは DirectX API に対応しなければならないなど、無駄な機能を山ほど抱えていて複雑ということもあるのではないだろうか。

全性能を引き出すために限界ギリギリのオーバークロックする際にキャパシタの違いがわずかに結果に影響を及ぼすかもしれないが、そこまで安定性に差がでることはないのだろう。

Gear Seekers の読みどおり、後に NVIDIA は改修されたドライバをリリースし問題は解決した。仮に手元に POSCAP が搭載されたボードが届いても心配する必要はないと思われる。

問題の本質

Gamers Nexus」によれば NVIDIA は今回のローンチにあたり性能のリークに敏感になりすぎてしまい、ボードパートナーにも徹底的に情報を伏せたのが要因ではないかと漏らした。

GPUのリリース前にパートナー企業(AIB、Add In Board)には先行してドライバを配布されるのだが、今回は性能を秘匿するためからかクーラー性能試験用の FurMark 向けドライバしか配られなかった。 FurMark は GPU をほとんどブーストもしないため、OCしたときや実際にゲームするときにかかる負荷と大きく異なる。

正式なドライバが NVIDIA からパートナー企業に提供されたのは製品発売のわずか数日前だったという。そのためパートナー企業は十分なテストができない状態で商品を出荷することとなった。

Nvidia が RTX 3080/3090 のローンチ前にパートナー企業ともう少し時間をかけてテストを行い、ドライバを改修したら回避できた問題だった。

いくつかのパートナー企業はローンチ直前にクラッシュが頻発する問題を発見し、記者などに送ったレビューサンプルや小売に送られるはずの商品を回収することとなった。

消費者は何を気をつけるべきか

何回か本ブログで書いているがグラフィックボードや CPU などが発売されたときすぐに飛びつくのはやめておいたほうが良さそうだ。

今はドライバアップデートでほぼ解決したが AMD Radeon RX 5X00 シリーズにはハードウェアバグが存在し、今回のようなクラッシュが多数報告されていた。今回の NVIDIA もドライバのアップデートでことなきを得たが毎回その限りではない。

新商品を買ってネットで人気者になりたい場合やとにかく新しいものが好きな人以外は発売されてから1ヶ月くらいはベータ期間と思って眺めていたほうが良いだろう。

コメント

タイトルとURLをコピーしました