ココリーネの趣味部屋

鳳凰院凶真のGT1030チョー調教日記。実力はいかに!?

岡部倫太郎がGT1030を持っている

Nvidia Geforce GT1030、それはローエンドクラスのグラボながらもGPUコアに新しめのpascalアーキテクチャを採用している。すると 鳳凰院凶真もGT1030を使ってStable diffusionでの画像生成やLM-studio等を使ったLLMの推論が出来るんじゃないのか?と思ったわけだ。フゥーハハハ!!

オカリン
オカリン

これまでGT710、GT440をテストしたがAIの推論には全く使えず、無駄な時間ばかりが消費され、ラボメンも(大嘘)絶望の淵に立たされていた。がしかし!このGT1030ならやれるぞ!!フゥーハハハ!!

GT1030のコアとやらを見せてもらおう!

GT1030の基盤の写真
オカリン
オカリン

見えるだろう、このpascalアーキテクチャの中でも最小で最弱を誇るGP108コアを!!(汚い)

GP108コアの写真
こいつはあのGTX1050,1050Tiに使われているGP107コアの約半分の規模しかない。 しかしこいつはGT710,GT440のkeplerアーキテクチャやfermiアーキテクチャと違い、CUDAのCompute Capabilityが6まで対応しているぞ!!
これにより、CUDAのバージョンが12まで使用可能なので、現在stable diffusion、LM-studio等で使われているCUDAのバージョンを完璧にカバーしているっ!!

CUDA Compute capability一覧表
Compute capability一覧表(wikipediaより)
オカリン
オカリン

これぞ神によってもたらされた機運....シュタインズ・ゲートッッッ・・・・!!!

GT1030の実力はいかに!?

オカリン
オカリン

では早速このGT1030がどのくらいAIの推論に使えるのかどうかをチェックしていくぞ!!ダル!!

試しにStable-diffusion-webui-forgeを使い、512*512の画像生成を行った!!(モデルはnai.ckpt、28stepで生成) Forge版の為、--lowvram等のcommandline_argsの設定は投入していない。

GT1030で生成した涼宮ハルヒの画像
[生成時間 1分27秒]
オカリン
オカリン

なんだこのガタガタな涼宮ハルヒは!!!ダル!どうなっているんだ!?

ダル
ダル

オカリン~流石にVRAMが2GBしか載ってないGT1030じゃ低品質なSD(Stable-Diffusion)モデルを動かすのが精一杯なんだお!

ダル
ダル

ついでに僕がRTX4060tiで生成したSDXL涼宮ハルヒちゃんの画像を載せておくお

CUDA Compute capability一覧表
[RTX4060ti 16GBで生成した涼宮ハルヒ 生成時間 13秒]
オカリン
オカリン

もうGT1030使うのやめたくなりますよ~(キャラ崩壊)

オーバークロックしてみた

オカリン
オカリン

性能が足りないのならオーバークロックすればいいのだ!!フゥーハハハ!!

オーバークロックテスト

コアクロックを+250Mhzにしたところ画像生成中に画面がブラックアウトし、ログに"RuntimeError: CUDA error: the launch timed out and was terminated"と出て生成が 中断されてしまった。コアクロックは+240Mhzが 限界のようだ。しかし、メモリクロックはもっと余裕がありそうだぞ!!

ダル
ダル

このエラーはWindowsのTDR(Timeout Detection and Recovery)という機能が、一定時間応答が無かったGT1030をフリーズしたと誤認して強制終了させている 現象だお。レジストリエディタでTdrDelayの値を増やせば完走できるんじゃね?

オーバークロックテスト

最終的にこのような設定になった。メモリクロックはバーを振り切って(+1000Mhz)も普通に動いたが、Gemini君によるとメモリクロックの上げすぎは ビットエラーが多発する為推奨しないとのこと。また、GT1030等の低価格ボードは電圧がハードウェアで固定されている事が多いため、Core Voltageの設定も意味がないとのこと。

ハローアスカベンチの結果

オーバークロックテスト

オーバークロック状態でベンチを回してみた結果、12分44秒(764秒)で完走した。ネット上のデータよりかなり速いのはForge版を使っているからなのか...?

LM-Studioでの使用感

オーバークロックテスト

Qwen3.5 2Bモデルの推論速度は約17token/secだった。生成内容も2Bとは思えないクオリティ、流石Qwen3.5だ!!この速度が出れば人間の読む速度よりはやく推論する事が出来るぞ!!ダル!!

しかしここでGT1030最大の弱点が!!

オカリン
オカリン

画像生成中もボードのワット数が30Wを超えようとするとクロックが下がってしまうのだが...!?

クロックがフラフラしている
ダル
ダル

あ~気づいちゃったかー

ダル
ダル

GT1030はボードのTDPが30Wまでに制限されているから、どんなにパワーを出してクロックを上げようとしても30Wを超えないようにセーブされちゃうんだお

オカリン
オカリン

何だとっ!!それではいくらオーバークロックや電圧を上げたりしても30Wの制限に達した瞬間性能を制限されてしまうという事なのか...!?

ダル
ダル

そうだお。そもそもGT1030のボードじゃあ30Wを超えるパワー出したらボードの貧弱なVRMが火を噴くんじゃね?

未来ガジェット研究所内に散らばった大量のGT1030
オカリン
オカリン

それでは実験のために大量に購入したこのGT1030はどうすればいいのだ!?しかしこれも神に定められし、運命石の扉(シュタインズ・ゲート)の選択...!!
エル・プサイ・コングルゥ

おまけ:今回使用したGT1030の詳細(GPU-Zより)

GT1030 GPU-Zでの詳細表示結果

GDDR5版だ!!フゥーハハハ!!

※この記事とシュタインズ・ゲートは一切の関係がありません。

× 拡大画像