[2019] 個人用ディープラーニングにおすすめのGPU！コスパのよいRTX2070。

2019年1月23日2020年10月6日

ディープラーニングの学習や推論をGPUなしで行うと、とてつもなく時間がかかります。

GPUを導入すれば、モデルにより数倍から数十倍の速度向上になります。

ここでは、個人でも買える価格のGPUの中から、コスパの良いおすすめのGPUを紹介します。

GPUのどのスペックをみるか

GPUチップには、NVIDIA製とAMD製がありますが、2019年1月現在ではディープラーニングのライブラリがNVIDIAにしかほぼ対応していないので、NVIDIAから選ぶことになります。

GPUコンピューティング用のチップもありますが、趣味や個人用途で予算が10万円前後かそれ以下の場合は、ゲーム用として販売されているGeForceシリーズを使用することになるかと思います。

GeForceでは一世代前のGTX10シリーズでは、仮想通貨マイニングに使われた関係で全体的に値段が高騰しています。

そのため、2018年後半に発売が始まっているRTX20(Turing)世代のほうが、性能が良い上、比較的値段が安くなっています。

そのため2019年1月現在では、RTX20シリーズがおすすめになります。

今後、GTX10シリーズが値崩れすることになれば、GTX10シリーズもよいかもしれません。

グラフィックボードを供給しているメーカーには、ASUS、ELSA、GIGABYTE、MSI、Palit、ZOTAC、玄人志向などがあります。

どのメーカーのものでも良いと思いますが、ゲームと違ってディープラーニングでは常にGPUコアをぶんまわすことになりますので、クーラーファンがしっかりしてそうなものを選ぶと良いでしょう。

機械学習における性能は、計算速度やメモリバンド幅に依存すると考えられます。

とくにCNNなどの畳み込み計算には、計算クロック数(FLOPS)が効いてきますので、CNNをする方は計算速度に注目して選定をしましょう。

以下の一覧表では、32ビット浮動小数点の計算速度(FP32)を示しています。

RNN、LSTMの訓練では多数の行列の掛け算が行われますが、メモリバンド幅が広いほうこの計算は早くなります。RNN、LSTMに使うかたは、メモリバンド幅を重視するとよいでしょう。

RTX20シリーズは深層学習用のテンソルコア(Tensor Core)がついています。

これは、これまではGPUコンピューティング用のV100などに搭載されていたものです。

テンソルコアとは、具体的には積の計算精度が16ビット(FP16)に落とされた混合精度の計算ユニットです。

深層学習では、ABCDを行列とするとD = AB + Cという計算を行うことが多いですが、テンソルコアではAとBはFP16とし、積の結果のABとC、そしてこれらの和DはFP32(またはFP16も可)の精度となります。

(そして、Dは次の計算ではAまたはBとなりますが、このときにFP16に丸めることになります。)

積の出力と和ではFP32となるので、すべてをFP16で行うよりは精度は出ることになります。

テンソルコアでは、一部の計算精度をFP16に落とす代わりに、多くのコアを載せて高速化することを目的にしているようです。

1つのテンソルコアでは、4×4行列の積和算を4つ並列に行うことができます。

Tensor Coreを使えば、CNNの計算が30~100%早くなるという話があります。

積がFP16となることを許容できるならば、RTX20シリーズではテンソルコアの恩恵を得られることになります。

ビデオメモリに乗り切らないデータは、PC本体のメモリやHDDアクセスが発生して計算速度が落ちますので、ビデオメモリに乗る量が一度に計算できるデータ量ということになります。

画像データや自然言語処理はメモリ要求が大きくなりがちですので、そのような用途に使う方はビデオメモリが大きい製品を選びましょう。

趣味用途でも少なくとも6 GBはあるとよいと言われていましたが、現行のRTX20シリーズでは8 GBの製品が標準的なため、こだわりがなければ8 GBの製品でよいでしょう。

11 GBは欲しいという方は、RTX2080Tiを選択することになるかと思います。

機械学習・ディープラーニング用に適したGPUのスペックを一覧で示します。

GPU	ビデオメモリ	FP32 (TFLOPS)	メモリバンド幅 (GB/s)	パフォーマンス	コスパ (2019/1)	参考価格
Titan V	12GB	13.8	653	0.81	0.21	42.2万円〜 Amazon 楽天 Yahoo!
RTX2080Ti	11GB	13.4	616	0.68	0.51	15.4万円〜 Amazon 楽天 Yahoo!
RTX2080	8GB	10.0	448	0.52	0.67	9.2万円〜 Amazon 楽天 Yahoo!
RTX2070	8GB	7.4	448	0.47	0.9	6.2万円〜 Amazon 楽天 Yahoo!
Titan Xp (Pascal)	12GB	12.5	548	0.43	0.26	19.2万円〜 Amazon 楽天 Yahoo!
GTX1080Ti	11GB	11.5	484	0.4	0.57	8.3万円〜(discon) Amazon 楽天 Yahoo!
Titan X (Pascal)	12GB	11	480	0.385	0.30	14.9万円〜 Amazon 楽天 Yahoo!
GTX1080	8GB	9	352	0.29	0.5	6.8万円〜 Amazon 楽天 Yahoo!
GTX1070Ti	8GB	8.1	256	0.24	0.59	4.8万円〜 Amazon 楽天 Yahoo!
GTX1070	8GB	6.5	256	0.225	0.59	4.5万円〜 Amazon 楽天 Yahoo!
GTX1060 (6GB)	6GB	4.4	224/ 240	0.21	0.1	2.5万円〜 Amazon 楽天 Yahoo!
Titan RTX	24GB	16.2	672	n/a	n/a	39万円〜($2499~) Amazon 楽天 Yahoo!