[2019/1] 個人用ディープラーニングにおすすめのGPU!コスパのよいRTX2070。

ディープラーニングの学習や推論をGPUなしで行うと、とてつもなく時間がかかります。

GPUを導入すれば、モデルにより数倍から数十倍の速度向上になります。

ここでは、個人でも買える価格のGPUの中から、コスパの良いおすすめのGPUを紹介します。

GPUのどのスペックをみるか

チップメーカー

GPUチップには、NVIDIA製とAMD製がありますが、2019年1月現在ではディープラーニングのライブラリがAMDにしかほぼ対応していないので、NVIDIAから選ぶことになります。

シリーズ

GPUコンピューティング用のチップもありますが、趣味や個人用途で予算が10万円前後かそれ以下の場合は、ゲーム用として販売されているGeForceシリーズを使用することになるかと思います。

 

GeForceでは一世代前のGTX10シリーズでは、仮想通貨マイニングに使われた関係で全体的に値段が高騰しています。

そのため、2018年後半に発売が始まっているRTX20(Turing)世代のほうが、性能が良い上、比較的値段が安くなっています。

 

そのため2019年1月現在では、RTX20シリーズがおすすめになります。

今後、GTX10シリーズが値崩れすることになれば、GTX10シリーズもよいかもしれません。

メーカー

グラフィックボードを供給しているメーカーには、ASUS、ELSA、GIGABYTE、MSI、Palit、ZOTAC、玄人志向などがあります。

どのメーカーのものでも良いと思いますが、ゲームと違ってディープラーニングでは常にGPUコアをぶんまわすことになりますので、クーラーファンがしっかりしてそうなものを選ぶと良いでしょう。

計算速度

機械学習における性能は、計算速度やメモリバンド幅に依存すると考えられます。

とくにCNNなどの畳み込み計算には、計算クロック数(FLOPS)が効いてきますので、CNNをする方は計算速度に注目して選定をしましょう。

以下の一覧表では、32ビット浮動小数点の計算速度(FP32)を示しています。

メモリバンド幅

RNN、LSTMの訓練では多数の行列の掛け算が行われますが、メモリバンド幅が広いほうこの計算は早くなります。RNN、LSTMに使うかたは、メモリバンド幅を重視するとよいでしょう。

テンソルコア

RTX20シリーズは深層学習用のテンソルコア(Tensor Core)がついています。

これは、これまではGPUコンピューティング用のV100などに搭載されていたものです。

 

テンソルコアとは、具体的には積の計算精度が16ビット(FP16)に落とされた混合精度の計算ユニットです。

深層学習では、ABCDを行列とするとD = AB + Cという計算を行うことが多いですが、テンソルコアではAとBはFP16とし、積の結果のABとC、そしてこれらの和DはFP32(またはFP16も可)の精度となります。

(そして、Dは次の計算ではAまたはBとなりますが、このときにFP16に丸めることになります。)

積の出力と和ではFP32となるので、すべてをFP16で行うよりは精度は出ることになります。

テンソルコアでは、一部の計算精度をFP16に落とす代わりに、多くのコアを載せて高速化することを目的にしているようです。

 

1つのテンソルコアでは、4×4行列の積和算を4つ並列に行うことができます。

Tensor Coreを使えば、CNNの計算が30~100%早くなるという話があります。

積がFP16となることを許容できるならば、RTX20シリーズではテンソルコアの恩恵を得られることになります。

ビデオメモリ

ビデオメモリに乗り切らないデータは、PC本体のメモリやHDDアクセスが発生して計算速度が落ちますので、ビデオメモリに乗る量が一度に計算できるデータ量ということになります。

画像データや自然言語処理はメモリ要求が大きくなりがちですので、そのような用途に使う方はビデオメモリが大きい製品を選びましょう。

 

趣味用途でも少なくとも6 GBはあるとよいと言われていましたが、現行のRTX20シリーズでは8 GBの製品が標準的なため、こだわりがなければ8 GBの製品でよいでしょう。

11 GBは欲しいという方は、RTX2080Tiを選択することになるかと思います。

スペック一覧

機械学習・ディープラーニング用に適したGPUのスペックを一覧で示します。

GPU ビデオ
メモリ
FP32
(TFLOPS)
メモリ
バンド幅
(GB/s)
パフォーマンス コスパ
(2019/1)
参考価格
Titan V 12GB 13.8 653 0.81
0.21
42.2万円〜
RTX2080Ti 11GB 13.4 616 0.68
0.51
15.4万円〜
RTX2080 8GB 10.0 448 0.52
0.67
9.2万円〜
RTX2070 8GB 7.4 448 0.47
0.9
6.2万円〜
Titan Xp
(Pascal)
12GB 12.5 548 0.43
0.26
19.2万円〜
GTX1080Ti 11GB 11.5 484 0.4
0.57
8.3万円〜(discon)
Titan X
(Pascal)
12GB 11 480 0.385
0.30
14.9万円〜
GTX1080 8GB 9 352 0.29
0.5
6.8万円〜
GTX1070Ti 8GB 8.1 256 0.24
0.59
4.8万円〜
GTX1070 8GB 6.5 256 0.225
0.59
4.5万円〜
GTX1060
(6GB)
6GB 4.4 224/
240
0.21
0.1
2.5万円〜
Titan RTX 24GB 16.2 672 n/a n/a 39万円〜($2499~)

パフォーマンスとコスパについては、次のサイト(英語)を参考にしました。パフォーマンスは、FLOPS、バンド幅などのスペックから計算した推測値で、TPUを1とした値です。コスパはパフォーマンスを参考価格で割ってスケールした値です。

おすすめは?

価格重視、学習や趣味用に安く深層学習用計算機をローカルにつくりたい方

→ GTX1060 (6GB)

GTX1060は価格に対するパフォーマンスがとても良いです。

趣味のグラフィックカードに7万円も出したくないという方は多いと思いますが、GTX1060は3万円程度から手に入ります。

元々お手頃価格でしたが、現在はRTX20シリーズが出たことでさらに安くなっている製品もあり、品切れになるまでですが良い選択肢になります。

 

メモリが6 GBと少なめではありますが、研究用途やKaggleで上位を狙いたいというわけではなく、個人の学習用途や趣味で使うのに向いています。

これから深層学習を始めようという方は、まずはGTX1060を使ってみてはいかがでしょうか。

性能に不満を感じた頃には、上位カードがもっと安くなっているかもしれません。

 

ただ7万円程度出せるならば、次のRTX2070の方が少し複雑なことをしたくなったときでも性能に余裕がありますので安心です。

コスパのよいGPUがほしい方、現在の万人向け

→ RTX2070

RTX 2070は、GTX1060の次か同じくらいにコスパがよいGPUです。

新世代のコアですので、テンソルコアが使えます。

メモリは8 GBですので、大きいメモリを必要とする計算には向きませんが、テンソルコアを使う16 bit計算ならば半分のメモリで済みますので、おおよその計算ができるようになります。

 

価格は7万円程度からと安くはありませんが、これ以下の性能だと複雑な計算をしたくなったときに少し心配です。

学習でいろんなモデルを試してみたい方、Kaggleにもちょっと参加してみたいという方には、このRTX2070がおすすめです。

これ以上の性能だとコスパが悪くなっていきますので、明確なスペック要求がある場合以外は、このGPUが良いでしょう。

 

2018年10月以前だと、7万円程度だとGTX1080を選ぶしかなかったのですが、2019年1月現在ではそれよりも性能がよいRTX2070が選べるので、そう考えるとお得です。

メモリがたくさん欲しい方

→ RTX2080Ti

研究用途などで、11 GBのメモリが欲しいという方は、GTX1080TiかRTX2080Tiかということになりますが、GTX1080Tiはディスコンになりつつあり性能も劣りますので、RTX2080Tiがおすすめということになります。

価格は16万円程度〜になります。

 

2018/12に出たTitan RTXでは、価格は日本円で39万円程度〜ですが、24 GBのメモリを積んでいます。

2080Tiを二枚刺しするのと迷うところですが、選択肢が増えたのは嬉しいところです。

まとめ

コスパのよいGPUは、GTX1060 (6GB)とRTX2070です。

学習用途での使用で価格重視の方には、3万円程度で買えるGTX1060 (6GB)がおすすめです。

もうすこし突っ込んだ計算もしたいという方には、7万円程度からになりますが、テンソルコアの付いたRTX2070がおすすめです。

 

以上、[2019/1] 個人用ディープラーニングにおすすめのGPU。でした。

参考文献

             こんな記事も読まれています          

コメントを残す