2019.04.13. リーマンエンジニアのブログ. 深層学習に GPU のみを使用する場合、単精度性能が GPU の最も重要な特性の 1 つです。Parallel Computing Toolbox を使用して他の計算にも GPU を使用する場合は、高い倍精度性能が重要です。これは、MATLAB の多くの関数が既定で倍精度演算を使用するためです。 aiの需要が劇的に増えている昨今、ディープラーニングで膨大な量の計算処理を必要とするシーンが増えています。そんな中、ディープラーニング用にgpuが注目される理由やgpuの選び方について、gpuの世界的リーディングカンパニーnvidia社の佐々木 邦暢氏に伺いました。 Twitter Facebook はてブ Pocket LINE. NNの学習で必要なGPUメモリを算出する . 今回は深層学習のベンチマークの結果ではなく、うんちくを書いていきます。うんちくと言っても、私が持っているものは、正答率に関してではなく、学習速度に関するものなので、一般には、全く役に立たないと思います。 ちまたで話題のDeep learning(深層学習)、作業の効率化を図るために「Deep learning向けのPCへの買い替えを検討している!」という方も多いですよね。しかし、PCと言っても、そのスペックには様々な種類があります。そこで今回は、Deep learning向けのPCを選ぶ際のポイントを6つ紹介します! GPUなのに学習速度があまり速くならない、あるいはCPUより遅い時ってありませんか?そういうとき自分はまず「nvidia-smi -l 1」でGPUの使用率を見て100%に近い値を維持できているかどうかチェックします。NVIDIA System Management Interfaceというものらしいです*1-lオプシ…
2018.11.10 .
しかし使ってみると頻繁に「out of memory exception」が発生したため、今回はGPUのメモリ使用量について調べてみました。GPUメモリ使用量 . ソフトウェア. RTX20シリーズは深層学習用のテンソルコア(Tensor Core)がついています。 これは、これまではGPUコンピューティング用のV100などに搭載されていたものです。 テンソルコアとは、具体的には積の計算精度が16ビット(FP16)に落とされた混合精度の計算ユニットです。