KubernetesでGPUクラスタ構築(未完成)

モチベーション

Kubernetesの勉強を兼ねて、自宅に設定している複数のワークステーションを使って、GPUクラスタを作ることにチャレンジ。

Kubernetesを初めて触った自分には、ハードルが高かった。というのもインストール時にのみ必要な操作か、(運用時の)クラスタ構築時に必要な操作か、を切り分けを資料で学びながらのインストールとなったので。

現状では、GPUクラスタは動作していない! この資料は、未完成です。

[続きを読む]

RTX A4000とGTX 1080との実行速度比較

モチベーション

この記事DCGANを実行し、これまで使っていたGTX 1080と比べ、新たに導入したRTX A4000が、体感的に速くなったと書いた。 また、自分の環境では、jupyterlabのnotebookをNFSサーバーに置いて、複数のサーバから使っている(同時実行は無しとの運用で)。以前から、notebookをローカル環境に置くと速くなると感じていた。

今回は、GTX 1080/RTX A4000、NFS/ローカルの組み合わせで、実アプリの実行速度を計測する。

[続きを読む]

NVIDIA RTX A4000 (sm_86)上でPytorchを使う

はじめに

先日、ジーデップ・アドバンス(以下、GDEP)より、NVIDIA RTX A4000を購入した。GDEPは法人メインの取引だと思ってたので、個人購入可能かを質問し、可能と分かったので、何回かやり取り(見積り、入金)の後、先日入手した。

早速A4000を使って、このDCGANを試した。自分の環境で、A4000上でPytorchを使ったら、少しハマった。状況、原因、対応などについて、ここにまとめる。タイトルにある「sm_86」は今回のキーワード!

[続きを読む]
GPU  A4000  Pytorch