概要

自分の興味ある分野について、調べたり、実際に手を動かしたり、分かったことをここにまとめている。

姫野ベンチマークをTITAN Vで実行

はじめに

先週、NVIDIA TITAN Vをヤフオクで入手した。その実力次第を知るため、姫野ベンチをOpenACCでコンパイル・実行した。対象のGPUは初代TITAN、GTX 1080、RTX A4000、および今回入手したTITAN Vで、各単精度、倍精度での実行結果を測定した。

[続きを読む]

Stable Diffusion with Diffusers

はじめに

先月、@ITの記事で、Stable Diffusionという画像生成系のAIソフトを初めて知った。画像生成系は結果が目に見えるので、インパクトがある。Stable Diffusionについては、該当の記事を読んでいただければと思う。

ここでは、Diffusersというライブラリを使って簡単にStable Diffusionを試せるjupyter-labを作成したので、紹介する。

[続きを読む]

KubernetesでGPUクラスタ構築 〜 初めの一歩

はじめに

約1ヵ月前に、この記事でkubernetesを使ってGPUクラスタを構築する記事を書いた。この時はGPUポッドがPending状態で動作しなかった。その後、とある方の助言もあって何とか動くようになったので、ここにまとめる。

自分の環境では、あるノードを起動しないとGPUポッドが立ち上がらないという問題もあるし、更にノード内のGPU指定、更にノードの指定など、想定していることも出来ていないので、「はじめの一歩」とした。

[続きを読む]

ディスプレイ解像度を変更 〜 xrandr BadMatchへの対応

モチベーション

Ubuntuをインストールした直後、ディプレイの解像度が1368x768になっていた。 端末(Terminal)を複数開いて作業する際の画面が狭く不便であったこと、せっかく1920x1080が表示できるディスプレイ(JAPANNEXT JN-MD-IPS1562FHDR)に接続しているのでそのサイズで表示させたかった。

解像度を変更しようとしたが、少しハマったので、経緯をここにまとめる。

[続きを読む]

KubernetesでGPUクラスタ構築(未完成)

モチベーション

Kubernetesの勉強を兼ねて、自宅に設定している複数のワークステーションを使って、GPUクラスタを作ることにチャレンジ。

Kubernetesを初めて触った自分には、ハードルが高かった。というのもインストール時にのみ必要な操作か、(運用時の)クラスタ構築時に必要な操作か、を切り分けを資料で学びながらのインストールとなったので。

現状では、GPUクラスタは動作していない! この資料は、未完成です。

[続きを読む]

ServerCatを試す

モチベーション

以前から、自宅に設置しているワークステーションの状態を監視する良い機能(ソフトウェア)がないか?とおもっていた。先日、この記事を読んで、今回紹介するServerCatを試してみようと思った。

ポイントはiOS/MacOSから監視できるという点。自分はMacOS版しか試していない。

[続きを読む]

ローカルディスク/NFSファイルのリード・ライト実行速度比較

モチベーション

この記事で、DCGANのアプリの実行時間を測定した、その際に、notebookをローカルディレクトリ、NFSマウント先に配置して実行速度を測定した。性能が高いGPUを使った場合、ローカルに比較してNFS経由が遅かったので、ローカルファイルとNFSファイルのリード/ライトで、どの程度の差があるのか性能測定した。

[続きを読む]
NFS 

RTX A4000とGTX 1080との実行速度比較

モチベーション

この記事DCGANを実行し、これまで使っていたGTX 1080と比べ、新たに導入したRTX A4000が、体感的に速くなったと書いた。 また、自分の環境では、jupyterlabのnotebookをNFSサーバーに置いて、複数のサーバから使っている(同時実行は無しとの運用で)。以前から、notebookをローカル環境に置くと速くなると感じていた。

今回は、GTX 1080/RTX A4000、NFS/ローカルの組み合わせで、実アプリの実行速度を計測する。

[続きを読む]

NVIDIA RTX A4000 (sm_86)上でPytorchを使う

はじめに

先日、ジーデップ・アドバンス(以下、GDEP)より、NVIDIA RTX A4000を購入した。GDEPは法人メインの取引だと思ってたので、個人購入可能かを質問し、可能と分かったので、何回かやり取り(見積り、入金)の後、先日入手した。

早速A4000を使って、このDCGANを試した。自分の環境で、A4000上でPytorchを使ったら、少しハマった。状況、原因、対応などについて、ここにまとめる。タイトルにある「sm_86」は今回のキーワード!

[続きを読む]
GPU  A4000  Pytorch