Diffusersの訓練時間による、TITAN VとRTX A4000比較
October 30, 2022に投稿
| Kenji Arai
モチベーション
少し前に、この記事でStable Diffusionについて紹介した。また、この記事では、NVIDIA TITAN VとRTX A4000との実行時間比較を行った。
この記事では、Stable Difffusionの学習時間で、TITAN VとA4000との実行時間比較を行う。
[続きを読む]
姫野ベンチマークをTITAN Vで実行
October 29, 2022に投稿
| Kenji Arai
はじめに
先週、NVIDIA TITAN Vをヤフオクで入手した。その実力次第を知るため、姫野ベンチをOpenACCでコンパイル・実行した。対象のGPUは初代TITAN、GTX 1080、RTX A4000、および今回入手したTITAN Vで、各単精度、倍精度での実行結果を測定した。
[続きを読む]
Stable Diffusion with Diffusers
October 10, 2022に投稿
| Kenji Arai
はじめに
先月、@ITの記事で、Stable Diffusionという画像生成系のAIソフトを初めて知った。画像生成系は結果が目に見えるので、インパクトがある。Stable Diffusionについては、該当の記事を読んでいただければと思う。
ここでは、Diffusersというライブラリを使って簡単にStable Diffusionを試せるjupyter-labを作成したので、紹介する。
[続きを読む]
KubernetesでGPUクラスタ構築 〜 初めの一歩
September 19, 2022に投稿
| Kenji Arai
• 翻訳:en
はじめに
約1ヵ月前に、この記事でkubernetesを使ってGPUクラスタを構築する記事を書いた。この時はGPUポッドがPending状態で動作しなかった。その後、とある方の助言もあって何とか動くようになったので、ここにまとめる。
自分の環境では、あるノードを起動しないとGPUポッドが立ち上がらないという問題もあるし、更にノード内のGPU指定、更にノードの指定など、想定していることも出来ていないので、「はじめの一歩」とした。
[続きを読む]
ディスプレイ解像度を変更 〜 xrandr BadMatchへの対応
September 14, 2022に投稿
| Kenji Arai
• 翻訳:en
モチベーション
Ubuntuをインストールした直後、ディプレイの解像度が1368x768になっていた。
端末(Terminal)を複数開いて作業する際の画面が狭く不便であったこと、せっかく1920x1080が表示できるディスプレイ(JAPANNEXT JN-MD-IPS1562FHDR)に接続しているのでそのサイズで表示させたかった。
解像度を変更しようとしたが、少しハマったので、経緯をここにまとめる。
[続きを読む]
KubernetesでGPUクラスタ構築(未完成)
August 21, 2022に投稿
| Kenji Arai
• 翻訳:en
モチベーション
Kubernetesの勉強を兼ねて、自宅に設定している複数のワークステーションを使って、GPUクラスタを作ることにチャレンジ。
Kubernetesを初めて触った自分には、ハードルが高かった。というのもインストール時にのみ必要な操作か、(運用時の)クラスタ構築時に必要な操作か、を切り分けを資料で学びながらのインストールとなったので。
現状では、GPUクラスタは動作していない! この資料は、未完成です。
[続きを読む]
ServerCatを試す
June 12, 2022に投稿
| Kenji Arai
モチベーション
以前から、自宅に設置しているワークステーションの状態を監視する良い機能(ソフトウェア)がないか?とおもっていた。先日、この記事を読んで、今回紹介するServerCatを試してみようと思った。
ポイントはiOS/MacOSから監視できるという点。自分はMacOS版しか試していない。
[続きを読む]
ローカルディスク/NFSファイルのリード・ライト実行速度比較
May 5, 2022に投稿
| Kenji Arai
モチベーション
この記事で、DCGANのアプリの実行時間を測定した、その際に、notebookをローカルディレクトリ、NFSマウント先に配置して実行速度を測定した。性能が高いGPUを使った場合、ローカルに比較してNFS経由が遅かったので、ローカルファイルとNFSファイルのリード/ライトで、どの程度の差があるのか性能測定した。
[続きを読む]
RTX A4000とGTX 1080との実行速度比較
April 23, 2022に投稿
| Kenji Arai
モチベーション
この記事でDCGANを実行し、これまで使っていたGTX 1080と比べ、新たに導入したRTX A4000が、体感的に速くなったと書いた。
また、自分の環境では、jupyterlabのnotebookをNFSサーバーに置いて、複数のサーバから使っている(同時実行は無しとの運用で)。以前から、notebookをローカル環境に置くと速くなると感じていた。
今回は、GTX 1080/RTX A4000、NFS/ローカルの組み合わせで、実アプリの実行速度を計測する。
[続きを読む]
NVIDIA RTX A4000 (sm_86)上でPytorchを使う
April 22, 2022に投稿
| Kenji Arai
はじめに
先日、ジーデップ・アドバンス(以下、GDEP)より、NVIDIA RTX A4000を購入した。GDEPは法人メインの取引だと思ってたので、個人購入可能かを質問し、可能と分かったので、何回かやり取り(見積り、入金)の後、先日入手した。
早速A4000を使って、このDCGANを試した。自分の環境で、A4000上でPytorchを使ったら、少しハマった。状況、原因、対応などについて、ここにまとめる。タイトルにある「sm_86」は今回のキーワード!
[続きを読む]