Deep Learning (CNN) による銀河形状分類(その2)

前回の記事の続き。

epochを重ねても訓練/テスト誤差が改善しないのはどうしてだろうか? この疑問に対して、色々と試した結果を以下にまとめている。

銀河イメージ

今回使用した、Galaxy10 DECals Datasetがどのようなデータかここで見てみたい。

[続きを読む]

姫野ベンチマークをTITAN Vで実行

はじめに

先週、NVIDIA TITAN Vをヤフオクで入手した。その実力次第を知るため、姫野ベンチをOpenACCでコンパイル・実行した。対象のGPUは初代TITAN、GTX 1080、RTX A4000、および今回入手したTITAN Vで、各単精度、倍精度での実行結果を測定した。

[続きを読む]

Stable Diffusion with Diffusers

はじめに

先月、@ITの記事で、Stable Diffusionという画像生成系のAIソフトを初めて知った。画像生成系は結果が目に見えるので、インパクトがある。Stable Diffusionについては、該当の記事を読んでいただければと思う。

ここでは、Diffusersというライブラリを使って簡単にStable Diffusionを試せるjupyter-labを作成したので、紹介する。

[続きを読む]

KubernetesでGPUクラスタ構築 〜 初めの一歩

はじめに

約1ヵ月前に、この記事でkubernetesを使ってGPUクラスタを構築する記事を書いた。この時はGPUポッドがPending状態で動作しなかった。その後、とある方の助言もあって何とか動くようになったので、ここにまとめる。

自分の環境では、あるノードを起動しないとGPUポッドが立ち上がらないという問題もあるし、更にノード内のGPU指定、更にノードの指定など、想定していることも出来ていないので、「はじめの一歩」とした。

[続きを読む]

ディスプレイ解像度を変更 〜 xrandr BadMatchへの対応

モチベーション

Ubuntuをインストールした直後、ディプレイの解像度が1368x768になっていた。 端末(Terminal)を複数開いて作業する際の画面が狭く不便であったこと、せっかく1920x1080が表示できるディスプレイ(JAPANNEXT JN-MD-IPS1562FHDR)に接続しているのでそのサイズで表示させたかった。

解像度を変更しようとしたが、少しハマったので、経緯をここにまとめる。

[続きを読む]

KubernetesでGPUクラスタ構築(未完成)

モチベーション

Kubernetesの勉強を兼ねて、自宅に設定している複数のワークステーションを使って、GPUクラスタを作ることにチャレンジ。

Kubernetesを初めて触った自分には、ハードルが高かった。というのもインストール時にのみ必要な操作か、(運用時の)クラスタ構築時に必要な操作か、を切り分けを資料で学びながらのインストールとなったので。

現状では、GPUクラスタは動作していない! この資料は、未完成です。

[続きを読む]

ServerCatを試す

モチベーション

以前から、自宅に設置しているワークステーションの状態を監視する良い機能(ソフトウェア)がないか?とおもっていた。先日、この記事を読んで、今回紹介するServerCatを試してみようと思った。

ポイントはiOS/MacOSから監視できるという点。自分はMacOS版しか試していない。

[続きを読む]

RTX A4000とGTX 1080との実行速度比較

モチベーション

この記事DCGANを実行し、これまで使っていたGTX 1080と比べ、新たに導入したRTX A4000が、体感的に速くなったと書いた。 また、自分の環境では、jupyterlabのnotebookをNFSサーバーに置いて、複数のサーバから使っている(同時実行は無しとの運用で)。以前から、notebookをローカル環境に置くと速くなると感じていた。

今回は、GTX 1080/RTX A4000、NFS/ローカルの組み合わせで、実アプリの実行速度を計測する。

[続きを読む]