姫野ベンチマークを使ってOpenMPIの性能を再測定する

はじめに

1ヶ月前のこの投稿で、姫野ベンチマークによるOpenMPIの性能を測定した。その記事を見た先輩からhostfileの順番について改善点を指摘していただいた。この投稿では、hostfileを修正して再度性能測定した結果をまとめた。

変更点

hostfileの記述順序でプロセスが割り当てられるので、性能の良いノード順にしたほうが良い、との指摘を受け、次のようにhostfileを記載した。

# cat myhosts
saisei slots=4
jupiter slots=4
mokusei slots=8
ganymede slots=6
europe slots=4

測定結果

起動プロセス数とslot無し/有りのMFLOPS値は以下の通りの結果であった。

np MFLOPS(slot指定なし) MFLOPS(slot指定あり)
2 9,141 9,098
4 11,258 11,262
8 20,468 20,354
16 34,813 34,751
32 20,994 13,336
64 9,006 9,002

上記の測定結果をグラフにすると次のとおり。

sjmge

前回の測定結果(slot指定有の場合)を対比したグラフは次のとおり。 ここで、前回の測定結果をhostfileの順番のホスト名(europe/jupiter/ganymede/saisei/mokusei)の頭の文字をつなげてejgsmとし、今回の測定結果を同様にsjmgeとする。

ejgsm_sjmge

トラブル

今回測定しようとして、次のようメッセージが表示された。

@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
@    WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!     @
@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
IT IS POSSIBLE THAT SOMEONE IS DOING SOMETHING NASTY!
Someone could be eavesdropping on you right now (man-in-the-middle attack)!
It is also possible that a host key has just been changed.
The fingerprint for the ED25519 key sent by the remote host is
SHA256:lrDSjoBAl2Eu4nm3LqaR/tdFVYuYh/v16Q+OwWN3Icg.
Please contact your system administrator.
Add correct host key in /root/.ssh/known_hosts to get rid of this message.
Offending ECDSA key in /root/.ssh/known_hosts:3
  remove with:
  ssh-keygen -f "/root/.ssh/known_hosts" -R "[jupiter]:12345"
Password authentication is disabled to avoid man-in-the-middle attacks.
Keyboard-interactive authentication is disabled to avoid man-in-the-middle attacks.
UpdateHostkeys is disabled because the host key is not trusted.
・・・

再度、ssh-keygenで公開鍵、秘密鍵を再作成する必要があるかと思いながら、ネットで検索すると、known_hostsで該当ホストのエントリーを削除すれば良いとあった。自分は、known_hostsをファイルごと削除した。それにより解決した。

まとめ

グラフからは、ピーク時(16プロセス時)の性能の向上が見られる。ただ20%未満の差異なので測定誤差(バラツキ)とも考えたが、np=16以外の部分は数%程度の差異なので、ピーク時には効果があったと判断している。