GPU 120 枚、全ノード 60 台弱の計算クラスタが入ったので、設定に忙しい。
読んだ
Dari のアメリカビザが半年経っても下りていないとのこと。
やはりイラン出身だという点が効いているのだろうか。Science にもそういうエッセイが以前あった。"Power Saving with Slurm"
SLURM、暇なノードの電源を自動でオフにして、job が混んできたらまた起こす機能があるらしい。うちのクラスタも待機電力が 1 台あたり 200 W 程度あるので、使ってみたい。頻繁なオンオフでハードウェアが劣化しやすくなるのではないかという点についても経験が語られている。
見た
- CNN "Video shows moment a Baltimore bridge collapses after ship collision"
こういう橋は一箇所崩れると、全部落ちちゃうんだよね。