CrystFEL 0.11 の Millepede ファイルの形式について
CrystFEL 0.11 のジオメトリ精密化では Millepede を使うようになっているが、そこに gradient を渡すための .bin
ファイルの様式が Millepede のマニュアルにも書いていないので、CrystFEL のソースコードを読んで調べた。
一つの .bin
ファイルには複数の結晶に由来する情報が連続して入っている。各結晶データの頭には int32 で要素数が書いてある。そこから 2 を引いて半分にしたのを N とすると、{[要素数 (N + 1) x 2 を表す int32] 0 [要素数 N の float32 配列] 0 [要素数 N の int32 配列]} という構造になっており、これが結晶の数だけ繰り返される。
Float32 配列は、{residual [local parameter についての gradient の配列] ESD [global parameter についての gradient の配列]} という内容になっている。どれが何に対する微分か区別するため、要素数 N の int32 配列のほうに変数の ID が入っている。
Local parameter は 1, 2, 3, ... 9 という ID で、その結晶の逆格子ベクトル asx, asy, asz, ... の 9 個。
Global parameter は 各 detector hierarchy における並進 trans_x/y/z と回転 rot_x/y/z であり、
the global gradient IDs, which are a hierarchical serial number, e.g. 4020X = 2nd subgroup of 4th group. X is the direction of the gradient (1-3 = x,y,z translation, 4-6 = x,y,z rotation) and all six should appear for every measurement.
https://github.com/taw10/crystfel/issues/13#issuecomment-2107020849
という具合に上位の桁(100 ごとに見る)でパネルやグループ番号が分かる。
ID 0 は特殊な意味を持ち、local parameter と global parameter の境目を表す。ここには、residual と ESD が入っている。
実際に int array を見てみるとこんな感じ:
# 1 つ目の strong spot, fast scan coordinate について 0 (residual), 1, 2, 3, 4, 5, 6, 7, 8, 9 (9 つの逆格子ベクトルに対応) 0 (esd), 601, 602, 603, 604, 605, 606 (panel 6 の並進xyzとxyz周りの回転), 1, 2, 3, 4, 5, 6 (検出器全体の並進と回転) # 1 つ目の strong spot, slow scan coordinate について同様 0 (residual), 1, 2, 3, 4, 5, 6, 7, 8, 9 (9 つの逆格子ベクトルに対応) 0 (esd), 601, 602, 603, 604, 605, 606 (panel 6 の並進xyzとxyz周りの回転), 1, 2, 3, 4, 5, 6 (検出器全体の並進と回転) # 1 つ目の strong spot の excitation error (Ewald sphere offset) 0 (residual), 1, 2, 3, 4, 5, 6, 7, 8, 9 (9 つの逆格子ベクトルに対応) 0 (esd) # Excitation error は spot xy に無関係なので、パネルのジオメトリについての微分がないことに注意。 # この後は、2 つ目の strong spot, fast scan coordinate について同様に続く。 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 701, 702, 703, 704, 705, 706, 1, 2, 3, 4, 5, 6, ...
2 つ目の strong spot は 7 つ目のパネルに載っていることも分かる。
この点を実装し、複数の bin ファイルから RMSD を計算するものを作った。
読んだ
Fab を剛直化して、低分子量蛋白質の SPA に利用
cisTEM や M の開発者を擁する Genentech さえ CryoSPARC を使う時代か……。
Was CryoSPARC essential for data processing? Did they try RELION, M and/or cisTEM for refinement? I was rather surprised to see even Genentech purchased CS even though developers of cisTEM and M are there. I am interested to know how different programs are used in practice and if there are cases where one program performs significantly better than the others. People around me often say refinement of clean particles is one thing and bootstrapping from dirty autopicked particles is another, probably harder, hurdle.
I hope they upload raw movies to EMPIAR upon publication. There are not many small protein datasets on EMPIAR. Honestly speaking I am not sure if I myself will do reprocessing, but certainly these would be a good addition to EMPIAR and diversify its datasets.PC watch "AI 時代に不可欠の「HBM」。容量も速度も飛躍したが、開発がさらに加速"
HPC や AI/ML のプロ向けだよね。さくらのナレッジ "CDN ってそもそも何? なんかサーバの負荷が下がるって聞いたんだけど! 〜 Web 制作/運営の幅が広がる CDN を知ろう" 1, 2, 3, 4
CDN 自体の概念は知っていたが、CNAME を使う仕組みなど細かいことは知らなかったので読んだ。Cloudflare CDN が容量制限なく無料ということに驚いている。BBC "Culture Travel Earth Video Live King Charles: First official portrait since coronation is unveiled, painted by Jonathan Yeo"
王族の肖像画の伝統的なスタイルを破ること自体はいいけど、さすがにこれは赤すぎないか?- sitter: 絵画のモデル(今回のような立っているポーズでも使えるようだ)
- sanctity: 神聖な義務
- livery: 制服
PC watch "東芝、30 TB 超えの大容量 HDD の実証に成功。2025 年にもサンプル出荷"
HDD もいいけど、エンタープライズ用ではない光ディスクとかテープの開発が完全に止まってしまったのは残念。4K ビデオ編集とか配信が一般向け PC の用途にも上がる以上、そういうデータを長期保存する需要はあると思うんだけどなあ。tom's HARDWARE "Not dead yet: Intel's Battlemage G21 GPU spotted in oneAPI code update"
Intel が Intel Arc 7xx シリーズだけで dGPU から撤退するという噂が否定されそうでよかった。Gazlog "AMD RDNA5 は完全新規のアーキテクチャーに。GPU 業界に Zen 並の衝撃を与える事を目指す?"
AMD も RDNA4 はミドルレンジで我慢して、RNDA5 で勝負するという噂。Gazlog "Intel Raptor Lake の不具合で PL2 は 188 W がデフォルト値に。5 月中に設定を反映するように要請"
不可逆的に壊れるような power limit を前提にベンチを取って宣伝してたら炎上不可避ですわ。ASCII "インテル CPU を安全に使える設定? 「Intel Baseline Profile」のパフォーマンスを検証【暫定版】"
そりゃ 100 度に張り付くような運用には無理があるって。そうなってしまうような BIOS 設定がデフォルトのマザーボードも怖すぎる。"Intel第 13 ~ 14 世代 CPU が破損・劣化する不具合について、Intel の新たな声明"
マザーボードメーカーが対策のために Intel Baseline Profile なるものを使えと言っていたが、Intel 自身は Intel Default Settings なるものを推奨しているのか。Gazlog "Snapdragon X シリーズは Intel Raptor Lake に比べて半額のコスト。バッテリーも 2 倍長持ちに"
興味深いけど、最近の XPS はポート少なすぎだから却下。ARM アーキテクチャであること自体が電力効率を良くしているわけではないとのことだが、Intel の 1360P とかも、周波数抑えて動作させればバッテリ長持ちするの? でも相手は「同じ性能で ◯ % 低消費電力」といった宣伝もしてるよね。Gazlog "Apple M4 のベンチマークスコアが高かった理由は ARMv9 化? IPC は M3 から 3 %向上に留まる可能性"
ARMv9 になって SVE (scalable vector extension) や SME (scalable matrix extension) が入ったらしい。Gazlog "NVIDIA GeForce RTX 5090 と RTX 5080 は数週間差で発売。RTX 5090 の価格はかなり高めに?"
512 bit 幅の GDDR7 を搭載するらしい。いったいいくらになるんだよw