2024-05-09 (Thu)

AlphaFold3

AlphaFold3 の論文が Nature に出たが、ソースコードもモデルの重みも非公開であることに失望する声があがっている(1, 2, 3)。公開されている Web サービスでは、一日に予測できる数が制限されている・非商用利用限定というだけでなく、出力を他の構造予測の学習に使ったり docking 計算に使うことも禁じられていることに不満の声。その上、査読者の一人が、コードを要求したが叶えられず、むしろ査読から外されたと証言した(1, 2, 3, 4)ことで、批判の声があがっている(1, 2)。とりさんとしては、ソースコード非公開の新手法の論文をたくさん見てきたし、DeepMind をはじめとする企業由来の論文がコードを非公開にするのはいつものこと(むしろ AlphaFold2 が例外だった)ので、今更驚きはない(同様の声)。ただ、ろくな検証も再現もできないなら、学術論文ではなくて、ただの宣伝だという指摘(1, 2, 3, 4)には同意せざるをえない。本来、学術誌が取り上げるべきではないんですよ(同様の声)。

この段落は 5/10 追記: AlphaFold3 論文において、査読者にさえコードが提供されなかった件、原則としては提供しなければならないが編集部が判断できるとしているそうだ。その判断の公平性透明性が問われることになるだろう。(本論文は Open Access だが雑誌としては)購読料を徴収している以上、きちんと査読を行わないと商品として不適切だという声も。また、コード非公開を決めたのは開発者ではなく、もっと上の経営陣ではという意見もあれば、そういう環境を選んだのは開発者本人だという声もみられた。

ただ、CryoSPARC や XDS や ChatGPT は平気で使うくせに、AlphaFold3 のコードやモデルが非公開なのを残念がったり、Nature は掲載を認めるべきでなかったとか言ってる人が多いの滑稽ですわ。何をいまさら。とっくの昔に諦めて/幻滅して、構造生物学界隈に愛想を尽かしているとりさんは高みの見物。

Very few structural biologists complained about XDS, CryoSPARC, ChatGPT etc and suddenly many are raising their voice about AlphaFold3. Very strange. DeepMind has been secretive (AlphaFold2 was a rare exception) and Nature has published many method papers without codes. If I were still a serious structural biologist, I might be furious and outraged against the closed nature of AlphaFold 3. But I have been disillusioned and left the field years ago. I no longer feel anything about this (and this is good for my mental health).

構造生物学者のお兄ちゃんとお姉ちゃんは、ガチで危機感を持ったほうがいいと思うな〜。AlphaFold2 が出た時に「もう構造生物学オワコンじゃんw」って言ったら、「リガンドの結合は予測できないし……(震え声)」って言ってたよね? AlphaFold3 でリガンドの結合も予測できるようになったんですけど?? ねえねえ、今どんな気持ち?

「構造予想はあくまで予想、実験で確認しないと駄目」? でもさー、目的は構造そのものじゃなくて、機能とか創薬なんでしょ? 予測構造を元に変異体実験で確認すれば良くない? 金やポストが欲しいからって、顔真っ赤にして自分の存在意義を盛るのまじダサくてドン引き〜

といった趣旨のことを、学位審査・予算申請・論文査読・採用面接などで言われることが容易に想定されるので、各自、相手をわからせられるように準備しておきましょう。実際、AlphaFold2 の時代にすでに話題になっています(CCP4BB メーリングリストの去年のスレッド)

これについて、とりは模範解答は提供しません。そういう相手を説得するより、最初から価値観を共有しているところに行くべきだと思っているからです。そんな場所がない? だったら、自分は必要とされていないんだなと思って、素直に引退します。

(流行の煽り構文を各種取り入れてみたが、普段読まないジャンルなのでクオリティを上げられなかった。というか、最初の 2 ツイートだけ RT されて誤解されて炎上しそうで怖いw 参考: 健常者エミュレータ事例集 「メスガキ文化を知らない相手をメスガキ構文で煽ってはいけない」)

5/11 追記: この分野の研究は「蛋白質の構造を解いて、機能に重要そうな場所を探して、そこに変異を導入したりして実際に活性が変化することを確認する」という流れが多いので、生物系の人には「予測構造を元に変異を設計して活性が変化することを確認すれば十分じゃないか」という立場の人も増えている。そういう立場の人にとって、構造は最終目的ではなく、蛋白質の機能を理解するとか薬を作るといった目的のための手段に過ぎないので、予測構造から得られる作業仮説が当たっている確率が十分に高ければそれでいいようだ。私自身は、実験的に得られた構造自体に意義があると考える立場だが、そう考えない人が増えているということを示すために、あえて煽りっぽい文体で彼らの言い分を書いた。

I see many people say that biochemical experiments (e.g. mutations based on predicted structures) are a necessary and sufficient way of validation, because for them, atomic coordinates are not the final goal but merely a way to generate working hypotheses. I myself see values in experimental coordinates themselves, regardless of whether they answer "biological" questions, but as more and more "biologists" join the field (especially after SPA revolution), the general trend seems changing. Sorry, but I won't explain the values of coordinates themselves, because I am tired of explaining something so obvious to me only to be met with disagreements. In addition, I don't see the need to justify my values or convince others. People have different values. They live in their worlds and I live in mine.

読んだ