分解能について

結晶学のデータセットの分解能と一言でいっても、回折斑点が目視できるギリギリのところ、 が2となるところ、CC1/2* が50%となるところなど、いろいろな定義がある。最近は昔と比べて non-conservative な基準が採用されるようになりつつあり、昔の論文での解像度と現在の論文では解像度を一概に比較できなくなっている。また、論文のタイトルに "X.YÅ resolution structure of human ZZZZ receptor" などと書く時、数字のインパクトは大きいから、ついつい自分のデータセットにとって都合のよい基準を使いたくなってしまう。果たして、データセットの分解能とは何か。

実務上でも、分解能の設定に悩むことは多い。構造解析の各段階(重原子探索・位相決定・精密化)で、プログラムごとに適切な分解能というものが存在する。最近は反射の重み付け方法が改善されているから、精密化ではなるべく多くの反射を使ったほうがよいということになっているが、重原子探索では高分解能の汚い反射を持ち込んでもパターソン図にノイズを生じるだけで利益は少ないとも言われる。分子置換でも、低分解能のデータがほとんどを「決めて」しまうため、やたらと高分解能まで使っても計算時間が増えるだけだという話がある。

そういった問題意識を持ちつつ、先月出た論文 On effective and optical resolutions of diffraction data sets Acta Cryst. (2013). D69, 1921-1934 を読んだ。かなり理論よりで、苦労しながら……

最初に気づいたことは、この論文は「統計値がいいのに、この map はどうも汚いぞ」という実務上よく遭遇する問題に定量的な答えを与えてくれるものではなさそうだということである。与えられた map の汚さというのは、使った反射強度の正確さ(=実験上の問題)や位相の正確さに依存するが、この論文はそういうデータの「なかみ」には着目しない。この論文では、どの反射が測定されていて、どの反射が測定されていないのかという データセットの構成から、最大どれだけの分解能が達成できるかを考えている(ようだ)。p.1922 の左側参照。

まず、effective resolution を定義する。2つの理想的な点散乱体を近づけていった時、電子密度の極大が融合してしまうギリギリの距離 minimum distance とするのだ。分解能制限がない場合(フーリエ級数を無限項足しあわせた場合)、これは解析的に解くことができる。データセットに incompleteness がある場合や、分解能に上限がある場合(フーリエ級数を有限項で打ち切った場合)、minimum distance は上昇する。この上昇した minimum distance と同じ minimum distance を与える(分解能上限まで)completeなデータセットの分解能を以って、そのデータセットの effective resolution が定義されている。つまり、incomplete→最小距離が増加→分解能が低下(数値としては上昇)というわけで、これは直感にも一致する。

実際の原子は点散乱体ではない。温度因子による「にじみ」があるし、原子の電子密度はデルタ関数ではなくて、ガウス関数の和で表されているからだ。そこで、点散乱体の代わりに、その構造における典型的な温度因子(たとえば Wilson plot から得られる値を採用する)をもつ炭素原子で最短距離を考える。これが optical resolution と定義されている。

ここまでの議論から分かるように、あくまでどの反射が記録されていて、どの反射が記録されていないかという completeness だけから分解能を決めようというのがこの論文の内容であった。繰り返しになるが、反射としては記録されているが、放射線損傷でデータが汚いとか、位相が悪いといった理由で、「分解能の割に map が汚い」というのを定量的に評価するものではない。そういう研究に今後つながっていくのだろうか。