2013-10-01から1ヶ月間の記事一覧

予期不安と論理と厭世感

長らく「下書き」に眠っていた文章を公開しておこう。中二病的内容につき、注意! 今(2013/10/27)は、留学によるテンションの高さでカバーしているが、本質的には一週間前ほどからやや悪い相が始まっている。専門家に言わせると、私の問題の本質は強迫性だそ…

何かのために何かをする

「下書き」放出第2段。中島敦の「かめれおん日記」は、ほんの数カ月前に出会ったばかりの作品だが、まるで自分のことが書いてあるかのように心に染みいる。青空文庫から引用しよう: 又、ものを一つの系列――或る目的へと向つて排列された一つの順序――として理…

マイクロアレイの有意差検定

機能ゲノムの講義で、マイクロアレイによる differential expression の検定をやった。入門書では、differential expression を見つけるのに t 検定して終わりになっているが、実際にはもっとややこしいことをやっているようだ。[BioC] limma moderated t-st…

電子顕微鏡による構造生物学 勉強メモ

勉強中のメモ 共通事項 Contrast Transfer Function (CTF) の補正 収差とかの補正にあたる 実空間では、point spread function に対応 Defocus 位相コントラストをつけるために行うっぽい。高分解能 に解説あるけれど、まだ理解していない。 単粒子解析 Sing…

太宰治「猿面冠者」

太宰治の「猿面冠者」を読んだ。学校の英作文で褒められて有頂天になるところ、自信作の小説を街中に喧伝した挙句、酷評されてショックをうけるところなど、ユーモアを感じるとともに、誰もが自分の「黒歴史」に触れられた気持ちになるのではなかろうか。気…

Proceedings of CCP4 study weekend 2013 つづき

Building a pseudo-atomic model of the anaphase-promoting complex Acta Cryst. D69 (2013) は、昨日紹介したのと逆方向で、電顕による複合体のマップに、XRD で得たサブユニットをどうはめていくかという件の実例。 形状によるマッチング 一部サブユニッ…

EM algorithm

EM algorithm (Expectation- Maximization algorithm) は、直接測定不能な変数が存在するときのモデルフィッティングに用いられる。構造分野で使えそうな/使われている局面は SFX で、指数付けに曖昧性がある場合 単粒子解析で、どのクラスに属するかの判定 …

イギリスで見かける料理

イギリスに留学中というと、よく「料理がひどくて大変でしょう」と言われる。他の日本人留学生どころか、イギリス人自体から言われることもある。ところが私は、イギリス料理をマズイとは思っていない。格別に美味しいとも思ってはいないが、少なくともマイ…

TRPモチーフの語源

APC/C complex などに含まれる TRP motif とは、tetratricopeptide motif のこと。tetratriconta はギリシャ語で 34 である。実際、34アミノ酸からなるモチーフが繰り返された構造だ。化学における数詞はギリシャ語由来とラテン語由来が混ざっている。詳しく…

実験計画法

講義で実験計画法にちらっと触れた。要点は3つ Replication 誤差を減らすだけでなく、誤差の大きさ(分散)を知る上でも大事 Randomization 偏りなく割りつける。例えば、マイクロアレイのチップ・レーンの位置など。サンプル1をいつもレーン1に載せるといった…

分子置換法のこれから

今月の Acta Crystallographica D は、今年1月の CCP4 study weekend 2013 のまとめ号である。Applications of molecular replacement to G protein-coupled receptors には、発表内容に加え、T4L と poly-alanine helix だけから MR してみたという解析が追…

T や F は使うな

R

R の講義で、TRUE と FALSE の略として T や F を使うべきではないと習った。TRUE/FALSE は予約語であり、いわばリテラルだが、T/F は単なるグローバル変数なので、 TRUE <- FALSE # エラー T <- FALSE # 代入できてしまう! pnorm(0.3, lower.tail=T) # ??? …

○○も勉強すべきですか?

The anatomy of successful computational biology software Nat. Biotechnology (2013) を講義で紹介された。bioinformatics の有名ツールの開発者へのインタビュー集である。Open Access なので一読されたい。プログラムが成功するための秘訣、他の分野の…

京都について―聖地としての面から

9年半を過ごした京都という町について何かを書いてみたくなった。今も京都大学に籍が残っているとはいえ渡英するにあたって下宿を引き払ってしまったから、既に京都に私の居場所はない。そう書くと、イギリスの住居探しと違って京都には下宿屋も物件もいくら…

XFEL の方向性と必要なソフトウェア

XFEL (やそれに類する ERL などの技術)を使った構造生物学の方向性についてメモ。強度を生かして: 超微結晶解析 (serial femtosecond crystallography: SFX) コヒーレンスを生かして: 単粒子解析 (coherent diffraction imaging: CDI) 新しい位相決定法 (int…

Order-disorder twinning

ccp4bb で order-disorder twinning (OD twinning, lattice-translocation defect) の話題が出ている。そこで紹介されていたのが Rotational order–disorder structure of fluorescent protein FP480 Acta Crystallogr. D (2009)。本症例は、90度回転の関係…

ベクトル化とメモリ

R

R のベクトル化の例で、 a <- 1:10001 b <- a[1:10000] + a[2:10001] のように書くと for ループを回すよりも速いというのがよく紹介されているが、メモリ効率はどうなのか。内部的に右辺の2つの項に対応する a のコピーを2つ作っているとしたら、一時的とは…

S3 形式での多態

R

実はちゃんとやったことがなかった。 a <- list() class(a) <- "TestClass" testfunc <- function(x) {print("test func")} testfunc(a) # test func testfunc.TestClass <- function(x) {print("test func for TestClass")} testfunc.TestClass2 <- functio…

Sweave でクォートが文字化けする

R

Scientific Programming の講義では、Sweave ドキュメントの形で課題を提出することになっている。それに備えて早速 Sweave を使ってみたのだが、 R の出力のうち、` や ' などの記号が文字化けする。調査の結果、 \usepackage[utf8x]{inputenc} を記載すれ…

R 3.0.2に更新

Mac R

講義で「課題には R 3.x.xを使ってください」と言われたので、Mac Book の R を 2.x から 3.0.2(CRAN版)へアップグレード。そうしたら R studio が R を認識しない。"Cannot locate R" というエラーが出る。3.0.x を使うには、R studio も新しいものである…

結合電子のモデリング

蛋白質では結合電子が見えるような超高分解能(0.8Å以上)にはそうそうお目にかかれないが、低分子の場合は普通である。通常の蛋白質の場合は、化学結合による電子の再分布を無視する Independent Atom Model (IAM) を採用している。電子の再分布を考慮するモ…

予測の精度を予測する

蛋白質の構造予測などでは、より正確な予測をすることが第一目標であるのは間違いないが、予測した解の精度を予測する、つまり予想にどのくらいの自信が持てるのかを適切に自己評価することも重要である。自信のある解が出れば探索をそこで打ち切ることがで…

分解能について

結晶学のデータセットの分解能と一言でいっても、回折斑点が目視できるギリギリのところ、 が2となるところ、CC1/2* が50%となるところなど、いろいろな定義がある。最近は昔と比べて non-conservative な基準が採用されるようになりつつあり、昔の論文での…

アニメにおける旧仮名遣いの間違い

はてなダイアリの下書きに長いこと放置していたが、公開してしまおう。私は特に政治的主張があってではなく、なんとなくネタ的に、あるいは、懐古的・感傷的な気分に浸りたいがために、旧仮名遣いを使ったり旧字体を使ったりする。いわゆる中二病というやつ…

Harker section の定義

昔の ccp4bb で、Harker section の定義が話題になっていた。[ccp4bb]: Definition of Harker vector & section? から始まるスレッドである。回転軸に垂直だが格子の基本ベクトルに垂直ではない面(u + v = 0 など) も数学的には Harker section と呼ぶべきだ…

フランスとイギリスの風景の違い

来る途中の飛行機から見下ろしていて気がついたことである。実際にフランスの田舎を歩いたわけではないので、全く的外れなことを言っているかもしれないが……空から見ると、どちらの国も畑が多い。大都市のすぐ外側でも畑が広がっている。平野が多いからかも…

多重検定補正の2つの考え方

内容的には既に知っていることばかりだったが、少しメモ。 Familywise Error Rate を調節するとは、N個の検定をしたときに「1つでも間違える確率」を、sigfinicance level α に調節すること。Bonferroni 法など。 False discovery rate を調節するとは、N個…

数学入門コース2日目

数学入門コース2日目は、微分積分→連続分布→統計検定→多重検定を3時間で。相変わらず早いペースだ。微分積分は、微分の定義から始まって を定義に基づいて微分したあと、他の代表的な微分を表で提示。線形性・chain rule などを証明なしで紹介するという感じ…