マイクロアレイの有意差検定

機能ゲノムの講義で、マイクロアレイによる differential expression の検定をやった。

入門書では、differential expression を見つけるのに t 検定して終わりになっているが、実際にはもっとややこしいことをやっているようだ。

[BioC] limma moderated t-statistics and B-statistics
t 検定量を求めるときの standard error を多めに補正した moderated t statistic を作っている。その理由がよく分からないのだが、低発現領域での離散化幅が原因で SE が小さくなりすぎて t値が発散してしまうのを防ぐため(?)らしい。講義では、house-keeping gene の SE が小さくなりすぎるのも補正するとか言っていたけれど・・・・・・ 

さらに limma では empirical Bayes 法に基づいた B-statistic という統計量も算出できるようになっていて、その文献は Linear models and empirical bayes methods for assessing differential expression in microarray experiments である。

FDR の補正についても、Benjamini-Hochberg 法は簡単で分かりやすいけれど、true positive の割合についての仮定に問題があるらしくて、より適切な Storey 法というのがあるらしい。