Gaussian mixture clustering and imputation of microarray data
Bioinformatics 2004 Apr 12;20(6):917-23
欠損値予測ものだった.アレイデータでの欠損値を PCA(っていうか SVD), k-NN 法を使った欠損値,そして彼らの使っている GMC(Gaussian mixture clustering) を使った結果で解析している.混合ガウス分布のパラメータは EM 法を使って求めており,何個のガウス分布で近似するのかは,2〜8個の中で最適なものを選んでいる.GMC で予測するのが一番良かったと結論している

SVD, k-NN, GMC ともに言える事だけど,何個のパラメータで予測するのかを決めるのかが鍵になると思う.この論文では正解を知った上で何個が最適化を見せているのだが,本番データでは分かる由も無い.ただ,MDL(Minimum description length) や AIC(Akaike Information Criteria) を使って最適パラメータ数を設定することは可能かもしれない.その意味では MDL/AIC との相性が良いと思われる,この論文の方法は悪くないと思った.

心の安寧とは別問題.特に親にとって

(有機)水銀が一部の自閉症の原因ではないかと言われ,キレート剤が効くという話がある(http://www.kcn.ne.jp/~gauss/env/tb3.html).また,この水銀源として三種混合ワクチン(MMR)の防腐剤として使われているチロメサール(thiromesal)が挙げられています.これに関して Institute of Medicine of the National Academies がチロメサール(thiromesal)と自閉症(autisum) の因果関係は認められないと結論したようです.

The committee concludes that the body of epidemiological evidence favors rejection of a causal relationship between the MMR vaccine and autism.

ただ,注射に水銀って気持ちのイイもんじゃないので,thiromesal 廃止の方向に向かって欲しいなぁと感じます