Methods for High-Density Admixture Mapping of Disease Genes

(Patterson et al. Am.J.Hum.Genet.74:979-1000,2004)
Admixture Mapping --aka."mapping by admixture linkage disequilibrium, MALD"<メモ>

これまでのゲノムワイドLD mappingでは

  • 解析に必要とするマーカー数が膨大で
  • 解析に多くの検体数を要する

という欠点があるが、この手法ではそれぞれの数を減らして解析できるという利点がある。各集団の対立遺伝子頻度がわかっていることが条件である。

ある疾患のハイリスク集団Aと低リスク集団Bがあったとする。Aは疾患のリスクアリルの頻度がBに比べて高い。この後、AとBが混ざって出来た新たな集団(現在の集団)中のケースとコントロールを考える。リスクアリルはケース内で高い頻度を示すが、これはほとんどが元のハイリスク集団A由来のアリルである、と考えることによってケースの中だけで解析が可能となる。アメリカなど人種が混ざり合った集団ではこれまでのゲノムワイド関連解析があまり有効でなく、ケースコントロールが再び見直されてきたところだが、この手法によって人種の混合による問題が解決される、、かも!


論文で例として取り上げられているのが多発性硬化症MSc)。これはアフリカ集団で少なくヨーロッパ集団で多い疾患である。このように、ヨーロッパから来た感受性遺伝子を研究するのに都合良い手法である。MScのほか、Hepatitis C clearanceや、HIV vertical transmissionはアフリカ集団のほうが低リスク。逆にMyelomaはアフリカ集団のほうが高リスク。


Mi--i番目の個体がハイリスク集団Aから受け取る遺伝子の割合
λ--集団A、Bのadmixtureから経過した時間(組み換えの程度を間接的に示す)。
Xj--連鎖していない独立のj番目のサイト。その隣のサイトX(j+1)との距離はdとする。
2λ--染色体2本のうちどちらもXjとX(j+1)の間で組み換えを起こさない確率。

一個体に確率を与え、尤度を最大化するパラメータの値を各マーカーごとに推定する。確率の漸化式。

φ--ハイリスク集団Aから疾患感受性遺伝子を一つ受け継いだときに発症する確率φ1と、二つ受け継いだときに発症する確率φ2を事前に計算しておく。

MCMC(マルコ、、モデル)
・SCI--情報量を示す。

SCI>0.035で50kb以上離れていて連鎖不平衡にないSNPをマーカーとして選択(連鎖していたら意味ないもんね)。2154SNPが該当。

Fig6にあるシミュレーションの結果を見ると、Risk1.3という低いRRであっても2000個体ずつくらい解析すれば検出可能になっている。必要なマーカーも2000個くらいで、普通なら何十万マーカーも必要なのにこれは便利だね。