Linkage analysis
- Parametric linkage
- 일반적으로 질병에 대한 유전 모형 값을 알고 있을 때 분석하는 방법이며, 분석력(power)이 크고 주로 단이 유전자 질병의 원인 유전자 발굴에 사용.
- LOD score >= 3.0
- Non-parametric linkage
- 복합적 질병의 원인 유전자 발굴에 많이 사용.
- p-value < 0.00002
Single variant test
Hardy-Weinberg eq test
Some variant are in disequilibrium.
- Heterozygote excess : 생존에 이로울 경우 발생할 수 있지만 정상적인 시료에는 두 대립 유전자형의 분리가 제대로 이루어지지 않은 genotyping error.
- homozygote excess : 이질적인 집단의 시료가 사용되었거나 특정 homozygote 가 치사(null allele)를 유발하여 실제 집단에서는 그 유전형이 존재하지 않는 경우가 있으나 정상적인 집단의 시료가 사용되었다면 두 대립 유전자형 중에서 특정 유전자형의 genotyping error (allele dropout).
Multiple comparison test
Bonferroni correction
- 개별적인 SNP가 모두 독립적으로 관여하는 경우에는 N으로 눌 수 있지만 많은 SNP는 LD block 내에 서로 연관되어 있기 때문에 N으로 나누면 너무 엄격하게 적용됨.
FDR (false discovery rate)
- FDR = false positive / total positive
- p-value가 높은 것부터 정렬하고, p-value가 낮아질 수록 엄격한 alpha값을 적용함.
T-test
- n < 30
- Used to compare two means or proportions
- Unknown standard deviation
Wilcoxon Signed-Rank test
- n < 30
- Unknown distribution
- Unable to adjust to normal distribution
- Use median
Z-test
- n >= 30
- Normal distribution
- Known standard deviation
Permutation test
Bootstrap
Linkage Disequilibrium
- Non-random association of allele at different loci in a given population.
- R2 is nothing but Pearson's correlation coefficient. That is, the covariance of two variables by product of their standard deviations. (Pearson correlation coefficient)