Linkage disequilibrium(LD)连锁不平衡:给定种群中同一染色体上不同基因座等位基因之间非随机关联的一种度量。当其等位基因的关联频率高于随机分类下的预期频率时,SNP 位于 LD 中。LD 涉及 SNP 之间的模式。
Minor allele frequency (MAF)最小等位基因频率:这是在特定位置上出现频率最低的等位基因的频率。大多数研究的 power 不足以检测表型与 MAF 低的 SNP 的关联,因此需要过滤这些 SNP。
Population structure 群体结构:研究中是否存在多个亚人群(例如,具有不同种族背景的个人)。由于等位基因频率在亚群之间可能不同,因此群体分层可能导致假阳性关联和/或掩盖真实关联。筷子基因就是一个很好的例子,由于群体分层的现象而导致得到 SNP 可以用来解释用筷子吃饭的习惯的结论[2]。
Single nucleotide polymorphism (SNP)单核苷酸多态性:在基因组中特定位置发生的单核苷酸(即A,C,G或T)变异。SNP 通常以两种不同的形式存在(例如,A与T)。这些不同的形式称为等位基因。包含两个等位基因的 SNP 有三种不同的基因型(例如,AA,AT和TT)。