IF=8.78|非肿瘤数据挖掘思路(GWAS Catalog)

IF=8.78|非肿瘤数据挖掘思路(GWAS Catalog)

迄今为止,GWAS已经鉴定到了成千上万的与许多人类复杂疾病相关的变异位点,如骨质疏松、肥胖和2型糖尿病等。有研究表明大约4.6%的SNPs位点和16.9%的基因具有多效性。这种基因组中多效性的存在表明相关性状之间可能具有重叠的遗传决定因子。可以从遗传基因多效性方面着手,利用多效条件错误发现率方法(conditional false discovery rate  cFDR),该方法的思想是与两个相关性状都相关的变异位点更有可能是真实的变异位点,因此,在整合多个研究时更有可能被鉴定到。该方法是经验贝叶斯错误发现率方法的延伸,应用到两个表型的情况。cFDR通过整合两个GWAS Meta汇总统计数据,以与第二个表型的关联程度为条件确定SNPs变异位点数据集,鉴定与第一个表型关联的位点。待检测的关联表型称为“主要表型”,第二个表型作为“条件表型”。Andreassen等己经应用这种方法,并成功发现了与几对相关性状相关的多效新位点/基因。目前,这种方法成功地应用到精神分裂症和双相情感障碍、精神分裂症和心血管疾病的风险因素、血压和其他相关表型或性状,以及身高和FNBMD、2型糖尿病和出生体重、2型糖尿病和肥胖、冠心病和BMD、冠心病和肥胖的多效研究中等等,鉴定了多个先前未被发现的位点/基因以及多效基因位点。


文献思路

利用cFDR的方法发现肌萎缩侧索硬化 (ALS) 和自身免疫性疾病多效基因的文章示例:


attachments-2021-10-6n1Ccxsi617bb5b46527b.png

研究表明 ALS 与 10 种自身免疫性疾病之间存在关系,包括哮喘、乳糜泻 (CeD)、克罗恩病 (CD)、炎症性肠病 (IBD)、多发性硬化症 (MS)、牛皮癣、类风湿性关节炎 (RA)、系统性红斑狼疮(SLE)、1 型糖尿病 (T1D) 和溃疡性结肠炎 (UC)。作者使用这些数据的GWAS的关联结果,利用cFDR的方法发现这些疾病关联的多效基因。
QQ图展示多效富集


分别绘制以10 种自身免疫性疾病为主要性状,ALS为条件性状的条件分层QQ图,发现曲线随着与条件性状的关联p值阈值逐渐降低而出现分离,表示有明显的富集趋势。


attachments-2021-10-nRCGlDvX617bb5c8d0452.png

cFDR的方法关联到的多效基因Manhattan图展示


attachments-2021-10-584raSKi617bb5d8686cd.png利用GTEx数据库中脑的表达数据做eQTL验证

attachments-2021-10-u6vDSxyQ617bb5e7e5de4.png
总结
本文用多个别人发表的GWAS数据利用cFDR分析方法关联多效基因,并利用GTEx数据库验证了基因的eQTL。相比于预后模型分析套路,分析思路简单明确,分析内容简单,就能轻轻松松发到8分文章。目前GWAS Catalog 数据库中已经收录了很多GWAS的数据有待大家取挖掘。

GWAS Catalog数据库简介:
由美国National Human Genome Research Institute (NHGRI) 和欧洲的 European Bioinformatics Institute (EMBL-EBI) 为了便于研究者快速高效地获取当前的GWAS结果,共同开发和制作的NHGRI GWAS Catalog公共资源。https://www.ebi.ac.uk/gwas/homeAs of 2021-10-06, the GWAS Catalog contains 5370 publications and 294591 associations.GWAS Catalog data is currently mapped to Genome Assembly GRCh38.p13 and dbSNP Build 154.  

参考文献:

Andreassen OA, Djurovic S, Thompson WK, Schork AJ, Kendler KS, O’Donovan MC, Rujescu D, Werge T, van de Bunt M, Morris AP, et al. Improved detection of common variants associated with schizophrenia by leveraging pleiotropy with cardiovascular-disease risk factors. Am J Hum Genet. 2013;92(2):197–209. doi: 10.1016/j.ajhg.2013.01.001
Li CY, Yang TM, Ou RW, Wei QQ, Shang HF. Genome-wide genetic links between amyotrophic lateral sclerosis and autoimmune diseases. BMC Med. 2021;19(1):27. Published 2021 Feb 5.
doi:10.1186/s12916-021-01903-y



更多文献:

2021Identification of novel functional CpG-SNPs associated with Type 2 diabetes and birth weight.BWcFDReQTLGWASsmetaQTLT2D
2019Identification of novel common variants associated with chronic pain using conditional false discovery rate analysis with major depressive disorder and assessment of pleiotropic effects of LRFN5.cFDRMDDSNPs
2019Identification of novel genetic variants for type 2 diabetes, childhood obesity, and their pleiotropic loci.CBMIcFDRCOT2D
2017Identification of novel genetic loci for osteoporosis and/or rheumatoid arthritis using cFDR approach.cFDRFNKMHCOPQ-QRA
2017Linking Alzheimer's disease and type 2 diabetes: Novel shared susceptibility genes detected by cFDR approach.ADcFDRDIAGRAMIGAPSNPsT2D
2016Increased identification of novel variants in type 2 diabetes, birth weight and their pleiotropic loci.ADCY5CDKAL1cFDRGWASSNPsT2D




延伸阅读

  1. GEO数据库挖掘—WGCNA鉴定骨肉瘤转移相关基因
  2. GEO、TCGA多数据库联合挖掘胰腺导管腺癌预后关键基因
  3. 文献精读-GEO数据挖掘生物信息文章(宫颈癌)
  4. GEO数据挖掘直肠
  5. GEO数据挖掘案例解读-植物篇(拟南芥重金属)
  6. GEO数据如何挖掘?案例解析!
  7. 胃癌免疫侵润预后Signature数据挖掘-糖酵解
  8. IF=6.58|铁死亡相关lncRNA预测头颈部鳞状细胞癌预后文献解析


  9. attachments-2021-10-SmYVQE4b617bb60792e57.png
  • 发表于 2021-10-29 16:51
  • 阅读 ( 3354 )
  • 分类:GWAS

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

702 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 351 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. rzx 78 文章
  7. 红橙子 78 文章
  8. CORNERSTONE 72 文章