群体遗传进化与GWAS分析动植物文献

群体遗传进化与GWAS分析文献

    • NG-熊猫群体进化-2012

      ·        文章:Whole-genome sequencing of giant pandas provides insights into demographic history and local adaptation

      ·        基础数据:34只熊猫,4.7x覆盖深度

       

      NC-牦牛群体进化-2015

      ·        文章:Yak whole-genome resequencing reveals domestication signatures and prehistoric population expansions

      ·        基础数据:13野生牦牛和59驯化品种,6.7X测序深度,14.56M高质量SNP

       

      NG-韩斌2010年经典水稻14农艺性状GWAS文章

      ·        文章:Genome-wide association studies of 14 agronomic traits in rice landraces

      ·        基础数据:517水稻样品,3.6M SNP,水稻indica,japonica

      NG-韩斌2011年水稻开花期与果实性状GWAS文章

      ·        文章:Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm

      ·        基础数据:950水稻样品,来源于33个国家,4.1M snp

      ·        数据过滤:maf 0.05

      NG-日本2016年水稻开花相关基因性状GWAS分析

      ·        文章:Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice

      ·        基础数据:176japonica,5.8X,383g,426k snp,67k indel

      NG-棉花-纤维相关性状GWAS分析

      ·        文章:Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield

      ·        基础数据:419样品,6.55X数据,3.66M snp,13个性状

      ·        第一批棉花gwas项目,A,D基因组差异进行了分析,环境有12,有相应的拟南芥过表达表型验证

      NBT-田志喜-大豆-2014群体gwas文章

      ·        文章:resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean

      ·        基础数据:302个野生,栽培,地方品种大豆,11X,

        

      GB -苦荞-2021群体gwas文章

      ·        文章:Resequencing of global Tartary buckwheat accessions revealsmultiple domestication events and key loci associated with agronomictraits

      ·        基础数据:510份苦荞种质,包括32份野生种质、478份地方种质和7份荞麦属种质。本研究对全球14个国家的510份苦荞种质资源进行了测序分析,共生成原始数据3.98 Tb,平均测序深度为12.65X,基因组覆盖率为91.72%。最终鉴定了1,095,748SNP116,516InDel


      NC –-2021群体gwas文章

      ·        文章:Genome-wide association studies provide insights into the genetic determination of fruit traits of pear

      ·        基础数据:312个沙梨(Pyrus pyrifolia)品系进行了测序,其中231个品系是本地品种(landrace),81个品系是改进的栽培种(improved cultivar)。总测序量产出为2.15Tb数据,经过比对参考基因组、变异检测以及变异过滤之后得到340万个SNP(单核苷酸突变)用于下游研究。(值得注意的是,本研究中使用的参考基因组是白梨Pyrus bretschneideri,数据与参考基因组的平均比对率是73.5%,这在涉及不同品系和品种的重测序研究当中,是一个可以接受的数字。)在系统发育与群体结构的分析当中,显示出选择的梨品系大致区分成两类(中国品系Group I和日韩品系Group II)。

       ·     

      NC –毛竹-2021群体gwas文章

      ·        文章:Analysis of 427 genomes reveals moso bamboo population structure and genetic basis of property traits

      ·        基础数据:毛竹(Phyllostachys edulis)是世界上最重要的竹种,在我国主要分布于华南地区。本研究中,作者对来自15个代表性地理区域的427份毛竹进行全基因组重测序,构建了毛竹基因组变异图谱,进行了种群进化分析,并对9个重要性状进行全基因组关联分析以确定候选基因,揭示了这一无性繁殖物种的群体多样性,为了解毛竹进化和农业重要性状的遗传机制提供了基础与资源。427份来自于15个代表性区域的毛竹种质与近缘种Phyllostachys kwangsiensisIllumina测序(平均20X)获得16.60TB数据。


      MP –小麦-2020 gwas文章

      ·        文章:High-Resolution Genome-wide Association Study Identifies Genomic Regions and Candidate Genes for Important Agronomic Traits in Wheat

      ·        基础数据:本研究中,通过对来自于我国黄淮麦区、北方冬麦区、西南麦区和长江中下游麦区等小麦主产区的768份优良小麦品种(系)进行GBS基因分型,获得了327609个覆盖全基因组的高质量的SNP标记并鉴定出174919个连锁不平衡区段。本研究对在小麦中大规模进行优异基因的发掘、克隆、基因组学与分子设计育种奠定了重要基础,具有重要的理论与应用价值。


      MP –小麦-2021 gwas文章-西北农林科技大学康振生院士团队

      ·        文章: Variation in cis-Regulation of a NAC Transcription Factor Contributes to Drought Tolerance inWheat

      ·       该研究克隆了小麦抗旱基因TaNAC071-A并揭示了其调控小麦抗旱性的分子机理。


      NATURE –水稻-2021 gwas文章-中国科学院遗传与发育生物学研究所储成才课题组

      ·        文章: Genomic basis of geographical adaptation to soil nitrogen in rice

      ·       该团队利用全基因组关联分析技术鉴定到一个水稻氮高效基因 OsTCP19,其变异在低氮和中氮环境下可显著提高水稻产量。



      MP –甘蓝型油菜-2020 gwas文章-华中农大

      ·        文章: enome- and Transcriptome-Wide Association Studies Provide Insights into the Genetic Basis of Natural Variation of Seed Oil Content in Brassica napus

      ·       研究利用505份甘蓝型油菜群体的基因组重测序数据以及从中选择的309份代表性材料种子发育中两个时期的转录组数据,通过全基因组关联分析(GWAS)和全转录组关联分析(TWAS)等方法对油菜籽粒含油量的遗传基础进行了系统解析。研究中获得了505份甘蓝型油菜自交系共1.7Tb的重测序数据(平均每个品种覆盖度9倍),最终鉴定出10,620,048个变异位点,结合关联群体多年多点的含油量性状,利用GWAS分析定位了27个高可信的含油量QTL位点,并对含油量QTL在不同环境中的效应进行了评估。进一步利用TWAS分析鉴定了600多个与含油量显著关联的候选基因,这些基因编码的蛋白主要参与转录调控、脂质代谢和次生代谢等。通过基因共表达分析鉴定到了4个基因模块与含油量显著相关。


      [1]. Aijun W,Xinyue S,Xin J, et al. Identification of rice (Oryza sativa L.) genes involved in sheath blight resistance via a genome-wide association study[J]. Plant Biotechnology Journal.2021.



    • 单倍型( haplotype )是共存于单条染色体上的一系列遗传变异位点的组合,其在染色体上形成的连续的、稳定的、几乎不被重组所打断的单倍型区域,称为单倍型块( haplotype block )。以单倍型块为基础,进行性状与基因的关联分析也是十分有效的关联分析方法。2021年水稻[1]文章中,鉴于传统 SNP-GWAS 存在假阴性,且在识别全部关联基因的局限性,该研究增加了 Hap-GWAS 分析进行更精确定位。材料选择:259份水稻测序策略:Illumina PE150,12.16x主要结果:显著关联 SNP 的 LD 区域内定位到一个 NLR 基因簇,通过 Hap-GWAS 进一步定位到了 OsRSR1 基因与该性状显著相关。


    • [2]. Z_mienkoA, SamelakA, KozłowskiP, etal. Copynumber polymorphism in plant genomes[J]. Theor Appl Genet. 2014.

    • 物种基因组中除存在大量 SNP 外,还存在大量的存在/缺失变异(presence/absence variation, PAV),PAV 变异最多可达基因组的六分之一,对物种基因功能存在一定影响,如防御反应、信号转导反应、应激反应等。如甘蓝型油菜[2]的研究中,PAV-GWAS 鉴定了与角果长度、种子重量和开花时间相关的结构变异,而 SNP-GWAS 未检测到这些结构变异,表明 PAV-GWAS 与 SNP-GWAS 在鉴定性状关联方面是互补的。材料选择:15个RIL家系样本,16个新建家系材料测序策略:Illumina + PacBio主要结果:同时使用 SNP-GWAS 和 PAV-GWAS 两种关联方法,发现 SNP-GWAS 的显著关联结果,并未落到靶基因 bnaa9.cyp78a9 的调控区域或编码序列中。而PAV-GWAS 直接检测到插入在 bna9.cyp78a9 启动子区上游的 3.9 kb 的 TE 元件,并确定为角果长度和种子重量性状相关变异。

    • [3]. Gaut BS, Seymour DK, Liu Q, et al. Demography and its effects on genomic variation in crop domestication[J]. Nat Plants. 2018.

    • [4]. Guan J, Xu Y, Yu Y, et al. Genome structure variation analyses of peach reveal population dynamics and a 1.67 Mb causal inversion for fruit shape[J]. Genome Biology, 2021.

    • 结构变异(SV)包括缺失、插入、倒位、易位等,是基因组变异的主要来源,大量研究已证实 SV 广泛存在于物种基因组内,且对表型影响广泛[2-3]。2021年桃[4]研究中,进行了全面的 SV 图谱的绘制,并通过 SV-GWAS 发现重要关联基因,弥补了 SNP-GWAS 的不足。材料选择:149份桃测序策略:Illumina PE150,31.52x主要结果:SNP-GWAS 分析得到多个与果形相关的强 SNPs 信号存在于“S”基因座,而基于 SV-GWAS 分析,鉴定出最重要的关联是在“S”基因座位置从27,959,880 bp到29,634,101 bp的1.67 Mb 杂合倒位,且包含了显著关联的SNP。该变异导致其邻近基因 PpOFP2 上调,形成扁平果形。


    • [5]. Jia-Ming S, Zhilin G, Jianlin H, et al. Eight high-quality genomes reveal pan-genome architecture and ecotype differentiation of Brassica napus[J]. Nat Plants. 2020.

    • [6]. Li X, Yang J, Shen M, Xie XL, Liu GJ, et al. Whole-genome resequencing of wild and domestic sheep identifies genes associated with morphological and agronomic traits[J]. Nat Commun. 2020.
    • 拷贝数变异(copy number variation ,CNV)是指基因组上某些大片段的拷贝数增加或减少,可分为缺失(deletion)和重复(duplication)两种类型。CNV 可通过改变基因剂量和转录结构等来调节有机体的可塑性,是个体表型多样性和群体适应性进化的主要遗传基础之一。绵羊[6]研究中,利用 SNP 和 CNV 分子标记相结合,挖掘了一系列与重要外形和农业性状相关的候选基因。材料选择:232个绵羊及16个野羊材料测序策略:Illumina PE150,25.7x主要结果:利用 SNP-GWAS 分析,获得多个与产仔数、乳头数性状显著关联基因,而 CNV-GWAS 分析又补充了新性状关联基因,如 GPC5。

    • [7]. Yoav Voichek, Detlef Weigel. Identifying genetic variants underlying phenotypic variation in plants without complete genomes[J]. Nature Genetics.2020.

    • 常规 GWAS 分析方法是利用测序数据比对参考基因组来完成遗传变异的检测,在基因组组装效果不理想的情况下,可以通过相互比较来自不同样本的恒定长度k的序列(称为k-mers)集,来识别更广泛的遗传变异类型,如 SVs 等。Voichek[7] 等人基于 k-mer 的 GWAS (rfGWAS)方法,对拟南芥、番茄、玉米等2000个性状进行关联分析,建立 k-mer 与表型的直接关联,后再推断相关序列的基因组背景,进而发现更广泛的基因变异,甚至是组装缺失部位的变异信息。材料选择:1135份拟南芥数据,150份玉米数据,246份番茄数据测序策略:Illumina,6x 以上主要结果:如在拟南芥的 GWAS 分析结果中,显著关联 SNP 与 k-mer 处于同一 LD 中,比例为73%(LD≥ 0.5),说明了 k-mer-GWAS 的可行性。而幼苗萌发率的关联结果中,SNP-GWAS 无显著关联,而 k-mer-GWAS 发现显著关联 k-mer,该 k-mer 未比对到参考基因组中,通局部序列组装和同源比对发现一个位于 bZIP67 转录因子的3’UTR 区域的 SV。



    • TWAS 

    • https://www.nature.com/articles/s41588-019-0367-1

      https://www.nature.com/articles/s41588-019-0385-z


      GWAS关联分析课程推荐:https://bdtcd.xetslk.com/s/2KgXQq

  • 发表于 2021-11-22 12:32
  • 阅读 ( 4289 )
  • 分类:GWAS

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

702 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 350 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. rzx 78 文章
  7. 红橙子 78 文章
  8. CORNERSTONE 72 文章