凤丹牡丹(Paeonia ostii)又称杨山牡丹,是芍药科的多年生植物,因巨大的花朵和观赏价值,使得凤丹牡丹在中国文化和历史上都具有举足轻重的意义,被誉为“花中之王”。除迷人的花朵外,凤丹牡丹还具有多种“令人费解”的生物学现象,例如“种子富含高水平的亚油酸”、“花瓣状雄蕊”形成的分子机制。而构建凤丹牡丹高质量的参考基因组,则是解析这些问题的关键所在。
2022年11月28日,上海辰山植物园胡永红团队在国际著名期刊Nature Communications(IF=17.69)上发表了题为“Genomic basis of the giga-chromosomes and giga-genome of tree peony Paeonia ostii”的研究论文。该研究公布了凤丹牡丹的高质量参考基因组,解析了凤丹牡丹巨大基因组的形成与维持机制;结合448份材料的GWAS分析解析了凤丹牡丹种子“高亚油酸含量”的奥秘;最后通过与栽培牡丹基因组的比较分析揭示了花瓣状雄蕊的形成机制,从而为牡丹的基因组进化与育种研究提供了新见解。
图1 文章发表信息
通过近3Tb的Illumina测序、643.67Gb的PacBio和2.5Tb的Hi-C测序,研究者构建了染色体水平的凤丹牡丹基因组,其基因组大小为12.28Gb,contig N50=228Kb,共包括73177个蛋白编码基因(隶属于15238个基因家族),是陆地植物中基因家族数量最多的物种之一。凤丹牡丹扩张的基因家族主要与DNA复制和脂肪酸代谢相关。
图2 凤丹牡丹巨大的基因组
为了深入了解凤丹牡丹基因组的进化史,研究者进行了多种数据、多种角度的科学论证。首先通过比较基因组分析发现,除γ-WGD外凤丹牡丹没有经历额外的WGD事件,LTR插入到凤丹牡丹基因间区并进行大量复制,驱动了其大染色体和超大基因组的形成;甲基化分析表明,表达基因、非表达基因和假基因在牡丹的基因和基因间区域显示出不同的甲基化模式,且甲基化影响基因的表达类型;ChIP-seq分析表明,特异性组蛋白主要富集在基因间区的启动子上,这说明凤丹牡丹大多数基因的结构和功能不受其大基因组的影响。
图3 凤丹牡丹基因组的LTR、甲基化和ChIP-seq分析
通过与桃、拟南芥、葡萄等物种进行比较基因组研究,研究者重建了包含7343个原基因的七条祖先真双子叶植物染色体,并检测到了凤丹牡丹和其祖先之间的171个同基因块。根据重建的祖先核型(ARK,n=7 和 n=21),牡丹要达到目前的5条染色体,至少需要4条染色体分裂(Cfis)和20条染色体融合(Cfus)。此外,与其他植物相比,编码五种类型组蛋白(H1、H2A、H2B、H3和H4,染色质稳定性的主要成分)的基因家族在凤丹牡丹中显著扩增,这可能是其染色体在进化过程中保持稳定性的重要原因。
图4 从真双子叶植物祖先到凤丹牡丹的核型进化
凤丹牡丹种质富含大量的不饱和脂肪酸,研究者选取了448份野生牡丹种质并进行了简化基因组测序(SLAF-seq),随后对与脂肪酸生物合成相关的14个性状、脂肪酸含量的表型特征和其他特征进行GWAS分析。在2号染色体和3号染色体分别鉴定到与C18:0/C18:1△9和C18:1△9/C18:2△9,12密切相关的SNP,其中3号染色注释了SAD的9个直系同源物,并定位关键基因Pos.gene65901,2号染色体定位到FAD2 关键基因 (Pos.gene24209),这些基因均通过转录组数据和RT-qPCR进行了验证。此外,脂肪酸生物合成途径中关键节点基因的扩增和高表达以及滑面内质网(ER)介导的FAD3可以驱动ALA(必须脂肪酸)在牡丹种子中的高水平积累。
图5 凤丹牡丹脂肪酸的生物合成途径
具有花瓣状雄蕊的花发育起源于叶分生组织之后,凤丹牡丹(原始种)的花分生组织分化为心皮、雄蕊、花瓣、萼片、苞片和叶,但不分化为花瓣状雄蕊。然而,栽培牡丹的部分雄蕊可以在分化过程中转变为花瓣,这在60%的地方品种中都有发生,这可能是由于雄蕊中异位AP1表达和AG下调所致。此外,在凤丹牡丹和栽培牡丹中,ABCE基因的进化速率呈现出不同的模式,而在驯化过程中,凤丹牡丹的一些A类基因经历了正选择,而C类基因经历了负选择,这种A类基因和C类基因的拮抗作用,可能导致花瓣状雄蕊的形成。
图6 凤丹牡丹花多样性和花瓣雄蕊的发育
综上,研究者构建了染色体少但基因组超大的凤丹牡丹高质量基因组,证实了基因间区LTR的插入和扩增驱动了其超大基因组的形成,而五种组蛋白的扩增维持了凤丹牡丹染色体进化的稳定性;凤丹牡丹种子的高脂肪酸含量是由ER介导的FAD3推动形成的;AP1和AG的异位表达以及A和C类基因的选择性压力是栽培牡丹花瓣状雄蕊形成的重要因素。总之,本研究构建的牡丹基因组及关键生物学问题的解析将为牡丹的育种提供重要参考依据。
上海辰山植物园袁军辉研究员(项目实际执行负责人,首席科学家)为本文第一作者及主要通讯作者,中科院植物研究所洪德元研究员和中科院分子植物卓越中心陈晓亚研究员为论文共同通讯作者(全程参与指导),牡丹课题组长胡永红教授为主要通讯作者(项目负责人)。华大基因姜三杰博士和简建波博士为本文共同第一作者。辰山牡丹组已毕业研究生刘铭妤和李娟(与青岛农业大学合培)、林黎虹和张林娟(与上海师范大学合培)、张晓骁和于水燕(原博士后)、张颖、张晓等;及岳震、徐加豹、许春艳、静一、陈海新、傅涛、吴章艳、王崇志、黄良博、王洪琦等(华大基因)为本文署名作者。牡丹基因组项目历时十年艰难探索,不仅是辰山植物园牡丹团队集体努力的成果,也是关注此项目的国内外各研究机构相关专家学者、牡丹专家及爱好者共同努力的结果。特别感谢牡丹专家李嘉珏先生、康仲英先生、付正林先生和魏春梅高工等提供部分实验材料;感谢韩斌研究员及团队成员、朱健康研究员、杨继教授、马红教授、孔宏智研究员、何跃辉研究员、张启翔教授、张大明研究员、张蘅研究员、焦远年研究员、李霖锋研究员等专家提供建议或参与了项目部分讨论;并向所有对项目有过帮助的(未署名)人员表示感谢。本研究得到上海市科委项目、国家自然基金及上海绿化市容管理局辰山专项资助。
论文链接:https://www.nature.com/articles/s41467-022-35063-1
随着测序成本的降低,小型基因组仅需不到3万元就能完成二代+三代+hic的全部实验!后续的基因组组装、注释其实你也能自己做,专业生信培训机构组学大讲堂手把手教你!组学大讲堂《动植物基因组组装与注释分析实操》视频课程主要包括四部分内容:基因组调研图Survey、基因组组装、染色体挂载以及基因组注释。目前前三部分内容已录制完成,剩余第四部分基因组注释的章节预计12月中旬更新完毕,已购课程学员,课程更新后不用复购,可直接学习新增内容。扫描下方二维码开始学习吧!
注:1. 本系列课程为录播课程,已经全部制作完成,购买后即可观看全部内容;
2. 购买之后可以通过手机或者电脑访问study.omicsclass.com,登录账号进行学习;
3. 购买或者观看遇到问题,可以加微信“532812110”联系我们。
做分析的过程中难免遇到计算资源不足、配置环境麻烦的问题,为了解决大家的痛点,我们也是快马加鞭的进行了服务器采购,并结合200份调查问卷的反馈,配置了相应的系统、分析环境以及软件等。
组学大讲堂独享云服务器,一个账号远程登录云服务器即可开始分析,不用为计算资源和环境配置而发愁。
扫描下方二维码,直达云服务器购买页面。
延伸阅读:
1. 11.3G大物种基因组+多组学手段揭示葱属多个重要生物学问题
4. 内参基因的选择?!
6. 在线绘制基因染色体位置图
7. 基因是怎么被注释的呢?
10. 预测蛋白质保守结构域神器-InterPro工具使用详解
12. GWAS分析模型介绍
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!