三代转录组,当前你不可忽视的研究手段

三代转录组几大法宝:全长转录本、鉴定异构体(Isoforms)、鉴定可变剪接、鉴定基因融合,长读长带来二代测序不可比拟的优势!


在生物学研究中二代测序,尤其是转录组测序,仍扮演着重要的角色,但已经从曾经的刷文利器跌落神坛,短读长这个缺点也不断受到诟病。转录组学的研究由谁来挽救?答案就是三代测序技术—单分子全长转录组测序。该测序技术可以直接得到全长转录本,无需组装,克服了二代测序技术缺陷,必将开创转录组学研究的新篇章。


下面以一篇2017年11月1日发表在Gigascience(IF 6.871)上的四倍体咖啡的三代转录组文章详细阐释下三代转录组的应用。


研究目的及选材



作者在该项研究中重点关注了2个方面,一是咖啡因合成途径中基因Isoform 的多样性;二是以蔗糖合成基因为切入点研究多倍体系统转录的多样性。


阿拉伯咖啡占世界咖啡贸易的70%,具有很高的商业价值,阿拉伯咖啡为异源四倍体,祖先种是C. canephora 和 C. eugenioides,目前仅有C. canephora基因组被破译,该实验旨在通过三代转录组揭示四倍体阿拉伯咖啡转录组本的多样性及得到一个较好的表达基因参考序列。


材料:阿拉伯咖啡按未成熟、中度成熟、成熟3个发育阶段,每个阶段随机选择5棵咖啡树,在上端和下端树冠分别取5枚咖啡豆备用,每棵10枚咖啡豆,取果皮,单独提取后等量混合为一个样品,用于测序,每个样品重复三次。咖啡豆成熟度如下图:

attachments-2018-04-rVt6CGjT5adc0a3c9db46.jpg

建库片段长度:0.5-10K

测序平台:Pacbio RSII

数据产出:共产出2,618,905raw reads,滤除300以下reads,除去线粒体、叶绿体及核糖体RNA后最终得到95995条高质量Isoforms ,对这些Isoforms 在4个数据库中进行了功能注释。

attachments-2018-04-kH7A9oQl5adc0a72e9444.jpg与之前咖啡EST及Coffea canphora基因信息完整度有了很大提升。

attachments-2018-04-uDjD78QA5adc0a9bb4d51.jpg

1.咖啡因合成途径中基因Isoforms 的多样性

作者通过已公布的咖啡因合成基因序列为参考,通过blast比对发现有25条Isoforms与咖啡因合成基因同源性很高,经过进一步筛选10条Isoforms被认定为候选咖啡因合成基因,包括3个XMT1的变异体,MXMT1的1个,DXMT1的2个,DXMT2的3个变异体。

这10个基因囊括了除XMT2 外的负责合成咖啡因的所有基因。与之前公布的阿拉伯咖啡和罗布塔斯咖啡基因序列相比,10个基因的序列在5'UTR区均有所延伸,8个基因在3'区有延伸,延伸最长达136bp,9个基因长度甚至超过了之前公布的基因组上的基因长度,另有基因发生可变聚腺苷酸化事件和可变剪接事件。

本次检测到的XMT1、 MXMT1和 DXMT2 的序列 与其祖先种中果咖啡中转录组本有更好的一致性,这表明这些基因转录可能来自于中果祖先种所提供的那部分遗传物质;相反XMT2 、 MXMT2 和DXMT1 所表现出的一致性要差一些,所以这几个基因的转录组可能来自于另一半基因组(C.eugenioides)。

attachments-2018-04-TnGnZD6r5adc0abe20cbf.jpg

2. 蔗糖合成基因研究多倍体系统转录的多样性

蔗糖合成酶1(SS1)有9个变异体,在本次结果中这9个变异体序列均在5'区有所延伸, 并且在这9个基因的5'区鉴定出了12个ORF,并且ORF数量与5'区长度呈正相关,5'UTR区的多样性在咖啡品质及其抗逆性上可能起到关键作用。分析发现9个蔗糖合成酶中有4个与中果咖啡中蔗糖合成酶序列表现出很高的一致性,这说明该4个SS1基因的转录组应该来源于中果祖先种基因组部分;另外5个SS1基因则表现出较多的变异,推测其来源于C. eugenioides祖先种基因组部分。

attachments-2018-04-Bqjojyrs5adc0aea445ee.jpgattachments-2018-04-S8PisAHH5adc0af3e97ce.jpg

小结及启示

与其他已公布的咖啡基因数据相比,本次实验结果无论是isoforms的数量还是长度都表现出了巨大的优势,并且GC含量亦较低,这说明三代转录组在转录本序列测序方面具备更大的优越性。

通过blast比对,约9.7%和3.8%的isoforms分别与C.canephora的CDS序列和阿拉伯咖啡的基因片段不匹配,这说明了本次检测到的isoforms具有很高的多样性,而这种多样性也只有通过全长转录组测序才能准确地捕捉到。

同时,C.canephora的CDS序列和阿拉伯咖啡的基因片段分别有26.1%和18.9%与本次得到的isoforms无法对应,这也有可能是由于不同试验取材不同造成的。

参考文献:

Cheng B, Furtado A, Henry R J. Long-read sequencing of the coffee bean transcriptome reveals the diversity of full-length transcripts[J]. Gigascience, 2017, 6(11):1-13.

日常科研中你我经会常遇到看不懂的图表,不会挖掘的数据,没有思路的文章,沟通不畅的个性化分析,求人不如求己,一切痛点都能解决:

1. 单细胞/空间转录组正在大火,高分文章必备,0基础学单细胞/空间转录组分析,做更牛的个性化分析,绘更漂亮的图,点这个链接:单细胞/空间转录组分析实操 

2. 2区文章发文新思路,0实验就能发文章,省钱省时间,套路化内容好写易发表,0基础学习最新版基因家族分析/泛基因家族分析链接:最新基因家族分析 ;最新版泛基因家族分析

3. 转录组越做越普遍,实验必备,看不懂结果?不会深入分析?自学都可以搞定,学习链接:有参转录组自主分析实操 转录组与代谢组结果解读/个性化数据分析 ; 

4. 代谢组分析硬件要求不高,个人电脑就可以分析,0基础学习链接:代谢组分析实操

3. 现在才是发表T2T基因组/泛基因组文章的好时机,成本低,好发表,做好高级个性化分析发表高分1区不是梦!T2T基因组/比较基因组/泛基因组分析学习链接:T2T基因组组装与注释分析动植物泛基因组分析 ;比较基因组分析

4. 群体重测序遗传进化分析+GWAS文章,篇篇10+分,缩短分析周期,提升文章亮点,勇敢冲击NGS顶刊,学习链接:群体遗传进化GWAS分析 ;

5. 传统图位克隆研究方法经久不衰,有遗传群体,有性状,自己就可以做,学习链接:遗传图谱构建与QTL分析

6. 微生物16S/18S/ITS多样性分析和宏基因组分析,学习链接:宏基因组分析 ;微生物16S/18s/ITS多样性分析

7. 细胞器基因组与比较基因组分析是真正的无需实验就可以发表2区期刊的文章思路,成本低,文章好发,性价比极高,学习链接:线粒体基因组分析实操 ;叶绿体基因组分析实操

8. 数据分析硬件利器,个人分析能力的倍增器,好用便宜的云生信服务器,专门为高通量测序数据分析而生,了解链接:云生信服务器

9. 免费好课,个人能力提升,生信入门,不可错过,内容涵盖:生信语言与工具基础、R语言绘图、常见科研绘图、数据处理技能等,免费好课总入口:

点我开启学习之旅

10. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击进入组学大讲堂网校学习


  • 发表于 2018-04-22 12:11
  • 阅读 ( 4795 )
  • 分类:转录组

0 条评论

请先 登录 后评论
红橙子
红橙子

9 篇文章

作家榜 »

  1. omicsgene 725 文章
  2. 安生水 360 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 89 文章
  6. rzx 85 文章
  7. 红橙子 81 文章
  8. CORNERSTONE 72 文章