三代全长转录组鉴定红花黄酮类次代物合成相关相关基因-原文献下载链接:红花三代转录组.pdf(请点击下载)
文献解读:
三代全长转录组现在做的很多,但所见文章很多是有参物种,所关注分析内容也较多,如基因结构优化、新基因发现、可变剪接、融合基因等;那对于无参物种或者参考基因组较差物种,三代转录组文章一般都挖掘数据写论文呢?下面我们一起学习一篇2018年7月发表在BMC Genomics上题为:Full-length transcriptome sequences and the identification of putative genes for flavonoid biosynthesis in safflower 的红花三代全长转录组文章。
背景:
红花(拉丁学名:Carthamus tinctorius L.),别名:红蓝花 、刺红花,菊科、红花属植物,具有活血化瘀,散湿去肿的功效,是一味传统名贵中药材。
目前红花基因组测序应该已完成,但精细基因组序列及文章仍未公开,网上仅有红花基因组草图(文章链接:https://www.researchgate.net/publication/303551846_Genetic_Mapping_of_Millions_of_SNPs_in_Safflower_Carthamus_tinctorius_L_via_Whole_Genome_Re-sequencing),该草图仅建一个小片段文库,测序深度21×,参考价值较差;红花主要有效成分为黄酮类次生代谢物。所以本文作者利用三代全长转录组主要是鉴定与红花黄酮类次生代谢物合成相关的基因。
材料与方法:
取红花根茎叶及花期第一、三、五天的花瓣,共6个组织,每个组织来自于5单株,提取后混合建库。
三代测序仪选择Pacific Bioscience RS II ,共建3个长度片段文库:1–2, 2–3, 和3–6 k。
结果:
1. 转录组本组装及去冗余
混样三代转录组共获得10.43Gb的clean data,组装得到共79,926 条转录组本,其中高质量60,894 条,低质量19,032 条。去冗余作者用了两种方法,一是与红花基因组草图比对;二是无法比对到基因组草图的通过聚类方法去冗余;最终得到38,302条去冗余转录组本。
2. 转录本的功能注释
对以上去冗余后的38302条转录组本进行功能注释,数据库有:GO、KOG、KEGG、COG、Pfam、Nr等,此处仅是总体介绍下注释情况,不再详述,见下图。
3. 鉴定与黄酮类次代物合成相关基因
根据KEGG注释结果,筛选到44个与黄酮类合成有关的转录本;由于水稻、拟南芥中黄酮合成相关基因研究更为清楚,所以作者又将该44个转录本与水稻及拟南芥中黄酮合成相关基因进行了blast比对,构建系统发育树,根据比对结果对红花中黄酮合成相关基因进行命名,并将其划分为8个家族:C3H, C4H, OMT,LAD, HCT, CHI, CHS和 F3H。
接下来作者为进一步阐明以上基因的功能,又进一步对基因的保守motif 结构进行分析,详见下表。
4. 黄酮类次代物合成相关基因的表达分析
由于本文没有做二代测序,所以通过半定量PCR分别对6个组织中候选的的黄酮合成相关基因进行表达定量分析,结果显示不同基因表达有很大差异 ,并且某些基因在不同组织中表达具有组织特异性,如下图:
由于红花花入药,所以作者筛选了在花中表达量高或特异性表达的基因,作为可能参与黄酮类是次代物的合成的重点候选基因。
5. 外源茉莉酸甲酯处理下黄酮类次代物合成相关基因表达模式分析
茉莉酸甲酯是植物内源信号分子,前人研究用茉莉酸甲酯外源处理红花能提高红花内主效成分含量,所以作者又对花期3天的红花进行茉莉酸甲酯处理,并设对照,处理6h后取样并通过QRT-PCR检测以上44个候选基因的表达模式变化。详见下图:
6. SSR标记开发及LncRNA鉴定
三代全长转录组很适合开发SSR标记;作者又用4种方法鉴定出1247个
LncRNA。
总结:
作者通过一个三代转录组,得到了较为完整的红花转录本数据库,并从中鉴定出44个可能参与红花黄酮类次生代谢物合成的转录组本,并通过这些基因在在花瓣中表达特异性,筛选出重点候选基因12个,再结合茉莉酸甲酯处理实验,最终确定5个最有可能参与黄酮类次生代谢物合成的基因,为进一步挖掘红花黄酮类次生代谢基因资源奠定了基础。
文章亮点:
1. 借助红花基因组草图,三代全长转录组去冗余;对于无参物种只能通过聚类的方式去冗余了,不过对发文章影响应该也不大。
2. 分析黄酮类合成相关基因时,通过构建系统发育树划分成8个基因家族,后分析motif结构及后续每个家族内基因在不同样本中表达量信息;此种将三代转录组与基因家族分析内容结合起来很是加分,值得借鉴。
3.结果4中:半定量PCR分别对6个组织中候选的黄酮合成相关基因进行表达定量分析中,作者将系统发育树、motif结构和基因定量数据三个内容整合在了一张图里,很是漂亮,我这里给大家推荐一篇类似的作图文章:进化树+基因结构+motif—1张图全显示!学习下吧!把论文里的图做漂亮!
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘
6. 更多学习内容:linux、perl、R语言画图,更多免费课程请扫描下方二维码:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!