最近有很多人问到基因家族分析当中的基因加倍和复制现象,也就是:tandem duplication和segmental duplication的区别与联系,关于这个问题的解答,我已经在我们组学大讲堂问答网站上进行了详细回答,感兴趣的可以到 www.omicsclass.com 网站上搜索关键词“tandem”就可以得到详细答案,我这里就不详细介绍了。今天想说的是一篇刚刚发表的关于基因家族分析的文章,其正好利用了MCScanX分析了菠萝中的WRKY基因家族的加倍与复制现象,这里分享给大家。
根据Pfam当中WRKY基因家族的保守结构域(PF03106 )信息利用HMMER 3.0在菠萝基因组当中对所有基因法人蛋白质序列进行搜索,找到具有该保守结构域的基因,如果存在保守结构域即为WRKY基因家族候选基因,再用PFAM and SMART两个软件进一步确认。由于菠萝基因组注释不好,作者还利用转录组的数据回比基因的信息进一步确认基因注释的准确性,注释不准的候选基因给删除掉,最终在菠萝基因组当中鉴定了54个基因为WRKY基因家族基因,另外还选取了部分最终的菠萝中的WRKY基因做PCR扩增验证。
通过对54个WRKY基因的蛋白质序列进行多序列比对,利用MEGA软件,构建系统进化树,同时把拟南芥当中的WRKY基因也加进去一起构建进化树,方便对基因进行分类分析;通过进化树分析,以及结构分析,可以把这54个基因共分成3大类8个亚类。
绘制了进化树,基因的外显子和内含子位置信息,以及基因序列上的motif信息:
利用MCScanX软件,对菠萝的基因组做共线性分析,通过共线性分析发现菠萝基因组当中WRKY基因家族存在复制现象,如下面灰色的线代表菠萝基因组当中所有的共线性关系,红色的线代表了WRKY基因家族成对的复制现象。
转录组的数据包括:菠萝果实的三个不同发育阶段的苞片,萼片,花盘,容器,卵巢壁,胎盘,胚珠,果核的转录组数据,以及耐盐和干旱处理愈伤组织5个时间点的数据(4, 8, 12, 24 and 48 h),看到这里你是不是觉得做个基因家族没必要测这么多转录组数据吧,真是土豪。但是细看文章数据来源,发现这都是作者以前的数据,并且已经发表过文章,只是拿来验证一下基因家族的表达情况,数据再利用而已,真正做实验的也就是做了下qPCR验证。如下文章数据来源说明(小编只确证了文献37,文献64对应的引用为MCScanX,个人推断为引用错误,感兴趣的可以仔细查证一下)。
以下为WRKY基因家族在不同菠萝组织当中的表达情况,其中 AcWRKY19在任何组织当中都没有表达,有37个WRKY基因在所有30个组织当中都有表达;
由于WRKY基因家族是与抗性相关的基因家族,所以作者利用不同胁迫处理后的转录组数据来验证WRKY基因家族基因对胁迫的响应表达。发现很多基因对处理都有很强的响应表达。图太多就不贴了。
这篇文章思路是基因家族+转录组的套路文章,而且文章中的转录组数据都是自己以前的数据,也是数据再利用,节约了不少发文的成本。其实呢,现在NCBI上专门收录高通量测序的SRA数据库当中有很多公开的数据,如果自己没有数据,也可以利用别人的转录组数据在自己的基因家族分析当中做个表达量分析也是不错的,所以说这是最经济有效的发文套路。
针对以上发文套路我们组学大讲堂推出过基因家族分析课程,涵盖了刚才文章中几乎所有的分析内容,针对文章中利用MCScanX分析基因加倍与复制的内容,我们加班加点对课程进行更新升级,购买过基因家族课程的小伙伴赶快去学习新内容吧,没有购买的也可以扫描够买获得基因家族分析套路文章技能。
更多:《基因家族分析实操课程》《基因家族分析文献详解》
https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-018-4880-x
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课:linux系统使用、perl入门到精通、perl语言高级、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析、GEO芯片数据挖掘、 GEO芯片数据不同平台标准化 、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他,二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读、
延伸阅读
另一篇基因家族|GEO芯片数据挖掘|GSEA原理详解|利用好WGCNA|TCGA数据挖掘
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!