Pacbio三代全长转录组,采用IsoSeq3进行转录本的过滤,合并和校正,得到高质量的转录本,但是这些转录本之间还是存在一定的序列冗余,需要进行一定的序列合并操作。
Pacbio官方目前推荐两种策略,分别是:采用CD-HIT合并 与采用Cogent进行基因预测和序列合并。
现将两种策略的优缺点进行比较:
1. 优点:
1.1 合并速度快,而且cd-hit这软件也是比较经典的一款软件,在转录组分析中经常用到
1.2 结果容易理解: 该软件就只是简单的基于序列的相似性,进行转录本的合并,转录本的ID都不会变动。
2. 缺点:
2.1 无法区分那些转录本来自同一个基因。
2.2 无法提供转录本序列质量信息
1 优点:
1.1 提供基因和转录本水平的信息,当然这个所谓的基因水平,也只是Cogent的一种分析策略
1.2 也支持一定的序列质量筛选,比如覆盖度等。
2 缺点
2.1 软件运行时间长,速度比较慢。而且Cogent软件的安装比较麻烦
2.2 结果不容易理解:Cogent会对序列先进行聚类划分,之后对序列进行合并,得到更长的基因区域序列。
目前官方更加主要推荐Cogent软件,但是国内很多的机构还是采用cd-hit进行分析,毕竟cd-hit结果好解释,得到的转录本也多。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!