Pacbio三代无参全长转录组(Iso-Seq) 的转录本合并策略

Pacbio三代无参全长转录组(IsoSeq3) 的转录本合并策略

Pacbio三代全长转录组,采用IsoSeq3进行转录本的过滤,合并和校正,得到高质量的转录本,但是这些转录本之间还是存在一定的序列冗余,需要进行一定的序列合并操作。

Pacbio官方目前推荐两种策略,分别是:采用CD-HIT合并  与采用Cogent进行基因预测和序列合并。

现将两种策略的优缺点进行比较:

CD-HIT合并策略的优缺点:

1. 优点:

    1.1    合并速度快,而且cd-hit这软件也是比较经典的一款软件,在转录组分析中经常用到

    1.2     结果容易理解: 该软件就只是简单的基于序列的相似性,进行转录本的合并,转录本的ID都不会变动。

2. 缺点:

    2.1    无法区分那些转录本来自同一个基因。

    2.2    无法提供转录本序列质量信息

Cogent合并策略

1 优点:

    1.1    提供基因和转录本水平的信息,当然这个所谓的基因水平,也只是Cogent的一种分析策略

    1.2    也支持一定的序列质量筛选,比如覆盖度等。

2 缺点

    2.1 软件运行时间长,速度比较慢。而且Cogent软件的安装比较麻烦

    2.2 结果不容易理解:Cogent会对序列先进行聚类划分,之后对序列进行合并,得到更长的基因区域序列。

 

目前官方更加主要推荐Cogent软件,但是国内很多的机构还是采用cd-hit进行分析,毕竟cd-hit结果好解释,得到的转录本也多。

  • 发表于 2018-09-19 10:06
  • 阅读 ( 5817 )
  • 分类:三代测序

0 条评论

请先 登录 后评论
microRNA
microRNA

115 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 80 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章