Iso-Seq的建库方案有如下三类:
Iso-Seq3 进行全长转录组的分析,运行流程如下图所示:
1 ccs(Circular Consensus Calling)
ccs 获取一致性的序列,要求每一条测序的reads至少有一端含有引物序列。
ccs test.subreads.bam ccs.bam --noPolish --minPasses 1
2 测序引物和barcode的去除
这一步是采用lima 来完成的,这个软件也是官方最新开发出来的程序,速度和准确度都较以往的算法有了很大的提升。还能够基于barcode序列区分不同的样品,
lima ccs.bam barcoded_primers.fasta demux.ccs.bam --isoseq --no-pbi
3 聚类(cluster)
聚类采用IsoSeq3 软件来完成,这一步会首先将ployA尾巴去除掉,并将连环结构去除掉,再对相似的序列进行聚类,最好形成全长的reads。
isoseq3 cluster demux.primer_5p--primer_3p.bam unpolished.bam --verbose
4 抛光(polish)
这一步主要是将聚类的转录本,合并成一个完整的一致性序列。
isoseq3 polish -j 16 unpolished.bam test.subreads.bam polished.bam
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!