proovread 是在2014年发表在Bioinformatics 上的一款Pacbio序列纠错软件,其基本的原理是利用高准确度的二代短序列,不停的迭代比对,对pacbio的序列进行纠正。
目前该软件已经在github 上公开,并不断的更新。
1. 软件的安装
安装方法比较简单,按照官方的说明操作即可。
2. 使用方法
使用也非常的简单,需要设置的输入项比较少,大部分采用默认配置即可。
proovread -t 8 -l isoseq_flnc.fasta -s WT.trim_read1.fastq -s WT.trim_read2.fastq -p out_prefix
参数说明:
-t : 设置线程数,该软件非常消耗资源,要想加快速度,可以将线程数设置大一些
-l : 就是输入pacbio 的序列
-s : 就是输入二代测序的短序列, 如果有多个文件,可以多次输入。
-p : 指定输出文件夹的名称
3. 输出结果
*.trimmed.f[aq] : | 去除低质量,保留被矫正过的高质量序列 |
*.untrimmed.fq : | 包含没有被矫正,低质量的,没有过滤的所有序列 |
纠正效果如何,暂时未做测试,但总体上该软件非常的慢,简直是无法容忍。需要寻找一款纠正速度比较快的软件。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!