三代数据SV检测软件安装与使用——cuteSV

三代测序在检测基因组结构变异方面有着很大的优势,但是由于数据分析算法、软件还处于不断开发更新中,当前还没有公认推荐的软件。这里为大家推荐一款国人开发的三代数据SV检测软件—cuteSV。该...
三代测序在检测基因组结构变异方面有着很大的优势,但是由于数据分析算法、软件还处于不断开发更新中,当前还没有公认推荐的软件。
这里为大家推荐一款国人开发的三代数据SV检测软件—cuteSV
该软件同时支持目前三代测序领域的两大平台PacBio和ONT的数据,此外,还兼顾了PacBio测序平台的两种测序模式:CLR模式和CCS模式。最重要的是用户体验很好,速度快,性价比高。

一、软件安装

软件可以直接从GitHub上下载安装,非常方便。
pip install cuteSV
#或
conda install -c bioconda cutesv
#或
git clone https://github.com/tjiangHIT/cuteSV.git && cd cuteSV/ && python setup.py install
注意,该软件是用Python3版本编写的,内部调用了一些常用软件,提前安装好即可,特别以下几款软件是必须的:1. python3;2. pysam;3. Biopython;4. cigar;5. numpy;6. pyvcf。
在安装pyvcf时容易报错,若报错,可参考此解决方式:pyvcf的安装 - 组学大讲堂问答社区 (omicsclass.com)

二、软件使用

该软件同时支持3种类型的数据,不同类型数据使用了不同固定参数,一般选择默认即可。
> For PacBio CLR data:
--max_cluster_bias_INS  100
--diff_ratio_merging_INS 0.3
--max_cluster_bias_DEL 200
--diff_ratio_merging_DEL 0.5
> For PacBio CCS(HIFI) data:
--max_cluster_bias_INS  1000
--diff_ratio_merging_INS 0.9
--max_cluster_bias_DEL 1000
--diff_ratio_merging_DEL 0.5
> For ONT data:
--max_cluster_bias_INS  100
--diff_ratio_merging_INS 0.3
--max_cluster_bias_DEL 100
--diff_ratio_merging_DEL 0.3

软件输入数据为比对好的bam文件,参考基因组的fa文件输出SV文件分析目录(该目录主要用于保存中间文件,生成结果后软件会自动删除)。
cuteSV <sorted.bam> <reference.fa> <output.vcf> <work_dir>
其他参数对于一般分析人员而言,使用默认参数即可。

运行命令如下(以CLR数据为例):


bin/cuteSV \
--max_cluster_bias_INS 100 
--diff_ratio_merging_INS 0.3 
--max_cluster_bias_DEL 200 
--diff_ratio_merging_DEL 0.5 \ #固定默认参数
--threads 8 
--sample test 
--retain_work_dir 
--report_readid 
--min_support 10 
--min_size 50\ #自定义参数(也可以不加)
test.sorted.bam test.SV.vcf tmp_dir #输入输出文件定义


参考链接:https://www.jianshu.com/p/c05855122380

  • 发表于 2023-04-28 14:14
  • 阅读 ( 1823 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
星莓
星莓

生物信息工程师

58 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 350 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 76 文章
  8. CORNERSTONE 72 文章