trinity概览
Trinity:是由Broad Institute 开发的转录组de novo组装软件,由三个独立的软件模块组成:Inchworm Chrysalis和Butterfly。三个软件依次来处理大规模的RNA-seq的reads数据。
trinity的下载与安装
trinity最新版本是v2.8.5 下载官网在:https://github.com/trinityrnaseq/trinityrnaseq/wiki
解压:tar -zxvf Trinity-v2.8.5.tar.gz
cd trinityrnaseq-Trinity-v2.8.5
编译:make
注意:trinity需要3.1以上版本的CMake ,记得将CMake更新成最新版本,并添加到环境变量中。
trinity的使用方法
命令:Trinity.pl --seqType fq --JM 50G --left reads_1.fq --right reads_2.fq --CPU 6
几个重要参数介绍:
–seqType 支持输入数据格式为 fq 或者 fa
–JM 内存设置 新版本v2.4.0没有这一参数,由–max_memory代替 组装过程中,jellyfish这一步是最耗费资源的一步 所以这个内存主要由jellyfish控制
如果是双端测序:–left为read1 --right为read2 多个样品的reads由逗号隔开,不允许出现空格 但是老版本如r20131110版 reads是由空格隔开,具体看不同版本的trinity的帮助文档
如果是单端测序 参数为 --single 加上文件 多个样品的reads由逗号隔开,不允许出现空格
–CPU 软件所用线程
–SS_lib_type RF 链特异性文库需要加上这个参数
–no_run_butterfly 不进行butterfly步骤,在Chrysalis这一步完成后中断
–no_run_quantifygraph 不进行quantifygraph这一步
–output trinity的输出文件夹
–no_version_check 不汇报版本信息
注:trinity支持分步骤运行,但我认为必要性不大,因为分步运行的原因在于避免中途发生错误,但是trinity会自动检测之前输入,如果中途发生报错,进行修改之后,再次投递,会按照原输出继续跑,不会对之前结果进行覆盖
此外,我们在网易云课堂上有各种教学视频,有兴趣可以了解一下:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘
6. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击以下链接:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!