三代转录组,当多个样本进行常规的分析之后需要将多个样品中的转录本合并成一套unigene, 这个可以采用Cupcake 中的“chain_samples.py” 这个脚本来分析。
该脚本的运行命令如下:
usage: chain_samples.py [-h] [--fuzzy_junction FUZZY_JUNCTION] [--allow_5merge] config_file {norm_fl,norm_nfl,norm_nfl_amb,count_fl,count_nfl,count_nfl_amb}
输入文件需要一个配置文件即可。
1. 制备配置文件
该脚本的运行需要配置文件,配置文件的格式非常的重要,如下(# 是注释,请忽略):
# sample name 是不同样本的名称 # path 是不同样本进行isoforms collapse分析的目录 # prefix 是文件的前缀,需要保持在不同样品的分析目录中一致 SAMPLE=<sample name>;<path> SAMPLE=<sample name>;<path> GROUP_FILENAME=<prefix>.group.txt GFF_FILENAME=<prefix>.gff COUNT_FILENAME=<prefix>.count.txt FASTQ_FILENAME=<prefix>.rep.fastq
2. 参数选项
--fuzzy_junction FUZZY_JUNCTION : 这个是设置链接点处的允许不同碱基的最大数量
--allow_5merge: 这个是设置,是否允许对5'不一致的转录本进行截断
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!