重测序

一行一个任务是什么意思?下面的这个命令,怎么改可以并行运行?

###################################################3

#GATK call SNP

####################################################

cd $workdir  #回到工作目录

mkdir -p $workdir/4.snp_indel/GATK

cd $workdir/4.snp_indel/GATK

#############################################################

#方法2:样品多可先生成GVCF,再合并,适用于集群服务器,可并行运行,

############################################################

# 每个样品分开运行,生成gvcf

for i in $(cat $workdir/data/data.txt); do


  echo "RUN CMD: gatk --java-options '-Xmx100g' HaplotypeCaller -R $REF   \

    -I $workdir/3.map/result/${i}.sorted.dedup.bam \

    -O ${i}.g.vcf.gz --max-alternate-alleles 4  --sample-ploidy 2 \

    -ERC GVCF --tmp-dir $tmpdir"


  gatk --java-options "-Xmx100g" HaplotypeCaller -R $REF   \

    -I $workdir/3.map/result/${i}.sorted.dedup.bam \

    -O ${i}.g.vcf.gz --max-alternate-alleles 4  --sample-ploidy 2 \

    -ERC GVCF --tmp-dir $tmpdir

done

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

linux基础不好建议学习学习linux基础课:https://bdtcd.xetlk.com/s/17gwqZ

下面的这个代码你运行一下,打印每个样本的任务,到 gatk.sh

for i in $(cat $workdir/data/data.txt); do
  echo "gatk --java-options '-Xmx100g' HaplotypeCaller -R $REF   \
    -I $workdir/3.map/result/${i}.sorted.dedup.bam \
    -O ${i}.g.vcf.gz --max-alternate-alleles 4  --sample-ploidy 2 \
    -ERC GVCF --tmp-dir $tmpdir"

done >gatk.sh


然后批量运行这个gatk.sh 这个就行;

重测序视频课程里面也讲过,你看视频要有耐心,不要快进看;

请先 登录 后评论
  • 1 关注
  • 0 收藏,111 浏览
  • 随风 提出于 4天前

相似问题