老师,在生成gbcf文件后,发现只运行了前三个染色体的,是我的代码有问题嘛?该怎么解决啊?参考基因组的fasta,fai文件都是好的,前期生成的bam文件也是好的,样品是四倍体,参考基因组是异源四倍体

attachments-2024-10-QlG5mdkl671b6e79199eb.pngattachments-2024-10-rT6rmtk3671b6eb667f3c.pngattachments-2024-10-cKjlwGUn671b6ecf29a72.pngattachments-2024-10-mJ5KPRfg671b6ed46834e.pngattachments-2024-10-xPEjJPbJ671b6edd1409d.png

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

建议用命令检查染色体数量:

cut -f 1 demo.vcf| sort|uniq -c 
#压缩的
zcat demo.vcf.gz|cut -f 1 | sort|uniq -c 

检查gvcf 里面的数据是不是全的。不全重新跑,输出的时候输入文件后缀不要加gz 

检查你的db导入是不是漏掉染色体了;

由于下游的分析软件很少有支持多倍体的vcf的,一般多倍体也当做2倍体分析;--sample-ploidy 2 




请先 登录 后评论