建议用命令检查染色体数量: cut -f 1 demo.vcf| sort|uniq -c #压缩的zcat demo.vcf.gz|cut -f 1 | sort|uniq -c 检查gvcf 里面的数据是不是全的。不全重新跑,输出的时候输入文件后缀不要加gz 检查你的db导入是不是漏掉染色体了; 由于下游的分析软件很少有支持多倍体的vcf的,一般多倍体也当做2倍体分析;--sample-...
回答于 2024-10-25 18:27
文件路径不对,你用 ll命令检查一下路径是否正确:ll /work/scripts/看看相应的文件是否存在;
回答于 2024-10-25 16:23
看看结果吧,结果的VCF里面染色体是不是全的,你看看的; 有些特别短的scaffold可能就是没有SNP的;
回答于 2024-10-25 09:23
超过500M的染色体,GATK 索引不支持压缩的gvcf,但是解压的可以; 解决办法 1.解压g.vcf.gz gunzip demo.g.vcf.gz2. 解压后的vcf文件建立索引:gatk --java-options "-Xmx50g" IndexFeatureFile -I demo.g.vcf3.用解压后的g.vcf导入数据库
回答于 2024-10-22 14:03
The problem is in the zipped (g.vcf.gz) files, for big genomes (chromosomes with size of > 500 mbp), the tbi index format can handle chromosomes up to ~ 530 Mbp. Indexing with csi is the option for large genomes with large chromosomes, but unfortunately, CombineGVCF and GenomicsDB don't accept it...
回答于 2024-10-22 13:57
docker hub 国内上不了了,如果购买我们课程可以 : 联系客服处理:点击联系客服
回答于 2024-10-22 09:47
你这个信息截图不全,没发现有什么异常的报错; 最后的信息也是warn警告信息,不影响结果的; 看一下服务器内存是多少,内存不够运行样本太多也会报错; free -h #查看内存
回答于 2024-10-21 18:13
看看服务器内存多少,内存不够也可能出现这个问题: free -h #查看内存
回答于 2024-10-21 18:07