练习服务器只能作为练习使用,不能分析自己的数据,分配的存储有限,你这个存储满了,删除一些不要的文件再传数据:如果要分析自己的数据可以租用我们的云服务器;视频课程 具体咨询可以:点击联系客服
回答于 2024-10-29 10:29
建议用命令检查染色体数量: cut -f 1 demo.vcf| sort|uniq -c #压缩的zcat demo.vcf.gz|cut -f 1 | sort|uniq -c 检查gvcf 里面的数据是不是全的。不全重新跑,输出的时候输入文件后缀不要加gz 检查你的db导入是不是漏掉染色体了; 由于下游的分析软件很少有支持多倍体的vcf的,一般多倍体也当做2倍体分析;--sample-...
回答于 2024-10-25 18:27
文件路径不对,你用 ll命令检查一下路径是否正确:ll /work/scripts/看看相应的文件是否存在;
回答于 2024-10-25 16:23
看看结果吧,结果的VCF里面染色体是不是全的,你看看的; 有些特别短的scaffold可能就是没有SNP的;
回答于 2024-10-25 09:23
超过500M的染色体,GATK 索引不支持压缩的gvcf,但是解压的可以; 解决办法 1.解压g.vcf.gz gunzip demo.g.vcf.gz2. 解压后的vcf文件建立索引:gatk --java-options "-Xmx50g" IndexFeatureFile -I demo.g.vcf3.用解压后的g.vcf导入数据库
回答于 2024-10-22 14:03
The problem is in the zipped (g.vcf.gz) files, for big genomes (chromosomes with size of > 500 mbp), the tbi index format can handle chromosomes up to ~ 530 Mbp. Indexing with csi is the option for large genomes with large chromosomes, but unfortunately, CombineGVCF and GenomicsDB don't accept it...
回答于 2024-10-22 13:57
docker hub 国内上不了了,如果购买我们课程可以 : 联系客服处理:点击联系客服
回答于 2024-10-22 09:47