omicsgene
omicsgene - 生物信息
实名认证 专业认证

性别: 北京 - 北京市 注册于 2018-04-20

擅长:重测序,遗传进化,转录组,GWAS

生物信息

向TA求助
14164金币数
79990 经验值
438个粉丝
主页被访问 82917 次

4047 个回答

0 赞同

重测序

一般内存你尽量多设置一些,任务需要多少内存那个命令代码会自己处理,你不需要考虑那么多;你关心你所有任务总的内存使用情况即可,内存爆了,你减少任务量即可;  有些情况自己多跑任务,慢慢积累经验就知道了;

回答于 2025-01-07 12:32

0 赞同

重测序

自己试试就知道了,不同配置的机器不一样, 后台运行了任务,你htop 观察一下内存和cpu使用情况即可; 满了卡死了,就杀死任务重新来;

回答于 2025-01-07 12:27

0 赞同

老师 我想问一下就是这个snp的统计是哪里呀 我视频里面看啦 说...

gz 压缩文件不能直接wc -l 统计行数,需要解压才行: zcat vcf.gz|wc -l 我不知道你怎么统计的,重测序数据多基因组大,百万级甚至千万级SNP数量也正常吧;

回答于 2025-01-07 10:16

0 赞同

重测序

你还要考虑子任务的内存和cpu的使用情况,比如说你一个任务消耗 10G,50个任务就是500G,每个任务是4个线程,50个并行就是200个cpu; 这样写可以的: nohup ParaFly -c  w.sh -CPU 50 > w.sh.o&

回答于 2025-01-06 17:28

0 赞同

并行运行

这样写,nohup 要写在命令最前面:nohup ParaFly -c  w.sh -CPU 2 > w.sh.o&  这里的-CPU是线程数,双路是2个CPU概念不一样;独享的服务器线程数比较多,你可以多设置一些 : -CPU 10lscpu 命令看看:这里有48线程,你可以理解同时可以运行48个任务

回答于 2025-01-06 17:15

0 赞同

重测序

山羊基因组比较大,时间久正常,内存不是决定速度的主要因素; 加快速度,建议多样本并行运行;

回答于 2025-01-06 13:49

0 赞同

重测序

必须所有的GVCF都生成一起合并,不能分批合并; 生成了gvcf文件之后,bam文件后续不用可以删除; 后台任务杀死可以用 ps -xf 查看任务PID 然后用kill杀死任务,如果用我们的服务器,登录的时候有个使用手册建议看看有说明;

回答于 2025-01-06 13:47

0 赞同

老师就是做到xpclr和TajimaD的时候 出现下面的错误 要怎么解决呀

检查你vcf文件里面第一列染色体ID是不是和你命令行里面的对应; 再检查群体样本ID列表和VCF里面的是不是对应;

回答于 2025-01-05 16:34

0 赞同

老师 就是在做种群动态历史那里 我截频红色箭头指出的那个bam文...

选其中一个样本的bam文件代表这个群体就行;

回答于 2025-01-05 16:32

0 赞同

老师 我在做主成分分析的时候 出现下面这个错误 需要怎么解决呀...

-g 这个参数是为分组填充颜色的,你这个每个样本一组,没有那么多颜色分配报错了;

回答于 2025-01-04 16:44