omicsgene 的回答 - 组学大讲堂问答社区

omicsgene - 生物信息

实名认证专业认证

擅长：重测序,遗传进化,转录组,GWAS

生物信息

向TA求助

14121金币数

79720 经验值

437个粉丝

主页被访问 82474 次

4032 个回答

0 赞同

重测序

每个100%就是一个CPU；最上面有每个CPU的使用情况；

回答于 2025-01-09 14:00

0 赞同

老师，gff文件保留最长转录本有蓝色那一行的可以输出成功，上面...

蓝色那一行不影响结果；没出结果那个基因有注释CDS吗？你看看第三列；

回答于 2025-01-08 13:54

0 赞同

重测序

linux基础不好建议学习学习linux基础课：https://bdtcd.xetlk.com/s/17gwqZ 下面的这个代码你运行一下，打印每个样本的任务，到 gatk.sh for i in $(cat $workdir/data/data.txt); do echo "gatk --java-options '-Xmx100g' HaplotypeCaller -R $REF \ -I $workdir/3.map/result/${i}.sorted.dedup.bam \ -O ${i...

回答于 2025-01-08 13:47

0 赞同

重测序

ParaFly 这个命令要求sh文件里面一行是一个任务，不必要的注释换行符变量等需要删掉；建议吧命令用for循环结合echo打印出来，手动编辑命令的sh文件再批量运行：可以学习学习Linux基础：https://www.omicsclass.com/article/1006 实在不会就所有的输入输出文件用绝对路径，手动编辑命令文件；

回答于 2025-01-08 10:44

0 赞同

基因家族分析

联系客服处理：点击联系客服

回答于 2025-01-07 17:19

0 赞同

重测序

一般内存你尽量多设置一些，任务需要多少内存那个命令代码会自己处理，你不需要考虑那么多；你关心你所有任务总的内存使用情况即可，内存爆了，你减少任务量即可；有些情况自己多跑任务，慢慢积累经验就知道了；

回答于 2025-01-07 12:32

0 赞同

重测序

自己试试就知道了，不同配置的机器不一样，后台运行了任务，你htop 观察一下内存和cpu使用情况即可；满了卡死了，就杀死任务重新来；

回答于 2025-01-07 12:27

0 赞同

老师我想问一下就是这个snp的统计是哪里呀我视频里面看啦说...

gz 压缩文件不能直接wc -l 统计行数，需要解压才行： zcat vcf.gz|wc -l 我不知道你怎么统计的，重测序数据多基因组大，百万级甚至千万级SNP数量也正常吧；

回答于 2025-01-07 10:16

0 赞同

重测序

你还要考虑子任务的内存和cpu的使用情况，比如说你一个任务消耗 10G，50个任务就是500G，每个任务是4个线程，50个并行就是200个cpu；这样写可以的： nohup ParaFly -c w.sh -CPU 50 > w.sh.o&

回答于 2025-01-06 17:28

0 赞同

并行运行

这样写，nohup 要写在命令最前面：nohup ParaFly -c w.sh -CPU 2 > w.sh.o& 这里的-CPU是线程数，双路是2个CPU概念不一样；独享的服务器线程数比较多，你可以多设置一些： -CPU 10lscpu 命令看看：这里有48线程，你可以理解同时可以运行48个任务

回答于 2025-01-06 17:15