omicsgene
omicsgene - 生物信息
实名认证 专业认证

性别: 北京 - 北京市 注册于 2018-04-20

擅长:重测序,遗传进化,转录组,GWAS

生物信息

向TA求助
14141金币数
79840 经验值
438个粉丝
主页被访问 82603 次

4038 个回答

0 赞同

根据覆盖度及比对率如何剔除样品、gatk VariantFiltration过滤

数据分析具有探索性,没有绝对的最好的过滤参数,不同的项目数据特点和分析目的都会有不同的过滤参数; 这个需要自己去摸索,或者参考文献,设置合理的参数得到 质量和数量合适的SNP数量; 一般建议: 最低 4X,缺失率 0.7 ,深度低的样本建议可以去除; 其他种的样本建议放在一起CALL SNP,构建进化树;后续做GWAS...

回答于 2025-01-13 11:30

0 赞同

重测序

没有办法接着继续GATK不支持,中途断开了只能重新跑;

回答于 2025-01-10 09:40

0 赞同

老师,我提取cds ,pep用基因的ID,作为序列的ID命令。运行出来"...

../id.txt 上一级目录的这个ID列表文件是不是空的,你检查一下;

回答于 2025-01-09 17:06

0 赞同

重测序

docker ps -a 这个命令看看的

回答于 2025-01-09 16:20

0 赞同

老师,我想知道我在用你们演示的玉米数据提取cds和pep的脚本为什...

用我们的镜像分析数据,里面安装了这个脚本,不用你自己去安装;

回答于 2025-01-09 14:54

0 赞同

重测序

对的内存目前只用用了 15G; 任务不一定一直用这么多内存和CPU,是动态变化的,你要观察每个任务从开始到结束整个过程内存和CPU使用峰值才行; 盲目的加任务,当任务都达到峰值就会让系统崩溃;

回答于 2025-01-09 14:11

0 赞同

重测序

每个100%就是一个CPU;  最上面有每个CPU的使用情况;

回答于 2025-01-09 14:00

0 赞同

老师,gff文件保留最长转录本有蓝色那一行的可以输出成功,上面...

蓝色那一行不影响结果; 没出结果那个基因有注释CDS吗?你看看第三列;

回答于 2025-01-08 13:54

0 赞同

重测序

linux基础不好建议学习学习linux基础课:https://bdtcd.xetlk.com/s/17gwqZ 下面的这个代码你运行一下,打印每个样本的任务,到 gatk.sh for i in $(cat $workdir/data/data.txt); do  echo "gatk --java-options '-Xmx100g' HaplotypeCaller -R $REF   \    -I $workdir/3.map/result/${i}.sorted.dedup.bam \    -O ${i...

回答于 2025-01-08 13:47

0 赞同

重测序

ParaFly 这个命令要求sh文件里面一行是一个任务,不必要的注释换行符变量等需要删掉; 建议吧命令用for循环结合echo打印出来,手动编辑命令的sh文件再批量运行: 可以学习学习Linux基础:https://www.omicsclass.com/article/1006 实在不会就所有的输入输出文件用绝对路径,手动编辑命令文件;

回答于 2025-01-08 10:44