xun 的回答 - 组学大讲堂问答社区

0 赞同

老师您好，我测定的是土壤微生物的宏基因组，在进行物种注释时选...

对于复杂环境来说不算太差,一些微生物可能没有出现在微生物的库里,再加上有的dna年代久远,破损比较严重,因为物种注释一般是关注属级别以上的,所以还行然后可以看看数据库的版本,kraken 的更新比较快,要是更新了2,3个版本了,可以尝试下载最新的做一下看看现在最新的好像是24年底的

回答于 2天前

0 赞同

kw本来就是非参数检验,不需要,但是可以做lefse不建议

回答于 3天前

0 赞同

这几个软件前面不要加python,直接写名字就行,这个是qiime软件自带的函数

回答于 2025-03-26 12:03

0 赞同

你的group.txt这个文件没有表头,前面的代码都执行了吗,你看一下他最上面的一行是不是#开头的,如果不是这个问题,那就是metadata的写法不对,需要和课程里提供的格式完全一样

回答于 2025-03-24 13:21

0 赞同

你的上一步,bowtie应该报错了,你看看这个文件,$workdir/1.host_del_and_qc/cleandata/${i}.bowtie.map.log里面咋说的,是不是你的宿主文件写的不对?

回答于 2025-03-14 14:50

0 赞同

不对,应该这样说,lda score, 代表的是一个物种在区分某组和其他组时的能力大小丰度很低低的lda score也高,只不过坏处事你不知道他到底是高还是低,所以可以结合那个丰度图看,就是不同组相对丰度的图

回答于 2025-03-12 13:24

0 赞同

这个一般是分箱之后,每个属菌都去挖掘一下功能汇总一下,,然后这些功能和他们对应的这个功能类别,用桑基图连起来就行因为级别比较高,所以组装以后的数据注释一下,得到物种,功能对印关系也能做

回答于 2025-03-12 13:06

0 赞同

他说的索引是这个RAPMAP格式,但是这个应该是老版本salmon的,你试试重新构建一下缩影,用这个1.9版本的,要是还有问题就去我们那个docker里跑这一步,有的时候依赖处理不了换个环境就好

回答于 2025-03-07 09:33

0 赞同

用data.table包的fread,读的很快,一百万行大概几秒就行如果数据再大,上亿行,就逐行读取吧

回答于 2025-03-03 11:16

0 赞同

对的,其实需要的文件没几个,你看看后续如果没用到,那就可以删掉的

回答于 2025-02-28 11:37