出现上面的warning可能是序列的相似度太高,如果能排除是测序和注释的错误的话,就继续做就可以了,至于构树的时候你用多少基因去构树,树上就会有多少个基因,树上面展示哪些基因取决于你想说明的生物学问题
回答于 3天前
你有多少个样本啊,我在课程里面说了要把这个地方改成你对应的样本数+1,你是不是没改,你改一下: awk -F"\t" '{if($0!~/^Fam_N/){for(i=2;i<=你的样本数+1;i++){print $1"\t"$i}}}' PAV_gene.list |sed "s/;$//"|awk -F"\t" '{gsub(";","\n"$1"\t",$0);print}'|awk -F"\t" '{if($2!=""){print}}' > Fam_gene.list
回答于 3天前
你看一下你的表型数据里面有没有奇怪的数据,第二例应该都是数值型数据,检查一下有没有混进去奇怪的字符 ,还有就是你的性状名称中不要有空格,你可以用下划线连接
回答于 4天前
你家族基因列表里面的后缀呢?你按照流程跑的吗?是的话应该是有的呀,是在这里加的: 也就是说你加上之后,你后续的分析,你的基因id后面是应该有物种名作为后缀的,你再检查一下是不是哪里没有跑
回答于 2025-04-08 17:48
同学,其实前面已经给你说过解决办法了,最好的办法就是你重新跑流程,不要乱改你的基因id,你改了之后我们也很难改流程去对你的数据进行调试,你可以把构建泛基因列表的代码这里改一下,然后回到你修改id之前重新跑一下,总之不要改动你原始的基因id,不然后面对应起来就是很麻烦,你按照流程跑: # 把第二列的前缀去掉 a...
回答于 2025-04-07 13:33
所以你在未做任何处理之前,你的gff文件里面基因ID的格式就是基因组名+基因id这样的是吗,我举个例子,比如说你的原始gff文件里面,你的基因编号就是C01_00G00000006对吗,要是你描述的这种情况,你需要把这条指令改成这样:awk 'FNR>1{print $1"\t"$3"_"$2"_"$3}' final.last.gene.pair.txt > yourfile.pan-genes.li...
回答于 2025-04-03 09:44
awk 'FNR>1{print $1"\t"$2"_"$3}' 26Pan-genes.list > 26mazi.pan-genes.list
回答于 2025-04-01 16:01
last报错应该是因为内存不足:https://www.omicsclass.com/article/1413
回答于 2025-03-31 14:10