AWK整理泛基因集文件出现部分问题

您好,我在使用以下代码进行格式整理后发现,部分出错

awk -F"\t|-|_" '{print $1$2"\t"$3"_"$4}' 13Pan-genes.list > apple13.pan-genes.list

我的13Pan-genes.list文件如下
attachments-2024-11-PU4TQJYX672af9c3d6b6c.pngattachments-2024-11-LtWzKpy7672af9ca8df55.png整理后的文件如下,有部分基因如Msi开头的没有加上第三列的信息attachments-2024-11-nHpC8G1E672afa1a2578e.png

请先 登录 后评论

2 个回答

每天学习一点点

同学你这个,直接awk -F"\t" '{print $1"\t"$2"_"$3}' 13Pan-genes.list > apple13.pan-genes.list 就可以,因为你这个基因名字中间有"_",所以会被拆成两个字段,要是不理解的话可以再看看awk的使用

请先 登录 后评论
丁烛

同学您好,请问这个pangenlist是如何制作的呢

请先 登录 后评论
  • 2 关注
  • 0 收藏,167 浏览
  • 树心台 提出于 2024-11-06 13:10

相似问题