perl或者python代码:批量修改进化树中基因ID或者物种ID名字 nwk文件

进化树修改,tree

有时候我们要对进化树当中的基因ID或者物种ID进行批量的修改,这里可以利用perl或者python 再结合正则表达式批量搜索替换,给出示例代码:


python实现替换:

import re,os
tree="(chicken,((mouse,rat),(chimp,human)));"
names=re.findall(r"[a-zA-Z0-9_]+",tree)

f=open("newtree.nwk","w")
for i in names:
    if not re.match(r'\d+$',i):

        tree=tree.replace(i,i+"#1")
        
f.write(tree+"\n")
f.close()


perl实现替换:

$tree="(chicken,((mouse,rat),(chimp,human)));";
@names=($tree=~/([a-zA-Z0-9_]+)/g);

open OUT ,">newtree.nwk" or die "can't open $name.nwk\n";
for my $name(@names){
        if ( $name!~/^\d+$/){
                $tree=~s/$name/$name#1/;
        }
}
print OUT "$tree\n";
close(OUT);


生物信息入门到精通必修基础课:linux系统使用biolinux搭建生物信息分析环境linux命令处理生物大数据perl入门到精通perl语言高级R语言画图R语言快速入门与提高python语言入门到精通

  • 发表于 2019-10-10 10:40
  • 阅读 ( 5111 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

698 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 80 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章