背景1:Newick格式 Newick是最常用的存储进化树的文件格式,如上面这个树,拓朴结构用newick格式可以表示为:
(B,(A,C,E),D);
括号最外层是根节点,它有三个子节点,B, (A,C,E)和D,而节点(A,C,E)也有三个子节点A,C和E。
加上分支长度,使用 : 来分隔:
(B:6.0,(A:5.0,C:3.0,E:4.0):5.0,D:11.0);
比如A:5.0代表的是A与其父节点的距离是5.0。
内部节点也可以有label,写在相应的括号外面,如下所示:
(B:6.0,(A:5.0,C:3.0,E:4.0)Ancestor1:5.0,D:11.0);
这是最为广泛支持的文件格式,很多进化树可视软件只支持newick格式。
背景2: 如何判断无根树有根树? 假设有下面三种形式的进化树:
[1] (a, b, c); 无根树
[2] (a, b, c):1; 有根树
[3] ((a,b),c); 有根树
如果最外层大括号内只有两个分枝,即为有根树,如[3];
如果最外层大括号内有三个或以上分枝,一般为无根树,如[1];
但是,如果大括号外存在枝长参数,如[2]中的:1,这种情况认为三个分枝以一定的枝长连接到根上,为有根树
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!