在前一篇文章里写了使用OthroFinder软件构建物种同源基因分析的工作原理的介绍,这次就利用Orthofinder结果中的数据来绘制物种系统发育树(Phylogenetic tree)。
在Orthofinder结果文件中有一个MultipleSequenceAlignments文件夹,里面有一个SpeciesTreeAlignment.fa文件,是orthofinder生成好的物种单拷贝基因串联序列比对结果,直接使用这个文件来构建物种树。在这个比对序列中空位数>50%的列已被删除。
构建步骤:
1. 过滤多序列比对结果;这一步根据序列情况选做,因为orthofinder的序列结果已经是过滤过的。
/share/work/biosoft/trimal/latest/trimal -in SpeciesTreeAlignment.fa -out SpeciesTreeAlignment_trimal.fa -fasta -gt 0.6 -cons 60
-in 输入序列
-out 过滤输出序列
-gt 0.6 当某一列(位点)的缺失比例>60%时,则过滤掉该列
-cons 60 过滤后序列总长不少于输入序列长度的60%
2. 进行物种树构建
构建物种树使用的软件是RAxML,RAxML 是一款基于最大似然法构建系统发育树的软件,运算速度较快,推荐使用。RAxML 的输入文件为多序列比对文件,phylip 格式或者fasta格式,输出文件为newick 格式进化树。
/share/work/biosoft/raxml/raxmlHPC/raxmlHPC-PTHREADS -T 5 -m PROTGAMMAJTT -f a -p 123 -x 123 -#100 -n out -s SpeciesTreeAlignment_trimal.fa 1>tree.log 2>tree.err
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!