叶绿体是绿色植物进行光合作用的细胞器,具有合成蛋白质、淀粉、色素等功能,普遍存在于真核自养生物中,尤其是藻类和陆生植物,其基因组可自主遗传。
叶绿体基因组序列对于研究植物物种起源,进化演变及不同物种间的亲缘关系等具有重要意义。今天小编就来介绍如何用叶绿体基因做系统发育分析。
于已测序的物种,我们可以直接下载基因组数据;而没有测序的物种就需要转录组分析数据了。通常是多个物种一起进行分析的。以转录组数据为例,其步骤如下:
首先是选择用于分析的基因,可以用到的叶绿体基因有atpA、atpB、atpE、atpH、petB、psaA、psaB、psbD、psbE、psbF、rpl14、rpl16、rpl20、rpoB、rps11、rps14、rps18、rps19、rps2、rps3、rps4、rps8 等等。可以使用所有的,也可以只用部分基因。
然后从NCBI上下载相应基因的蛋白质序列,其物种最好是与要分析的物种相近的。如果嫌麻烦,可以使用脚本批量下载!NCBI批量下载数据,省时又省力(戳这里可以查看)。
下载好基因序列后使用BLASTP对下载序列与所有样品转录组结果中的蛋白质序列(需合并为一个文件,注意要区分所属样品)进行比对,e-value =10−6 ,从比对结果中筛选在所有样品中都存在的叶绿体基因,并提取各样品中对应基因的蛋白质序列,不同基因的蛋白质序列存放在不同文件中。
在这里,可以选择 2. 中从NCBI下载基因的物种作为外类群,将下载的基因序列加入到 3. 中相应基因的蛋白质序列文件中,共同构建系统发育树。然后使用MUSCLE或CLUSTALW对每组基因的蛋白质进行多序列比对,将所有比对好的序列分别按所属样品串联在一起,构成一个supergenes 。
最后就可以使用MEGA构建进化树了。
参考文献:
Zhang Z, He Z, Xu S, et al. Transcriptome analyses provide insights into the phylogeny and adaptive evolution of the mangrove fern genus Acrostichum[J]. Scientific reports, 2016, 6: 35634.
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!