叶绿体是绿色植物进行光合作用的细胞器,具有合成蛋白质、淀粉、色素等功能,普遍存在于真核自养生物中,尤其是藻类和陆生植物,其基因组可自主遗传。叶绿体基因组序列对于研究植物物种起源,进化演变及不同物种间的亲缘关系等具有重要意义。
上述研究中常用到的叶绿体基因有atpA、atpB、atpE、atpH、petB、psaA、psaB、psbD、psbE、psbF、rpl14、rpl16、rpl20、rpoB、rps11、rps14、rps18、rps19、rps2、rps3、rps4、rps8 等等。分析时可选用所有的基因,也可以只选用部分基因。
对于叶绿体基因序列,可以在NCBI上进行下载,在这里有些小技巧,可以帮我们节省大量时间和精力。本文就来介绍一个快速检索并下载基因序列的方法。
打开NCBI后,选择数据库并输入搜索条件,这里通常搜索的是和分析物种相近的物种,如隶属于同一个科或者属的物种,有时候还需要加上外类群物种。回车,就会检索出我们所需的基因。
有时候需要检索的物种很多,如果分别下载就会比较麻烦。其实在NCBI检索结果页面的检索框下方会有个不起眼的"send to"按钮,这是快速下载检索基因序列的关键。
这个send to 可以理解为保存检索结果,有很多种方法可以保存检索结果,比如用clipboard(暂时的),my NCBI collections(不限时的)。在检索结果的下面send to 中选择clipboard(类似于剪切板),选择后旁边就会多个clipboard的小标志。
点击Add to Clipboard,就会添加此次检索到的基因至Clipboard,并会显示Clipboard中有几条记录。之后可以继续搜索其它的基因添加到Clipboard中,然后一起下载所有基因序列。
点击上图Clipboard后的记录数,可以查看保存的基因信息。在下拉菜单中,还会看到File选项,选择File,可以将保存的基因信息下载成文本文件,如果一下子要下载好几千条,会需要比较久的时间。里面的保存格式有多种,比如FASTA、GFF3,可以根据后续处理数据的需要进行选择。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!