以查找漾濞槭(Acer yangbiense)叶绿体和线粒体基因组为例:
打开NCBI("https://www.ncbi.nlm.nih.gov"),选择基因组数据库(Gneome)数据库搜索物种名:"Acer yangbiense"
跳转到漾濞槭的基因组详情页,往下翻阅
直接点击对应的序列号,如点击叶绿体基因组序列号 CM017775.1
以上漾濞槭例子中没有RefSeq信息,接下来以斑胸草雀为例,在斑胸草雀的参考基因组染色体详细表单中定位到Type列为MT的染色体(线粒体基因组),记下对应的RefSeq(Scaffold序列号)NC_007897.1
(太长了,省略中间部分)
斑胸草雀基因组染色体详细表单
接下来下载斑胸草雀的参考基因组的注释文件,点击Assembly跳转
在斑胸草雀基因组的Assembly页面点击Download Assemblies 选择RefSeq(参考基因组)的Genomic.gtf文件下载注释文件,下载后打开
用less -S 命令查看 less -S GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf ;红框的部分显示的是所有Scaffold序列号
用以下shell命令提取NC_007897.1序列(线粒体基因组)的的注释信息,然后提取出”gene"标签的内容,去重得到的便是线粒体基因名
cat GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf | awk '{if($1 == "NC_007897.1"){print $0}}' | awk '{match($0,/.+gene ([^;]+)/,a);print a[1]}' | sort -u >GCF_003957565.2_bTaeGut1.4.pri.MitoFeatures.txt
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!