主要功能是Bio.SeqIO.parse()获取file handle(或文件名)和格式名称,并返回 SeqRecord迭代器。这使您可以执行以下操作:
from Bio import SeqIO for record in SeqIO.parse("example.fasta", "fasta"): print(record.id)
or using a handle:
from Bio import SeqIO with open("example.fasta", "r") as handle: for record in SeqIO.parse(handle, "fasta"): print(record.id)
当您只需要通过一些标识符来索引您的记录。我们可以用Bio.SeqIO.to_dict()将 SeqRecord迭代器(或列表)转换为字典(在内存中):
from Bio import SeqIO record_dict = SeqIO.to_dict(SeqIO.parse("test.fa", "fasta")) print(record_dict["AT1G32510.1"]) # use any record ID ID: AT1G32510.1 Name: AT1G32510.1 Description: AT1G32510.1 cds chromosome:TAIR10:1:11756691:11758118:1 gene:AT1G32510 gene_biotype:protein_coding transcript_biotype:protein_coding gene_symbol:ANAC011 description:NAC011 [Source:UniProtKB/TrEMBL;Acc:A0A178WL27] Number of features: 0 Seq('ATGGTAGGATCATTTTTACCACCTGGTTTCAGATTTTATCCAACAGATGAAGAA...TAA', SingleLetterAlphabet())
此外,我们在网易云课堂上有各种教学视频,有兴趣可以了解一下:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘
6. 更多学习内容:linux、perl、R语言画图,更多免费课程请点击以下链接:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!