你的问题中存在歧义,一般说编码区指的是DNA或者RNA水平上的比如cds序列,既然都翻译成蛋白了就说明都是来自编码区。另外学会生信根据基因组序列文件和注释文件去提取各类型的序列非常简单,所以建议你去学习一下,只是提问我也没法给你演示,建议学一下这个课程:https://apphc8vuqty1843.h5.xiaoeknow.com/v1/goods/goods...
回答于 2023-08-25 16:20
根据报错信息,应该是由于文件"aln_out/991.pep_aln.renamed"无法被读取或找不到而导致的错误。请确认文件"aln_out/991.pep_aln.renamed"存在并且位于正确的路径下。
回答于 2023-08-14 17:53
Motif的长度通常是根据已知的基因或蛋白质序列中出现的频率最高的核苷酸或氨基酸序列来确定的,存在比比pfam数据库中更长的可能,如果一个Motif是特定蛋白质家族的一部分,那么它的长度可能会与Pfam数据库中的模式相似或更短。然而,如果一个Motif是更加广泛和通用的情况下,那么它的长度可能会更长。最终的决策需要基于实...
回答于 2023-08-11 19:31
报错信息提示可能需要尝试移除一些具有最大数量差异的家庭,并重新运行分析。出现初始化任何合理值失败的问题可能是因为输入的数据集存在问题,例如数据格式不正确、数据缺失或重复等。建议检查输入数据集的质量,并尝试解决任何可能的问题。
回答于 2023-08-11 19:29