你的问题中存在歧义,一般说编码区指的是DNA或者RNA水平上的比如cds序列,既然都翻译成蛋白了就说明都是来自编码区。另外学会生信根据基因组序列文件和注释文件去提取各类型的序列非常简单,所以建议你去学习一下,只是提问我也没法给你演示,建议学一下这个课程:https://apphc8vuqty1843.h5.xiaoeknow.com/v1/goods/goods_detail/course_27PYaNRpuQie7tBCvNeQOlVFqsc 入门一下生信。