我的转录组数据分析发现基因间区及内含子比例超过了30%,是不是很高,一般是多少?是什么原因造成这两类比例高?
首先要看你是什么物种,基因注释是否完整。排除了这种情况后我认为是正常的, 我在做玉米的时候,也发现好多序列比到了间区与内含子区域,应该可以用这些区域其实在转录组中是表达了的,但是并未被注释出来所解释。同时建议你使用 基因序列作为参考文件进行比对看看情况!
一般造成内含子及间区比例高有以下2个方面原因:1.基因组注释较差,大部分是这个原因,尤其非模式物种,刚测序物种等,2.有DNA污染,可结合RNA检测结果识别,一般较少出现。