5 如何查找某一种功能基因,比如所有的热激蛋白基因,并确定基因数目?

刚刚开始分析我的转录组数据,菜鸟一枚。我用hsp和heat shock protein这两个词搜索过我的注释的差异基因数据,得到了一些热激蛋白基因。但是许多gene-id都注释为同一个基因名称,而且gene-id比对到同一个NR ID,那请问在分析转录组数据中这算是一个基因吗?如图中画圈部分所示。谢谢!attachments-2018-11-dSciIvIJ5bf7778c5f3bf.jpg


请先 登录 后评论

3 个回答

microRNA

1. NR 那一列的ID都一样,说明你的那些基因的序列都跟该基因序列相似

2. 序列相似,不一定来自同一个基因,一个物种中存在很多同源基因。看你的基因的id,好像是无参组装的结果,你可以去掉低表达的转录本, 再将这些转录本按照一定的相似度进行聚类,聚成一类,算是一个基因。

请先 登录 后评论
SMILE

对的,我的是无参的。我想问一下,在分析整理这种转录组数据的时候,有许多发表的文章中写到测序获得了多少的热激蛋白基因,列出了其中hsp70、90等各种基因的数量。这里的基因,是转录本吗?还是进一步分析得来的一个基因?一般怎么样分析得到了多少的基因?如下图attachments-2018-11-BLDitdPd5bf79f427ad40.jpg

attachments-2018-11-6hQIjoiC5bf79f5be4e7c.jpg

请先 登录 后评论
omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

简单的方法,是查看你研究物种别人鉴定HSP基因家族的文章,例如:https://www.omicsclass.com/article/84,里面有详细基因的描述。

或者自己利用基因家族分析的方法鉴定HSP基因:基因家族分析实操课程基因家族文献思路解读


请先 登录 后评论