在GEO分析中遇见的问题

老师您好,我按照GEO芯片数据挖掘课堂上所讲的内容,下载了水稻的GES = "GSE27856",GPL = "GPL2025")进行分析,按照课程所给的R语言代码进行(除了改动GES号和GPL号);按照代码生成基因表达数据后(GSE27856expressionMatrix.csv)遇见了一个问题:表达数据(GSE27856expressionMatrix.csv)与课程中生成的人类的数据(GSE66597expressionMatrix.csv)相差很大。人类的基因表达结果一般只有个位数,而水稻基因表达有的高达上千位数(请看图)!(特别说明:所有操作都是按照源代码进行分析)。这种结果影响了后面作图分析,我不知道原因所在,以及怎么解决,敬请指教!

attachments-2020-02-mfDo9u6O5e36fad628327.png

attachments-2020-02-bVRNr0Ns5e36fae13fcc3.png

请先 登录 后评论

1 个回答

omicsgene - 生物信息
擅长:重测序,遗传进化,转录组,GWAS

你这个GSE编号对应的数据没有经过标准化所以数值较大,建议下载原始数据自行标准化后再进行后续分析:

参考课程: GEO芯片数据不同平台标准化

请先 登录 后评论
  • 1 关注
  • 0 收藏,2860 浏览
  • 提出于 2020-02-03 00:43