利用GEOquery包的getGEO()可以进行芯片相关数据的下载,不过,有人反映不少芯片的表达矩阵下载经常出错,可以通过手动下载的方式将矩阵文件下载到对应的工作路径中:
矩阵文件的基本命名格式:GSEXXXXX_series_matrix.txt.gz
为了避免手动整理,可以利用getGEO读取本地本地的矩阵文件,例如(以GSE66597为例):
workdir = "F:/GEO/20180605/download/GSE66597"
#设置工作路径
setwd(workdir)
gset = getGEO(filename="./GSE66597_series_matrix.txt.gz",AnnotGPL=TRUE,destdir=workdir)
可以读取对应的矩阵文件外,还可以将其相关的平台注释信息文件下载到对应的工作目录(保存目录设置成工作目录)。
完成本都读取之后可以按照常规方法进行数据的提取和整理。
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课:linux系统使用、perl入门到精通、perl语言高级、R语言入门、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析、GEO芯片数据挖掘、GEO芯片数据标准化、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他,二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!