使用官方gdc-client软件下载TCGA数据

TCGA数据下载教程:使用官方gdc-client软件下载

要是有gdc-client软件下载数据,需要以下三步才能完成:


1、GDC筛选检索下载需要数据的Manifest文件

TCGA改版后,下载方式变得大为不同,数据都整合在GDC(Genomic Data Commons)的DATA PORTAL中,网址:https://portal.gdc.cancer.gov/

建议大家先从Exploration页面筛选数据再到Repository页面筛选,最后下载Manifest文件,这里以乳腺癌表达数据Manifest文件下载为例给大家说明:

attachments-2019-10-ueCQfTeq5db17352a78ea.png
1)Exploration:在页面右边勾选自己想要的数据,然后点击 view Files in Repository,跳转到Repository页面进一步筛选.

attachments-2019-10-pWQvE7O95db1746fcf402.png

2)Repository:在页面选项卡选择自己需要的数据,然后点击Manifest下载:


attachments-2019-10-xFLSlihk5db1759677f67.png

2、gdc-client软件安装和配置

1)下载软件地址:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool,根据自己的操作系统下载对应的版本,这里下载windows版本。


attachments-2019-10-LL97WdGw5db1713434f9a.png2)将下载的软件解压,并放在一个自己好找的目录,例如我放在D:\TCGA目录,并且把上面下载的Manifest文件也放在相同的文件夹:


attachments-2019-10-5E9GSYNc5db170d1e7bf9.png



3、使用gdc-client下载TCGA数据


1)方法,打开windows的dos窗口,并切换到刚才的目录:D:\TCGA


attachments-2019-10-E4A5Y9QU5db17a2150528.png

方法2,将gdc-client.exe 文件所在的目录添加到windows环境变量中,方便命令行调用:


这个软件加入环境变量,如果以后想在任何一个路径简单使用gdc-client这个命令,那就需要把这个软件的路径加到环境变量。就是在Path加入刚刚软件所在的路径即可”。具体操作如下:打开电脑控制面板->系统和安全->系统->高级系统设置->环境变量->Path->“加入你的gdc-client所在路径” ,然后应用保存。

attachments-2019-10-YYDOE7KA5db17af1e39fc.png

系统和安全

attachments-2019-10-zc3ICpxR5db17b2b84d84.png系统

attachments-2019-10-IYHzIgRq5db17b37a30ad.png高级系统设置
attachments-2019-10-VWajIKKR5db17b48f1237.png

环境变量  编辑Path

attachments-2019-10-BL0gRpMu5db17b5ba9106.png

Path添加:

attachments-2019-10-x6cRDKIw5db2574240911.png

由于gdc-client软件只能帮我们下载数据,数据的整理合并筛选等需要我们手动完成(借助perl或者python整理)。如果有R语言基础,这里推荐大家使用TCGAbiolinks下载整理数据:  https://www.omicsclass.com/article/1060


更多生物信息课程:

1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程基因家族文献思路解读

2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读转录组(无参)结果解读

3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析

4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘转录组文献解读

5. 微生物16S/ITS/18S分析原理及结果解读OTU网络图绘制cytoscape与网络图绘制课程

6. 生物信息入门到精通必修基础课:linux系统使用biolinux搭建生物信息分析环境linux命令处理生物大数据perl入门到精通perl语言高级R语言画图R语言快速入门与提高python语言入门到精通

7. 医学相关数据挖掘课程,不用做实验也能发文章:TCGA-差异基因分析GEO芯片数据挖掘 GEO芯片数据不同平台标准化 、GSEA富集分析课程TCGA临床数据生存分析TCGA-转录因子分析TCGA-ceRNA调控网络分析

8.其他,二代测序转录组数据自主分析NCBI数据上传二代fastq测序数据解读

9.全部课程可点击:组学大讲堂视频课程

  • 发表于 2019-10-24 17:38
  • 阅读 ( 6524 )
  • 分类:TCGA

0 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

702 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 351 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. rzx 78 文章
  7. 红橙子 78 文章
  8. CORNERSTONE 72 文章