最近GDC网站的API接口不太稳定,导致TCGAbiolinks 软件包无法和服务器链接,下载不了数据。遇到这种情况,只能采用GDC Data Transfer Tool(gdc-client) 下载数据了。下载方法可以参考如下:
1. 安装gdc-client 软件
该软件支持在Windows, Linux, Mac OS 等不同操作系统上运行,下载下来,安装既可以使用,非常的方便,下载链接 https://gdc.cancer.gov/access-data/gdc-data-transfer-tool
2. GDC网站筛选下载的数据
通过GDC 网站上筛选需要下载的数据,形成Manifest文件,将该文件下载下来。这个文件只是记录需要下载文件的名称,需要采用GDC Data Transfer Tool 才能下载到对应的数据。
3. gdc-client下载数据实例
下载操作也非常的简单,只需要运行下面的命令即可。gdc_manifest.2018-06-22.txt 换成你自己的manifest 文件
gdc-client download -m gdc_manifest.2018-06-22.txt
4. 数据整合
数据整合需要自己写一些脚本去整合了。
如果你对TCGA数据挖掘有兴趣的话,可以学习我们的TCGA相关课程。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!