tcga_gene_exp_download.r TCGA数据下载脚本使用说明。

tcga_gene_exp_download.r 脚本帮助

使用方法:

usage: tcga_gene_exp_download.r [-h] -p project [-f files.per.chunk]
                                [-o outdir]
TCGA 基因表达数据下载及临床数据下载与整理,详细帮助见:https://www.omicsclass.com/article/1485
optional arguments:
  -h, --help            show this help message and exit
  -p project, --project project
                        input project ID of TCGA, for example TCGA-STAD,more
                        project ID:https://www.omicsclass.com/article/1061
                        [required]
  -f files.per.chunk, --files.per.chunk files.per.chunk
                        This will make the API method only download n
                        (files.per.chunk) files at a time. This may reduce the
                        download problems when the data size is too large
                        [default 10]
  -o outdir, --outdir outdir
                        output file directory [default cwd]

说明:

下载使用的R包为:TCGAbiolinks    长链非编码基因数据:gencodev22: https://gdc.cancer.gov/about-data/gdc-data-processing/gdc-reference-files

https://www.gencodegenes.org/human/release_22.html  

使用命令示例:

Rscript tcga_gene_exp_download.r -p TCGA-STAD

结果展示:

  1. 临床数据
  2. 基因表达数据Counts
  3. 基因表达数据TPM
  4. 基因表达数据FPKM

注意:基因表达文件中的基因ID已经替换成gene symbol,重复的gene symbol 随机取一个作为代表;

attachments-2021-06-VmUFGn6B60c2d9e2164ec.png

样本信息文件:

attachments-2021-06-xvnZSXRL60c2da48aa1c0.png

基因ID对应信息文件:

attachments-2021-06-6WeWZCzh60c2da649f8b6.png


  • 发表于 2021-06-11 11:28
  • 阅读 ( 2547 )
  • 分类:TCGA

3 条评论

请先 登录 后评论
omicsgene
omicsgene

生物信息

698 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章