数据下载,可根据TCGA网站的筛选条件添加GDCquery()参数,详情见:
老师的课程是讲的胆管癌,样本少,用老师的代码也没问题。但是自己实操中,遇到情况就有点复杂,不会用了。
我是要结肠癌和直肠癌,并且要腺癌的样本数据,有点复杂,这是我网页筛选条件,代码不知道怎么写。
看了论坛里老师筛选原发位点的帖子
我想先根据原发位点筛一下
> library(GenomicDataCommons)
> resp = cases() %>% filter(~ {project.project_id=="TCGA-COAD"|project.project_id=="TCGA-READ"}&{primary_site =="colon"|primary_site="rectum"}) %>% GenomicDataCommons::select(c(default_fields(cases()),'samples.sample_type')) %>% response_all()
报错了。。。。。Error: No method asJSON S3 class: formula
然后其实也不明白就是获得了sample_download,后边的代码怎么写,请老师看看是这样么?
GDCdownload(query = sample_download,files.per.chunk=6, method='client')
data <- GDCprepare(query=sample_download)
data_expr <- assay(data)
因为我最终需要的是结直肠癌腺癌基因表达数据。我也想过先结肠癌、直肠癌一个个下载下来,然后手动删掉不是腺癌的。可是老师的代码都是基于query,就是我手动整理好我也不知道后边代码怎么写。比如GDCprepare(?)
数据下载,可根据TCGA网站的筛选条件添加GDCquery()参数,详情见:
如果觉得我的回答对您有用,请随意打赏。你的支持将鼓励我继续创作!