TCGA临床信息如何正确的保存格式

TCGA临床信息如何正确的保存格式, 避免错行,错列的情况

TCGA的临床数据,经过TCGAbiolinks 下载之后,需要保存到文件中,一般大家都希望保存的文件能够采用excel 打开。

但是临床数据中存在几个问题:

1. 一些值缺失,没有值填充

2, 一些字段中存在空格,逗号等

如果直接采用R中的 write.table进行读写,经常会存在数据错行,字段错列的情况,主要的原因是该函数默认采用tab格式 :“\t” 进行数据分割,而excel 无法区分 空格和tab。

这就需要采用一个临床信息中没有的分隔符,对数据进行分割 ,比如,采用星号(*)去分割。

# 将数据保存到文件
clinical_file <- paste0(DataDirectory, "_","clinical",".txt")
write.table(clinical, file = clinical_file, row.names = F, col.names=T,quote = T,sep='*',na = "NA")

之后打开excel 时,对数据进行分列,同样选用星号(*) 即可。

  • 发表于 2018-11-23 11:55
  • 阅读 ( 3286 )
  • 分类:TCGA

0 条评论

请先 登录 后评论
microRNA
microRNA

115 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 80 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章