TCGA的临床数据,经过TCGAbiolinks 下载之后,需要保存到文件中,一般大家都希望保存的文件能够采用excel 打开。
但是临床数据中存在几个问题:
1. 一些值缺失,没有值填充
2, 一些字段中存在空格,逗号等
如果直接采用R中的 write.table进行读写,经常会存在数据错行,字段错列的情况,主要的原因是该函数默认采用tab格式 :“\t” 进行数据分割,而excel 无法区分 空格和tab。
这就需要采用一个临床信息中没有的分隔符,对数据进行分割 ,比如,采用星号(*)去分割。
# 将数据保存到文件 clinical_file <- paste0(DataDirectory, "_","clinical",".txt") write.table(clinical, file = clinical_file, row.names = F, col.names=T,quote = T,sep='*',na = "NA")
之后打开excel 时,对数据进行分列,同样选用星号(*) 即可。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!