TCGA基因表达文件中样本名称和临床资料中的样本名称不一样,如何对应?

基因表达文件中样品名称的格式是“TCGA-QH-A86X-01

临床资料中样本名称格式是:“TCGA-MP-A4TD

请先 登录 后评论

1 个回答

microRNA

这个需要了解一下TCGA的样品barcode编码方式
Reading Barcodes
如果是临床信息的话,记录的是每一个病例的临床信息,也就是说,其barcode长度为前12位。

如果是基因表达文件的话,记录的是每一个病例的不同组织样品的基因表达情况,其barcode为15位。 
所以只需要将基因表达文件中的barcode 提取前12位,就可以得到病例的编号。


请先 登录 后评论