这个需要了解一下TCGA的样品barcode编码方式:
如果是临床信息的话,记录的是每一个病例的临床信息,也就是说,其barcode长度为前12位。
如果是基因表达文件的话,记录的是每一个病例的不同组织样品的基因表达情况,其barcode为15位。
所以只需要将基因表达文件中的barcode 提取前12位,就可以得到病例的编号。
这个需要了解一下TCGA的样品barcode编码方式:
如果是临床信息的话,记录的是每一个病例的临床信息,也就是说,其barcode长度为前12位。
如果是基因表达文件的话,记录的是每一个病例的不同组织样品的基因表达情况,其barcode为15位。
所以只需要将基因表达文件中的barcode 提取前12位,就可以得到病例的编号。