TCGA临床数据中的TNM分期,如何转换成WGCNA分析中的性状数据

TCGA临床数据中的TNM分期,如何转换成WGCNA分析中的性状数据

WGCNA中的性状数据,主要可以分成两类:

1. 数量性状的数据

数量性状的数据,不需要改变,保持原有的值即可,比如年龄,复发时间等。

2. 分类数据

分类数据,需要进行one-hot 编码。也就是说分类数据只有0,1两种值,不同的分类转换成是与不是两种可能性。

举个例子,TNM分期,

假设T有3个分期分别为T1,T2,T3;

N有两个分期N1,N2;

M有3个分期M1,M2,M3。

总共有8个不同的分类,那么TNM一个分类,就变成了8个性状分类,出现的性状为1,没有的为0。

那么,T1N2M3 这样的临床分期该如何转换成WGCNA的临床数据呢?

转换成如下的格式:


TNMT1T2T3N1N2M1M2M3
T1N2M31000100

1


如果您想学习TCGA数据挖掘方法,可以学习我的课程:https://study.omicsclass.com/index


  • 发表于 2018-12-20 22:32
  • 阅读 ( 7619 )
  • 分类:TCGA

4 条评论

请先 登录 后评论
microRNA
microRNA

115 篇文章

作家榜 »

  1. omicsgene 700 文章
  2. 安生水 348 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 75 文章
  8. CORNERSTONE 72 文章