WGCNA中的性状数据,主要可以分成两类:
1. 数量性状的数据
数量性状的数据,不需要改变,保持原有的值即可,比如年龄,复发时间等。
2. 分类数据
分类数据,需要进行one-hot 编码。也就是说分类数据只有0,1两种值,不同的分类转换成是与不是两种可能性。
举个例子,TNM分期,
假设T有3个分期分别为T1,T2,T3;
N有两个分期N1,N2;
M有3个分期M1,M2,M3。
总共有8个不同的分类,那么TNM一个分类,就变成了8个性状分类,出现的性状为1,没有的为0。
那么,T1N2M3 这样的临床分期该如何转换成WGCNA的临床数据呢?
转换成如下的格式:
TNM | T1 | T2 | T3 | N1 | N2 | M1 | M2 | M3 |
T1N2M3 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 |
如果您想学习TCGA数据挖掘方法,可以学习我的课程:https://study.omicsclass.com/index
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!