从TCGA上下载的数据,有些样本有重复,请问如何处理?随机选一个,还是合并呢?
这种情况是存在的,不过比较少。
遇到这种问题,需要看一下为什么会有重复,这个一般在样本信息中有体现,之后基于研究的目的,筛选研究情况对应的样本。
如果临床信息显示,完全一样,那就随机选一个或者合并取平均