这里面是好几个问题,我分别来回来一下: 1. GDC与TCGAbiolinks数据数量不一致: 暂时不回答,等查清楚了来回答 2. TCGAbiolinks 下载样本中癌旁和癌症样本数量少了2个: 说明这两个样本既不是癌症也不是癌旁,可能是其他类型的样本。TCGA中样品分类可以参考:https://www.omicsclass.com/question/48 文章 3. 数据下载...
回答于 2018-08-14 18:13
出现这种问题的原因是: 安装Aspera 时采用的是root 账户, 需要采用一个普通的用户才能安装。
回答于 2018-08-10 11:56
1. 建议采用30个样本一起分析,可以分析不同时期相关的聚类模块。 2. 你这10个不同的样品,没有重复,如果差异比较大的话,那可能聚类的就不太好。
回答于 2018-07-31 11:58
GFF文件格式来看,1. FAN_iscf00000040.1 这个是染色体(参考序列),而不是基因。 2. 基因的名称应该是 “ gene_id” 后面跟着的那个属性 3. 你这个不是一个基因的三个转录本,而就是3个基因
回答于 2018-07-31 11:54