生存分析主要需要两个数据: 1. 生存时间 2. 生存状态 这些信息在TCGA的病人临床信息中会有。 如果要研究因素对生存率的影响,比如年龄,性别,基因,lncRNA, miRNA 等,可以采用单因素或者多因素Cox 分析。
回答于 2018-07-04 13:31
生存分析主要是两个数据,一个是生存时间,另外一个是生存的状态。 如果需要研究不同因素对生存率的影响,比如单因素,多因素等,就需要这些因素相关的一些数据 。
回答于 2018-07-04 12:04
生存分析的方法可以分成3种类型: 1. 寿命表法: 主要研究不同时段内生存率的变化 2. 单因素Kaplan-Meier分析:主要研究单个因素对生存率的影响 3. 多因素的Cox分析: Cox能支持多个影响因素进行分析
回答于 2018-07-04 11:59
生存分析是对一个或多个非负随机变量进行统计推断,研究生存现象和响应时间数据及其统计规律的一门学科。 主要的研究内容包括: 1. 描述生存过程 根据样本生存资料估计总体生存率及其它有关指标 2. 比较生存过程 对不同处理组生存率进行比较分析 3. 影响生存时间的因素分析 了解影响生存过程的风险因素...
回答于 2018-07-04 11:54
转录因子预测的原理是基于序列相似性,如果基因的序列跟已知的转录因子越相似,则该基因就很可能是转录因子。 其中的关键是需要有一个已知的转录因子数据库。 1. 动物的转录因子数据库可以采用AnimalTFDB 2. 植物的转录因子数据库可以采用PlantTFDB
回答于 2018-07-04 11:48
要预测转录因子的结合位点,主要包括3步: 1. 首先鉴定一下是哪一类的转录因子,不同家族的转录因子其结合序列不一样 2. 通过数据库,查询转录因子的结合序列的特征谱,这个可以通过jaspar 这个网站来完成。 3. 基因转录因子结合序列的特征谱,在基因的启动子区域进行扫描,预测结合位点和序列
回答于 2018-07-04 11:43
TCGA目前公开的数据主要包括: 1. 基因结构变异: SNP, Indel ,CNV 2. 转录组数据:基因表达,miRNA表达 3. 表观遗传: 甲基化 4. 临床信息: 病例信息,样本信息,随访信息等 这些数据都可以从GDC上进行下载。 如果下载数据,可以参考我的两篇文章: 《TCGA数据下载》 《下载TCGA临床信息》
回答于 2018-07-04 11:36
GDC上有TCGA的公开的转录组数据可以下载, 但是转录组数据中其实包括了编码蛋白的基因,lncRNA, 假基因等不同的基因的表达量,可以基于lncRNA对应的基因ID,从中抽提表达量。 可以参考我的文章《从GTF中提取lncRNA的编号和名称》
回答于 2018-07-04 11:30