WGCNA的表型数据, 1. 如果是数量型的,那个比较好说,输入表的值即可 2. 如果是“分类”型的,那就需要进行分类编码: 一种类型的样品,标识为1,其他的标识为0 。如下表示例: Type1 Type2 Type3 Sample1-1 1 0 0 Sample1-2 1 0 0 Sample1-3 1 0 0 Sample2-1 0 1 0 Sample2-2 0...
回答于 2018-09-13 16:21
1. 生物学重复不太好的话,可以将该样本剔除。其实WGCNA的分析过程中也有异常样本的检测和剔除 2. 时间点可以做为表型。这样可以关联与时期相关的基因模块。
回答于 2018-09-12 18:40
稍微有点差别,影响不是很大1. 你也可以直接采用前面的结果,不用重新计算。 2. 需要说明的是,如果采用重新计算的话,power 值需要改成 前面优化的power值 ,而不是默认的6 .
回答于 2018-09-12 11:06
这种表示方法代表的意思是 3个miRNA 序列(miR-132, miR-212, miR-212-3p)具有共同的seed区域(2-8),他们可能具有共同的靶基因。 补充一点:miR-212, 这种表示方式,默认是代表miR-212-5p 。
回答于 2018-09-12 11:03
从您的描述来看,你是做了3个样本的转录组测序,采用的测序策略是双端测序(Pair End)。 所谓的双端测序,就是一个插入片段,分别从两头测。所以: 1. 两头测序的read1, read2 数量一样。 2. 由于read1, read2 的测序长度一致,所以应该数据量也是一样的 再回到你的3个问题,1. 样品的总reads: read1 + read2 2. ...
回答于 2018-09-12 10:54
1. 可以将二代组装的转录本和三代数据组装的转录本进行blast 比对,计算一个相似百分比,划一个标准,比如98% 相似性。 找到相互对应的转录本。2. 一般三代数据用于构建转录本,二代数据用于定量。也可以将两者合并成一套转录本。
回答于 2018-09-06 22:46
1. 这两幅图,其实有对应的数据,可以将数据提取出来,用ggplot2 单独去绘制,而不用其原生的绘图函数。
回答于 2018-09-06 22:25
1. 一般三代测序的数据,采用官方的isoseq 流程分析就可以了。该流程能将转录本进行一定的聚类和去冗余。 2. 当然,如果要对聚类出来的高质量转录本进行基因家族聚类(可以理解为多个转录本,来自同一个基因, 3. 如果是无参物种的话,可以采用Cogent 软件进行转录本的聚类。 4. 如果是基因组还不完整的物种,可以先将...
回答于 2018-09-06 22:20