什么是WGCNA分析?
WGCNA分析的全称是加权基因共表达网络分析(Weighted correlation network analysis),是用来描述不同样品之间基因关联模式的生物信息学分析方法。可将表达模式相似的基因进行聚类,并分析模块与特定性状或表型之间的关联关系。
WGCNA分析的基础知识点
1、WGCNA分析的适用范围?
目前该分析方法在抗病胁迫以及其他性状与基因关联分析等方面的研究中被广泛应用,主要应用于转录表达方面的研究,如转录组测序、蛋白质组测序等。
2、WGCNA分析对样本数量的要求?
一般来说需要至少15个样品以上,这个是包含了生物学重复的(如5个点,各3个重复)。当然,样品数量越多,结果会越准确。
3、不同批次的测序数据可以放在一起进行WGCNA分析么?
理论上是可以的,但是一般不建议放在一块分析。这是由于测序存在批次效应,不同批次的测序结果会存在一些差异,这会给分析带来一定的误差。
4、同一批测序,相同的材料不同的处理,比如盐处理和干旱处理的数据可以放在一块进行WGCNA分析么?
答案是可以的。通过WGCNA分析可以找出不同处理间的共同表达模式和关键的基因。
5、什么是hub gene?
通过WGCNA分析可以构建一个调控网络,而位于调控网络中心的基因被称为核心基因,即hub gene,这类基因通常是关键的调控基因,是值得我们深入挖掘和分析的对象。
6、进行WGCNA分析时,使用差异基因还是所有有表达的基因?
具体问题具体分析,不同的分析目的需要选用不同的基因集来进行分析。在分析的过程中,需要根据情况对所使用的基因集进行过滤,以达到分析目的。
7、modules数量多少时结果较为理想?
这一点没有特定要求,我们可以通过树的分支是否清晰来评价结果的好坏。modules的数量是由样品本身的情况决定的。
8、选择几个表型来进行分析最好?
理论上表型数据越多结果越好,但是不同的实验设计也有不同的分析要求。有时候一个表型的结果也会很漂亮。
9、生物学重复间的3个样本是当成一个样本来分析,还是当做3个独立的样本来分析?
做WGCNA分析时,每个样品都是独立的,3个重复就要按照3个重复来进行分析。
10、进行WGCNA分析时,怎么对所选用的基因进行过滤?
一般来说,我们会把表达量较低,且在各个样本中变化不大的基因过滤掉。
以上即是小编整理想一些WGCNA分析的基础知识点。如果您需要了解更多分析方面的知识,您可以到我们组学大讲堂的问答社区(www.omicsclass.com.cn)进行搜索。
如果您想学习WGCNA分析的具体操作,可以点以下链接进行学习。
链接:https://study.163.com/course/introduction/1005023004.htm?share=1&shareId=1031484705
更多生物信息课程:
1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家族文献思路解读
2. 转录组数据理解不深入?图表看不懂?点击链接学习深入解读数据结果文件,学习链接:转录组(有参)结果解读;转录组(无参)结果解读
3. 转录组数据深入挖掘技能-WGCNA,提升你的文章档次,学习链接:WGCNA-加权基因共表达网络分析
4. 转录组数据怎么挖掘?学习链接:转录组标准分析后的数据挖掘、转录组文献解读
5. 微生物16S/ITS/18S分析原理及结果解读、OTU网络图绘制、cytoscape与网络图绘制课程
6. 生物信息入门到精通必修基础课,学习链接:linux系统使用、perl入门到精通、perl语言高级、R语言画图
7. 医学相关数据挖掘课程,不用做实验也能发文章,学习链接:TCGA-差异基因分析、GEO芯片数据挖掘、GSEA富集分析课程、TCGA临床数据生存分析、TCGA-转录因子分析、TCGA-ceRNA调控网络分析
8.其他课程链接:二代测序转录组数据自主分析、NCBI数据上传、二代测序数据解读。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!