WGCNA 表达量低的基因筛选

老师:

      您好!我先筛选fpkm小于0.5的基因(共53614,筛选后31361个基因),去做共表达网络,得到两个相关性较高的模块,模块1(基因数量20932   相关系数0.91,p值0.002),模块2(基因数量539   相关系数-0.89,p值0.003).。

         1、相关性高的模块基因数量占了三分之二,这个合理么?是不是低丰度的基因多,所以都关联到一起了?需要修改阈值吗?

     2、我看到文献里,大部分中文文献表达阈值都是选5,个别外文文献阈值0.05,这个阈值怎么确定呀?我的阈值是不是设置的有点低,应该设置1还是5?


望指教,谢谢!

请先 登录 后评论

1 个回答

Daitoue

进行基因的筛选,一般可以过滤低表达的方式,还有一种是筛选出变异大的数据(一般可以用方差等方法)

前者你可以根据需要进行筛选,没有明确的说法是限制多少。如果参与分析的基因过多,设高一点,少就低一点,鉴于你的基因数量确实挺大的,你可以设大一点

后者一般按照变化程度进行排序,选择前10000/20000或者前50%/75%等等,并可以要求每个方差大于多少之类的。方差、中位偏差值等等可以衡量变异程度的计算方法都可以。


以上,你只要找到一个合理的高分文献引用一下就可以了,没有审稿人怼你~~~

请先 登录 后评论