R进行超几何分布计算

超几何分布的R实现

超几何分布是统计学中的一种离散分布,它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的个数。 也是生物信息学中常用的一种统计分布模型。我们在GO,KEGG的富集分析时就采用的是这个模型。 其数学表达式如下:
f(k;n,m,N)={{{m \choose k}{{N-m} \choose {n-k}}} \over {N \choose n}}.

其中:

N: 总样本数

m: 总样本中“特定类别”的数量

n: 从总样本中随机抽取的数量

k: 抽取样本中属于“特定类别”的数量

但是我们做统计模型时,统计不是分布概率,而是累积概率,所以计算的p_value 值计算公式为:

attachments-2018-07-BSXHYUoR5b5a7b7023dd5.jpg

对应的R代码实现为:

1-phyper(k-1,m, N-m, n,)



  • 发表于 2018-07-27 09:55
  • 阅读 ( 7600 )
  • 分类:转录组

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
microRNA
microRNA

115 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章