cellphoneDB是目前使用较为广泛的细胞通讯分析软件,包含配体、受体及其相互作用的数据库,可以对细胞间的通讯分子进行全面、系统的分析,以及研究不同细胞类型之间的相互交流及通讯网络。
数据库链接:https://www.cellphonedb.org/ppi-resources
相同类型细胞合并聚类。根据一种细胞类型的受体表达和另一种细胞类型的配体表达得到这两种细胞类型之间的受体-配体相互作用关系。对于同种类型细胞内的每个基因,计算表达该基因的细胞百分比和表达均值。在统计分析中考虑具有最小表达均值的复合物。
将所有细胞的类型标签随机置换1000次,确定相互作用簇中每个簇中平均受体表达水平的均值以及配体表达水平的均值。两种细胞类型之间每个成对比较中的每个受体-配体对会产生空分布。
通过计算等于或高于实际平均值的均值的比例,我们获得了给定受体-配体复合物的细胞类型特异性可能性的P值。换言之,如果观测到的均值在前5%中,则交互作用P值为0.05。
我们根据受体配体对在细胞群中显著p值的总数进行排名。那些有效p值数量最少的p值最有可能具有生物学相关性。
cellphone主要包含四个部分method、plot、query和database,其中主要用到method及plot,query和database可通过网页进行搜索查询及下载。
------------------------------------------------------------------method----------------------------------------------------------------------
使用示例:
cellphonedb method statistical_analysis ../data/cellphoneDB/meta.tsv ../data/cellphoneDB/exp.tsv --counts-data hgnc_symbol
输入文件要求:
count文件,行是基因,列是细胞
meta文件,包含两列,第一列是细胞ID,第二列是细胞所属类别
重要参数说明:
--counts-data count文件中基因名类型,可选类型包含[ensembl | gene_name | hgnc_symbol]
--output-path 结果输出路径
--threads 线程数
输出结果:
deconvoluted.txt:基因在亚群中的平均表达量
mean.txt:每对受体-配体的平均表达量
pvalues.txt:每对受体-配体的p值
significant_means.txt:每对受体-配体显著性结果的平均表达量值
-------------------------------------------------------------------------plot----------------------------------------------------------------------
dotplot使用示例:
cellphonedb plot dot_plot --pvalues-path out/pvalues.txt --output-path plot --output-name dotplot.pdf
重要参数说明:
--pvalues-path 统计分析所出结果中的pvalue文件路径
--output-path 文件输出路径
--output-name 输出文件名称
输出结果(局部):
注:每一列是两个细胞亚群(如:B|DC T),每一行是一对受体配体名称(如:CD2_CD58),颜色代表两个亚群这两个基因的平均表达量高低,越红表示表达越高,气泡大小代表P值的-log10值,气泡越大,说明其越具显著性。
cellphonedb plot heatmap_plot ../data/cellphoneDB/meta.tsv --output-path plot
重要参数说明:
需输入meta文件路径,文件包含两列,第一列为细胞ID,第二列为细胞所属类别
--output-path 输出文件路径
输出结果:
count_network.txt 细胞间互作的network文件
两个pdf文件 count热图以及log转化后所绘制的热图
interaction_count.txt cluster内细胞与所属cluster之外的细胞互作对数
延伸阅读
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!