可以提供参考数据库,如果没有参考数据库是根据缺失SNP周围的SNP结合LD情况推断的,具体可以参考beagle参考文献
回答于 1天前
看看你的过滤条件是不是太严格了,你适当放宽条件; 不同的数据测序深度,样本数量都不一样,灵活调整参数; 不知道你的过滤条件是啥,最好把你的数据基本情况介绍一下,使用的命令行贴一下好给你建议;
回答于 3天前
建议截图解释问题,不知道你是运行R命令,还是shell命令; 你这个文件在当前文件夹吗?检查一下: celltype.tsv 如果在,打开看一下内容是否正确
回答于 4天前
GSEA 富集分析是先对两组之间所有基因的表达差异程度(通常是差异比较的fold change)进行排序,之后再看通路里面的基因在排序上是否有富集,具体看看这里:https://www.omicsclass.com/article/230所以这里的 minGSSize和maxGSSize 是关心的信号通路等里面基因的数量限制,基因数量太少的和太多的信号通路等不纳入GSEA富集...
回答于 5天前
可以用vcftools提取想要的样本SNP数据,准备一个文本文件,一个样本名字一行:sample.txt vcftools --vcf input_file.vcf --keep sample.txt --recode --recode-INFO-all --out sub_SNP
回答于 5天前