出现了下面这个警告,说我的文件中含有蛋白序列可是我的文件是使用run_pipeline.pl将vcf.gz文件转换为.phy文件的,里面是应该只包含蛋白序列的
我疑惑的是一个样本在某一个确定的位置上它的碱基应该是确定的一种,为什么会出现简并碱基这种代表多个可能碱基的情况呢?还有就是iqtree不支持简并碱基吗,为什么输入的文件是含有简并碱基的DNA序列,却会被识别为蛋白序列呢?这个警告会影响后续的分析吗?是忽略这个警告还是对文件做一些修改?
另外还有应该问题就是下面这些Composition处的failed是怎么回事?为什么全都是failed,是我的文件有问题吗?是忽略这个问题还是处理一下我的文件重新分析?
后面还出现了这样应该提示,
这是需要我做一些修改吗?
请老师帮忙解答一下