你可以指出具体的基因。看多序列比对截图不完整看不出来那里有问题。 比对结果WRKY_hmmerOut_final.txt中第16、17列大都是 1-59 完整结构域。不会出现锌指结构不全的情况。结构里没有可能就是保守性太低。 结构域缺失较多的基因,CDD数据库中却显示有结构。可以看具体比对上的区域序列有没有锌指结构。
回答于 2024-08-28 16:23
如果想改变最终结构域序列文件中序列长度区域,可以手动修改WRKY_hmmerOut_final.txt文件中的第18、19列,也就是结构域的起始、终止位置。注意文件备份。 如果在多序列比对时发现结构域保守性低,并且结构域序列位置提取正确的话,可能是正常的
回答于 2024-08-28 11:21
在CD-search数据库中,比对上的区域第一条是输入蛋白序列,第二条是数据库里相关基因家族结构域。 比对上的区域就是输入序列的结构域区域。 主要看是不是比对上完整的基因家族结构域,如果感觉比对上的区域序列相似性太低,可以参考其他文献的筛选标准。一般来说只要比对上完整的结构域就可以保留
回答于 2024-08-27 17:46
还是要确保在第一步 基因家族初次鉴定 以及 在线数据库中二次确认时 基因家族结构域 的存在。对于结构域残缺的基因可以考虑删减。 也可以多看一些相关基因家族文献,看一下文献中该基因家族结构域的保守程度。
回答于 2024-08-26 16:50
结果文件genome.len中有两列,一列是输入序列文件的序列ID,一列是输入文件的序列长度。 你输入的序列文件中序列ID就是CAJGY开头的ID。代码运行的没有问题。 如果想要修改染色体ID,可以在最终配置文件 map_to_chr.txt中手动修改或者结果图中手动修改。注意修改之后保持整个分析中染色体ID一致
回答于 2024-08-26 12:35
可以在保留蛋白编码基因这一步时将--attribute biotype选项中biotype改成gbkey;--value protein_coding选项中protein_coding改成mRNA。尝试一下对原始gff文件过滤。你现在应该是没有完成过滤,protein_coding.gff3文件中还有非编码蛋白 不过这不影响后续分析。可以直接进行后续分析
回答于 2024-08-22 13:21
相似度更高,结果更好的。不过具体可以看一下模板序列和自己序列比对上的区域。另外PSIblast也可以调大-max_target_seqs参数看有没有比对上你想要的模板
回答于 2024-07-26 11:24