PASA运行的时候调用到Transdecoder这一步产生的报错,你需要确保输入进去的evm.gff3文件位置信息(phase)是正确的。检查一下这个gene:evm.Tu.chr01.1319 的cds是不是位置上有问题
回答于 5天前
看一下比对的日志文件里面有没有报错说”将氨基酸序列(pep)转换为核酸序列(nuc)时发现了不一致性“,如果有的话,你找到对应基因ID的cds和蛋白序列检查他们之间是不是3倍关系。如果数量不多,可以把这样的基因对删除。 需要paraAT比对的log文件报错信息进一步确认。
回答于 2024-11-01 16:34
换成这个指令,先生成sam再排序:hisat2 --dta --new-summary -p $threads -x $contig -1 $fq1 -2 $fq2 > rnaseq.sam 2>hisat2.log && samtools sort -@ 10 rnaseq.sam > rnaseq.bam
回答于 2024-09-27 16:38
MCscanX没有结果的话正常是无法用circos绘图,你可以尝试用blast的结果整理成circos所需的共线性文本格式
回答于 2024-09-19 17:52
为了维持统计表格的一致性,还是建议再跑一次RepeatMasker。也可以手动统计,如果你有足够的linux基础,可以手动统计每个MITE类型的序列数目、序列总长度、在基因组的占比等,再手动写到表格里。但是你的gff也需要重新整理MITE信息。 可以参考后面一步RepeatMasker汇总重复信息再跑一次信息统计,命令如下: RepeatMasker...
回答于 2024-09-13 11:05
我们的示例数据输出文件里面该文件内容如下: 建议check一下你的*_blast_results.txt是否正常,如果为空 检查 ${SPROT} 变量是否赋值
回答于 2024-09-11 10:14
文件contig.fa.divsum是calcDivergenceFromAlign.pl生成的,不是repeatmasker的结果
回答于 2024-09-11 10:03