1天前 回答问题
进行自比对去除冗余、blast去除细胞器的组装,如果大小还是没到预期标准可以采用purge_dups进行过滤:GitHub - dfguan/purge_dups: haplotypic duplication identification tool 不太清楚两个单倍型差异如何。如果两个单倍型差异较大,你直接用hifi组装的话会导致基因组偏大。
6天前 回答问题
同一套数据不同软件组装结果也会有差异,不同数据本身也存在差异。如果ont数据是采用nextdenovo组装的,可以试着用 hifiasm再组一次。hifi数据普遍会比ont数据更碎一些,在去除冗余、细胞器基因组之后差距会缩小一点。
6天前 回答问题
图2前面都有“#”说明是gff的注释行,显示的内容是你这个gff的contig名称,空格键往下翻就能看到gff的文本内容。你用的这个水稻的gff应该不是我们提供的,我们提供的水稻gff是这样的:
2024-12-13 18:00 回答问题
HiC测序的酶可能和示例数据不一样,建议检查前面的文件是否为空
2024-12-13 17:53 回答问题
这里我只能做一点小建议,感觉调整意义不是很大,可以选择调整前的
2024-12-13 16:00 回答问题
首先主要需要关注的结果是merqury_out.qv这个文件,我看你的一致性都很高,说明组装得蛮好的。 其次你提问的这个文件里面第二列表示的是“基因组中特有的kmer”,这个数目是0说明染色体所有的kmer都可以在测序数据里面找到,也是表示这个染色体组装一致性高的意思。
2024-12-06 17:26 回答问题
调整-m -q,这两个参数过大会导致有比对片段未被计算。从图形上两个单倍型8、9号的染色体比对没有问题
2024-12-03 14:56 发表了文章
2024-11-28 11:06 回答问题
高杂合基因组没有提及,只说了高度重复的话需要用ALLHIC的 prune这一步 nextdenevo数据矫正结果在 输出文件夹/02.cns_align/01.seed_cns.sh.work/seed_cns*/cns.fasta
2024-11-25 15:22 发表了文章