1天前 发表了文章
1天前 回答问题
处理大文件时,Seqtk 可能会占用大量内存,导致系统资源不足或程序崩溃,根据具体需求,调整 Seqtk 的参数以减少内存使用。例如,使用 -C 参数折叠长行
2025-02-13 17:36 发表了文章
2025-01-23 17:58 回答问题
下图的结果是基因集构建的另外一个结果,基因集构建会出来两个结果,其中final.last.gene.pair.txt是符合泛基因家族需求的结果
2025-01-13 11:06 回答问题
dadi生成sfs频谱文件的时候参数要修改成自己的群体投射值,参考easySFS的使用 - 组学大讲堂问答社区 (omicsclass.com),课程里也讲了。模型不对说明前面的python那一步需要调整 -m 后面的参数,指定其他模式。
2025-01-10 17:10 发表了文章
2025-01-03 15:53 回答问题
建议附上合并之后的vcf截图,需要info列的截图和后面的基因型截图。 sv的vcf其“存在与否”信息在info列,可以根据info列自行进行基因型的转换,变成正常0/0 1/1这种基因型之后进行后续分析。
2025-01-03 15:40 回答问题
ONT进行组装前建议矫正。11.smartdenovo.sh中完成组装之后,和近缘物种的线粒体序列进行blast,选择比对次数较多的contig进行后续分析。
2024-12-23 11:25 回答问题
进行自比对去除冗余、blast去除细胞器的组装,如果大小还是没到预期标准可以采用purge_dups进行过滤:GitHub - dfguan/purge_dups: haplotypic duplication identification tool 不太清楚两个单倍型差异如何。如果两个单倍型差异较大,你直接用hifi组装的话会导致基因组偏大。
2024-12-18 11:05 回答问题
同一套数据不同软件组装结果也会有差异,不同数据本身也存在差异。如果ont数据是采用nextdenovo组装的,可以试着用 hifiasm再组一次。hifi数据普遍会比ont数据更碎一些,在去除冗余、细胞器基因组之后差距会缩小一点。