在对基因组进行评估的时候,LAI是连贯性完整性的指标之一。目前经常使用的计算 LAI 的软件是 LTR_retriever,他并非是一个单一的工具,而是通过整合多个LTR预测软件的结果,过滤其中的假阳性LTR-RT,得到高质量的LTR-RT库,因此需要配合LTRharvest, LTR_FINDER, MGEScan 3.0.0等软件使用。其中LTRharvest软件运行耗时很长,而用LTR_HARVEST_parallel则可以大大缩短时间。
LTRharvest是genometools下的一个功能,因此需要下载genometools
wget https://github.com/genometools/genometools/archive/refs/tags/v1.6.5.tar.gz
tar zxvf v1.6.5.tar.gz
cd genometools-1.6.5
make -j4
# make -j4 install prefix=~/gt
使用之前需要用suffixerator 进行库构建
genometools-1.6.5/bin/gt suffixerator -db 基因组 -indexname 前缀 -tis -suf -lcp -des -ssp -sds -dna
genometools-1.6.5/bin/gt ltrharvest -index 基因组 \
-minlenltr 100 -maxlenltr 7000 -mindistltr 1000 -maxdistltr 15000 \
-mintsd 4 -maxtsd 20 -motif TGCA -motifmis 1 \
-similar 85 -vic 60 -seed 20 -seqids yes > ref.fa.harvest.scn
git clone https://github.com/wild-joker/LTR_HARVEST_parallel
LTR_HARVEST_parallel/LTR_HARVEST_parallel -seq 基因组 -threads 线程 -gt GenomeTools所在位置
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!