trimAL | 多序列比对中剪切掉不保守部分的参数

在生信分析时,经常会做一下蛋白多序列比对。对于比对结果中,一些不保守的列,我们可以选择剪切掉。再进行之后的分析,比如构建进化树,进化树的构建会容易很多。 剪切序列时有一个非常好用的...
在生信分析时,经常会做一下蛋白多序列比对。对于比对结果中,一些不保守的列,我们可以选择剪切掉。再进行之后的分析,比如构建进化树,进化树的构建会容易很多。

剪切序列时有一个非常好用的软件是trimAL: http://trimal.cgenomics.org/

其中有三个参数可以用来帮助我们剪切序列:

-gt 0.8 |如果某一列gap缺失率大于20%,就删除这一列

-st 0.001 |如果某一列相似性值低于0.001,就删除这一列

-cons 80 |剪切结果序列长度最低不能低于原序列长度的80%

trimal -in aligned.fa -out aligned_trimed.fa -gt 0.8 -st 0.001 -cons 80

有了这三个参数,就可以对比对结果中一些不保守的列进行剪切/删除。只保留保守的序列部分。

除此之外还有一些自动剪切模式的选择,比如:

-gappyout |根据在整个比对序列中gap的百分比数目来自动剪切

-strict |根据相似性分布来自动剪切

-automated1 |从"gap"和"strict"模式中选择最优的自动剪切模式

trimal -in aligned.fa -out aligned_trimed.fa -gappyout
trimal -in aligned.fa -out aligned_trimed.fa -automated1



  • 发表于 2023-12-13 10:51
  • 阅读 ( 4016 )
  • 分类:软件工具

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
rzx
rzx

74 篇文章

作家榜 »

  1. omicsgene 698 文章
  2. 安生水 347 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 74 文章
  8. CORNERSTONE 72 文章