叶绿体/线粒体散在重复序列注释——REPuter

REPuter可注释叶绿体重复序列,包括4种类型,Forward(F), Reverse (R), Complement (C), Palindromic (P)。 REPuter 是可在线注释, 详情可参考文献  REPuter: the manifold applications of...

REPuter可注释细胞器如线粒体或叶绿体的散在重复序列(Dispersed repeat),包括4种类型,正向 Forward(F),反向 Reverse (R),互补 Complement (C),回文Palindromic (P)。

REPuter 是在线注释的网站, 详情可参考文献  REPuter: the manifold applications of repeat analysis on a genomic scale


一、操作

REPuter网站 https://bibiserv.cebitec.uni-bielefeld.de/reputer


1.进入网站后,点击Submission,之后上传自己的序列(fasta文件),上传成功之后点击next

attachments-2023-10-7DOxjYt565264c9d42b6e.png


attachments-2023-10-DzS0pk3r65264a6889426.png


attachments-2023-10-0Vovo8hB65264ab15c94f.png


2.根据需要选择不同类型的重复序列,注意把“Edit distance” 和 “Hamming distance” 的参数清空,不然后续容易出错,然后点击Next

attachments-2023-10-UDV2fuvj65264b1542a59.png


3.选择自己需要的格式,建议选第一个,点击start calculation即可


attachments-2023-10-pDqvTqJ465264d092fb71.png


二、结果文件


以下即为计算完成的界面,点击open interactive viewer,交互式打开,可以看到不同的散在重复类型,点击save as 保存结果

attachments-2023-10-CUS5oWXW65264d4b4df04.png


attachments-2023-10-hNNAILUL65264e05548a5.png


保存的结果如下

attachments-2023-10-nPFTM3cK65264e75e51d9.png

第一行  354466: 序列长度, 后面的0,45 分别为maximum allowed distance, minimum repeat size


下面每一列的分别为:

  1. 重复第一部分序列长度
  2. 重复第一部分起始位置
  3. 重复类型
  4. 重复第二部分序列长度
  5. 重复第二部分起始位置
  6. 重复距离
  7. E-value


注意:要自己整理结果文件,用 序列长度+起始位置 得到片段的终止位置


参考:https://www.jianshu.com/p/f94ba9df9c3e


  • 发表于 2023-10-11 15:30
  • 阅读 ( 3686 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
星莓
星莓

生物信息工程师

58 篇文章

作家榜 »

  1. omicsgene 700 文章
  2. 安生水 348 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. 红橙子 78 文章
  7. rzx 75 文章
  8. CORNERSTONE 72 文章