预测miRNA前体

1. 寻找前体:将reads比对到参考基因组上。得到fa文件:对输入reads信息重新整理(将不同样本的reads重新整合到一起);arf文件:比对结果。如果想增加比对结果,可以增加参数-q(比对错配数为1...

1. 寻找前体:将reads比对到参考基因组上。得到fa文件:对输入reads信息重新整理(将不同样本的reads重新整合到一起);arf文件:比对结果。如果想增加比对结果,可以增加参数-q(比对错配数为1),脚本默认错配数为0

perl mapper.pl mapper.cfg -r 15  -c -j -l 18 -m -o 4 -v -n  -d -p dsRNAseq -s Total_reads_collapsed.fa -t Total_reads_collapsed_vs_genome.arf

1.1 对测序得到的reads进行物种miRNA定量。输入文件必需包括三份: 含有microRNA前体序列的fasta文件(来源于miRBase),含有成熟microRNA序列的fasta文件(miRBase), 我们自己测序得到的microRNA文件

perl quantifier.pl -p Rhi_hairpin.fa -m Rhi_mature.fa  -r Total_reads_collapsed.fa -y now -g 2 -W -T 10 -d -P

#结果文件miRNAs_expressed_all_samples_time.csv

#norm是CPM,seq是count,同一个miRNA可能来源于不同的precursor

#miRNA  read_count      precursor       total   seq     seq(norm)

1.2 输出结果

perl make_html2.pl -q expression_analyses/miRBase.mrd -k Rhi_mature.fa -y 24_10_2023_t_11_41_33 \
-d -o -i expression_analyses/Rhi_mature_mapped.arf  -l  -M miRNAs_expressed_all_samples_24_10_2023_t_11_41_33.csv \
-P -W expression_analyses/read_occ

2. 根据reads和基因组比对的结果,预测novel miRNA

perl miRDeep2.pl Total_reads_collapsed.fa dsRNAseq.fa Total_reads_collapsed_vs_genome.arf \
Rhi_mature.fa none Rhi_hairpin.fa -d  -g 100000 -l 500  -m 11 -v -P -n d

2.2 首先就是mapping结果进行过滤,只保留能够完全精确比对上基因组, 而且长度在18到25bp的reads, 同时去除在基因组的hit超过5个的reads,代码如下:

parse_mappings.pl Total_reads_collapsed_vs_genome.arf -a 2 -b 18 -c 35 -i 15 > Total_reads_collapsed_vs_genome.arf_parsed.arf

#-a 错配数

2.3 过滤之后的比对结果,用于预测miRNA前体序列,代码如下

excise_precursors_iterative_final.pl /share/nas1/renzx/project/zx-20230710-118_miRNA_zhenjun/ \
dsRNA/rawdata.miRNA_Prediction_ref/index/dsRNAseq.fa Total_reads_collapsed_vs_genome.arf_parsed.arf \
precursors.fa precursors.coords 100000 500

2.4 将reads与预测出的miRNA前体序列进行比对,代码如下

/share/work/pipline/sRNA/bin/mirdeep_plant/prepare_signature.pl /share/nas1/renzx/project/zx-20230710-118_miRNA_zhenjun/ \
dsRNA/rawdata.miRNA_Prediction_ref/ann/4.miRNA_Prediction.bak/Total_reads_collapsed.fa precursors.fa 2 \
-a Rhi_mature -o signature.arf 2>>error_24_10_2023_t_11_41_33.log   

2.5 RNAfold预测miRNA前体的二级结构,代码如下

RNAfold < precursors.fa -noPS > precursors.str

2.6 #computing randfold p-values 计算RanFold P值 过滤:

/share/work/pipline/sRNA/bin/mirdeep_plant/select_for_randfold.pl signature.arf precursors.str > precursors_for_randfold.ids                                                  
/share/work/pipline/sRNA/bin/mirdeep_plant/fastaselect.pl precursors.fa precursors_for_randfold.ids > precursors_for_randfold.fa                                              
randfold -s precursors_for_randfold.fa 99 > precursors_for_randfold.rand

2.7 running miRDeep core algorithm 运行miRDeep核心算法(空)-t

/share/work/pipline/sRNA/bin/mirdeep_plant/miRDeep2_core_algorithm.pl signature.arf precursors.str \
-v -50 -n d -l 12 -y precursors_for_randfold.rand -t > output.mrd             
  • 发表于 2023-11-01 15:25
  • 阅读 ( 980 )
  • 分类:smallRNA

你可能感兴趣的文章

0 条评论

请先 登录 后评论
rzx
rzx

78 篇文章

作家榜 »

  1. omicsgene 702 文章
  2. 安生水 350 文章
  3. Daitoue 167 文章
  4. 生物女学霸 120 文章
  5. xun 82 文章
  6. rzx 78 文章
  7. 红橙子 78 文章
  8. CORNERSTONE 72 文章