预测miRNA前体

1. 寻找前体：将reads比对到参考基因组上。得到fa文件：对输入reads信息重新整理（将不同样本的reads重新整合到一起）；arf文件：比对结果。如果想增加比对结果，可以增加参数-q（比对错配数为1...

1. 寻找前体：将reads比对到参考基因组上。得到fa文件：对输入reads信息重新整理（将不同样本的reads重新整合到一起）；arf文件：比对结果。如果想增加比对结果，可以增加参数-q（比对错配数为1），脚本默认错配数为0

perl mapper.pl mapper.cfg -r 15  -c -j -l 18 -m -o 4 -v -n  -d -p dsRNAseq -s Total_reads_collapsed.fa -t Total_reads_collapsed_vs_genome.arf

1.1 对测序得到的reads进行物种miRNA定量。输入文件必需包括三份：含有microRNA前体序列的fasta文件(来源于miRBase)，含有成熟microRNA序列的fasta文件(miRBase)，我们自己测序得到的microRNA文件

perl quantifier.pl -p Rhi_hairpin.fa -m Rhi_mature.fa  -r Total_reads_collapsed.fa -y now -g 2 -W -T 10 -d -P

#结果文件miRNAs_expressed_all_samples_time.csv

#norm是CPM，seq是count，同一个miRNA可能来源于不同的precursor

#miRNA read_count precursor total seq seq(norm)

1.2 输出结果

perl make_html2.pl -q expression_analyses/miRBase.mrd -k Rhi_mature.fa -y 24_10_2023_t_11_41_33 \
-d -o -i expression_analyses/Rhi_mature_mapped.arf  -l  -M miRNAs_expressed_all_samples_24_10_2023_t_11_41_33.csv \
-P -W expression_analyses/read_occ

2. 根据reads和基因组比对的结果，预测novel miRNA

perl miRDeep2.pl Total_reads_collapsed.fa dsRNAseq.fa Total_reads_collapsed_vs_genome.arf \
Rhi_mature.fa none Rhi_hairpin.fa -d  -g 100000 -l 500  -m 11 -v -P -n d

2.2 首先就是mapping结果进行过滤，只保留能够完全精确比对上基因组，而且长度在18到25bp的reads, 同时去除在基因组的hit超过5个的reads，代码如下:

parse_mappings.pl Total_reads_collapsed_vs_genome.arf -a 2 -b 18 -c 35 -i 15 > Total_reads_collapsed_vs_genome.arf_parsed.arf

#-a 错配数

2.3 过滤之后的比对结果，用于预测miRNA前体序列，代码如下

excise_precursors_iterative_final.pl /share/nas1/renzx/project/zx-20230710-118_miRNA_zhenjun/ \
dsRNA/rawdata.miRNA_Prediction_ref/index/dsRNAseq.fa Total_reads_collapsed_vs_genome.arf_parsed.arf \
precursors.fa precursors.coords 100000 500

2.4 将reads与预测出的miRNA前体序列进行比对，代码如下

/share/work/pipline/sRNA/bin/mirdeep_plant/prepare_signature.pl /share/nas1/renzx/project/zx-20230710-118_miRNA_zhenjun/ \
dsRNA/rawdata.miRNA_Prediction_ref/ann/4.miRNA_Prediction.bak/Total_reads_collapsed.fa precursors.fa 2 \
-a Rhi_mature -o signature.arf 2>>error_24_10_2023_t_11_41_33.log

2.5 RNAfold预测miRNA前体的二级结构，代码如下

RNAfold < precursors.fa -noPS > precursors.str

2.6 #computing randfold p-values 计算RanFold P值过滤：

/share/work/pipline/sRNA/bin/mirdeep_plant/select_for_randfold.pl signature.arf precursors.str > precursors_for_randfold.ids                                                  
/share/work/pipline/sRNA/bin/mirdeep_plant/fastaselect.pl precursors.fa precursors_for_randfold.ids > precursors_for_randfold.fa                                              
randfold -s precursors_for_randfold.fa 99 > precursors_for_randfold.rand

2.7 running miRDeep core algorithm 运行miRDeep核心算法（空）-t

/share/work/pipline/sRNA/bin/mirdeep_plant/miRDeep2_core_algorithm.pl signature.arf precursors.str \
-v -50 -n d -l 12 -y precursors_for_randfold.rand -t > output.mrd

发表于 2023-11-01 15:25
阅读 ( 1340 )
分类：smallRNA

预测miRNA前体

你可能感兴趣的文章

相关问题

1 条评论

作家榜 »