1. 寻找前体:将reads比对到参考基因组上。得到fa文件:对输入reads信息重新整理(将不同样本的reads重新整合到一起);arf文件:比对结果。如果想增加比对结果,可以增加参数-q(比对错配数为1),脚本默认错配数为0
perl mapper.pl mapper.cfg -r 15 -c -j -l 18 -m -o 4 -v -n -d -p dsRNAseq -s Total_reads_collapsed.fa -t Total_reads_collapsed_vs_genome.arf
1.1 对测序得到的reads进行物种miRNA定量。输入文件必需包括三份: 含有microRNA前体序列的fasta文件(来源于miRBase),含有成熟microRNA序列的fasta文件(miRBase), 我们自己测序得到的microRNA文件
perl quantifier.pl -p Rhi_hairpin.fa -m Rhi_mature.fa -r Total_reads_collapsed.fa -y now -g 2 -W -T 10 -d -P
#结果文件miRNAs_expressed_all_samples_time.csv
#norm是CPM,seq是count,同一个miRNA可能来源于不同的precursor
#miRNA read_count precursor total seq seq(norm)
1.2 输出结果
perl make_html2.pl -q expression_analyses/miRBase.mrd -k Rhi_mature.fa -y 24_10_2023_t_11_41_33 \
-d -o -i expression_analyses/Rhi_mature_mapped.arf -l -M miRNAs_expressed_all_samples_24_10_2023_t_11_41_33.csv \
-P -W expression_analyses/read_occ
2. 根据reads和基因组比对的结果,预测novel miRNA
perl miRDeep2.pl Total_reads_collapsed.fa dsRNAseq.fa Total_reads_collapsed_vs_genome.arf \
Rhi_mature.fa none Rhi_hairpin.fa -d -g 100000 -l 500 -m 11 -v -P -n d
2.2 首先就是mapping结果进行过滤,只保留能够完全精确比对上基因组, 而且长度在18到25bp的reads, 同时去除在基因组的hit超过5个的reads,代码如下:
parse_mappings.pl Total_reads_collapsed_vs_genome.arf -a 2 -b 18 -c 35 -i 15 > Total_reads_collapsed_vs_genome.arf_parsed.arf
#-a 错配数
2.3 过滤之后的比对结果,用于预测miRNA前体序列,代码如下
excise_precursors_iterative_final.pl /share/nas1/renzx/project/zx-20230710-118_miRNA_zhenjun/ \
dsRNA/rawdata.miRNA_Prediction_ref/index/dsRNAseq.fa Total_reads_collapsed_vs_genome.arf_parsed.arf \
precursors.fa precursors.coords 100000 500
2.4 将reads与预测出的miRNA前体序列进行比对,代码如下
/share/work/pipline/sRNA/bin/mirdeep_plant/prepare_signature.pl /share/nas1/renzx/project/zx-20230710-118_miRNA_zhenjun/ \
dsRNA/rawdata.miRNA_Prediction_ref/ann/4.miRNA_Prediction.bak/Total_reads_collapsed.fa precursors.fa 2 \
-a Rhi_mature -o signature.arf 2>>error_24_10_2023_t_11_41_33.log
2.5 RNAfold预测miRNA前体的二级结构,代码如下
RNAfold < precursors.fa -noPS > precursors.str
2.6 #computing randfold p-values 计算RanFold P值 过滤:
/share/work/pipline/sRNA/bin/mirdeep_plant/select_for_randfold.pl signature.arf precursors.str > precursors_for_randfold.ids
/share/work/pipline/sRNA/bin/mirdeep_plant/fastaselect.pl precursors.fa precursors_for_randfold.ids > precursors_for_randfold.fa
randfold -s precursors_for_randfold.fa 99 > precursors_for_randfold.rand
2.7 running miRDeep core algorithm 运行miRDeep核心算法(空)-t
/share/work/pipline/sRNA/bin/mirdeep_plant/miRDeep2_core_algorithm.pl signature.arf precursors.str \
-v -50 -n d -l 12 -y precursors_for_randfold.rand -t > output.mrd
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!