1.二代数据比对 bwa-mem2
#检索引并比对
bwa-mem2 index reads.fa
bwa-mem2 mem -t 20 reads.fa 1.clean.fq.gz >alignment.sam
#sam文件转化为bam文件
samtools sort -@ 4 -O bam -o align1.sorted.bam alignment1.sam
#bam文件索引
samtools index align1.sorted.bam
#提取比对到参考序列上的比对结果
samtools view -bF 4 align1.sorted.bam > mapped1.bam
#bam文件转化为fq文件
samtools bam2fq mapped1.bam > 1.fastq
gzip 1.fastq
2.三代数据比对 minimap2
#建索引
minimap2 -d reads.min reads.fa -t 30
#比对
minimap2 -ax map-ont reads.min ont_clean.fq.gz -t 30 >alignment3.sam
#sam文件转化为bam文件
samtools sort -@ 4 -O bam -o align3.sorted.bam alignment3.sam
#bam文件索引
samtools index align3.sorted.bam
#提取比对到参考序列上的比对结果
samtools view -bF 4 align3.sorted.bam > mapped3.bam
#bam文件转化为fq文件
samtools bam2fq mapped3.bam > 3.fastq
gzip 3.fastq
#将需要挑选的序列名称写入list.txt,之后提取
seqkit grep -f list.txt assembly.fasta >reads.fasta
extractseq -sequence C.fa -region 5-6117 -outseq in.fa
获取下载链接之后进行下载,以ERR6054995为例 fasterq-dump工具
wget -c https://sra-pub-run-odp.s3.amazonaws.com/sra/ERR6054995/ERR6054995
nohup fasterq-dump --split-3 ./ERR6054995 & #SRR文件需指定路径,时间较短,速度快,但不能用--gzip参数
gzip ERR6054995-1.fastq #压缩为gz格式
gzip ERR6054995-2.fastq
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!