这里推荐pilotedit软件(下载地址:http://www.pilotedit.com/index.html),专门用于windows当中打开超大文本文件,免费版本就可以打开最大10G的文件;收费版本甚至400G的文件都么有问题; 如果在linux当中就简单多了,用less命令就可以。 更多fastq说明《illumina二代测序原理及fastq视频课程》 更多生物信息课...
回答于 2018-07-06 10:44
https://www.ncbi.nlm.nih.gov/orffinder/ 只是知道,没用过,用过的可以留言交流。
回答于 2018-07-05 14:05
这里介绍一个绘制韦恩图的R包Vennerable 可以实现,例如绘制维恩图代码: library(Vennerable) data(StemCell) w <- Venn(Sets=StemCell[1:2]) plot(w, type="circles") 例如,我想得到韦恩图当中,219,404,875背后的基因ID信息,这些信息都存储在w这个变量中: 其中01变号就对应了不同的分组基因的数量,...
回答于 2018-07-04 12:11
$是S3类的引用方式,@是S4类的引用方式$比较常用,@比较少用。通常我们的data.frame, list. 向量等用$就可以;S4也有例如,有个维恩包Vennerable:下面的w 就是S4类型,想取得里面IntersectionSets,信息必须用@符号:library(Vennerable) data(StemCell) w <- Venn(Sets=StemCell[1:2]) plot(w, type="squares") w@In...
回答于 2018-07-04 11:56
答:SNP index的计算是对子代池中SNP的一种统计方法,其原理是利用测序reads对每个碱基位点的碱基进行统计,以某一亲本或参考基因组为参考,统计子代池中和亲本或者参考基因组在某一个碱基位点相同或者不相同的reads条数,计算不相同reads条数占总条数的比例,即为该碱基位点的SNP index。对于有两个子代池数据的项目,我们...
回答于 2018-07-02 09:01
答:纯合SNP和杂合SNP是SNP calling软件如GATK或者SAMtools根据测序深度、碱基质量值、比对质量值和基因型质量值等综合判断出来的纯合和杂合,简单来说,纯合SNP可以认为该位点测到的所有reads只是一种碱基类型,杂合SNP为二种或二种以上的碱基类型,不排除特殊位置。
回答于 2018-07-02 08:58
答:重测序一般采用BWA软件进行序列比对,采用mem算法的默认参数进行比对, 比对率低的主要原因可能是参考基因组组装不好,或者所测材料与使用的参考基因组差异比较大,或者有污染所致。
回答于 2018-07-02 08:56
答:为保证后续分析的准确性,诺禾致源会严格把控clean data的筛选标准,具体标准如下: (1) 去除带接头(adapter)的paired reads; (2) 当单端测序read中含有的N的含量超过该条read长度比例的10%时,需要去除此对paired reads; (3) 当单端测序read中含有的低质量(Q ≤ 5)碱基数超过该条read长度比例的...
回答于 2018-07-02 08:53