特简介 在生物信息学研究中,获取准确和全面的基因注释信息是至关重要的。mygene.info是一个提供全面、准确和最新基因注释信息的在线服务。该服务由Scripps研究所提供,并以RESTful API的形式...
有时候我们从NCBI下载SRA文件时会发现,会有SRA Lite和SRA Normalized两种类型的数据,前者后缀是.sralite,其文件大小也比原始的SRA文件要小。这两种数据的区别是什么呢?
BAM就是SAM的二进制文件,具有更小的存储空间,并且许多下游分析工具使用的是BAM格式。
回归分析中R2指的是结果变量(y)的观测值与y的拟合(即预测)值之间的相关系数;因此,R的值将始终为正,范围为0至1。 相关系数R2:表示你的曲线线性是否很好,理想状态是1,但是达不到。一般...
1.典型相关(CCA)的基本原理canonical correspondence analysis 典型相关分析是研究两组变量之间关系的一种多变量统计分析方法,它可以反映两组变量之间的相互依赖的线性关系。设两组变量用x1...
OPLS-DA分析,全称正交偏最小二乘法判别分析(OrthogonalPartialLeast Squares-DiscriminantAnalysis),它是在PLS-DA分析方法基础上,加入了正交变换的矫正,能够将X矩阵分解成与Y相关和不相关...
ceRNA全称competing endogenouse RNA, 中文叫做竞争性內源RNA。和ncRNA等概念不同,ceRNA并不是代表某种特定类型的RNA,而是一种调控机制。 通俗来讲,在这种调控模式中,ceRNA指生物体内复杂的...
重复序列是指基因组中频繁出现的相同或对称的DNA片段,在植物基因组中占有很大比重,根据重复序列在植物基因组中的组织方式不同进行分类。
NCBI下载物种叶绿体或线粒体基因组fasta,gff3,gtf,gb文件,以及获得细胞器基因组的全部基因名称
区分cds utr.exon
fasta格式文件介绍 What is FASTA format?
用R语言中的glmnet包进行LASSO运算,我的目的是想建立一个Cox model分析肿瘤与各个因素的关系,如何实现?
Kaplan-Meier生存分析中三种检验方法(log-rank、breslow、tarone)的比较
常年混迹于生物测序行业,每天见的最多的是各种各样的生物样品,干的最多的就是区分样品,一千个样品有一千种命名方式:有用阿拉伯数字顺序下来的;有用汉字的;有名中带特殊字符的。殊不知,如...
导师与学生之间关系的讨论与反思,是值得我们进一步去推敲的。
血泪总结之——论文投稿中的那些“潜规则。
转录组结果那么多,差异统计在哪里?注释结果在哪里?原始数据在哪里?我连文件名都忘了,还有得救吗?看完本文让你豁然开朗!
相关系数
每个行业都有自己的梗,科研领域也不例外。