R语言,按数值范围统计频次,绘制柱状图
2018年,《Science》一篇研究论文通过对上百万例实验样品数据进行分析,揭示不同精神疾病之间享有共同的遗传变异,然而神经性疾病表现更为独立。
2018年最新生命科学类SCI影响因子及中科院分区统计
正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。 Perl语言的正则表达式功能非...
R处理大数据时偶尔会出现out of memory的问题,相关解决方法: 1、memory.size()查看当前work space内存使用状况(MB) 2、memory.limit()查看当前work space运行使用内存的上限 > memo...
处理统计RNA-seq 表达量数据,绘制柱状图,PCA散点图,还有不同样品表达基因维恩图。
基于微生物16s测序数据中的OTU丰度矩阵可以进行微生物互作网络构建,从而探索微生物之间的互作关系。而网络的构建方法多种多样,下面给大家推荐一个网站,Microbial association network constr...
差异基因的筛选是基于统计学意义的,不能直观的通过两个数值的大小判断差异基因的是否。 首先:受测序深度的影响,有些样品的测序深度较深,可能导致该样品的readcount数值较高,做差...
大数据挖掘解决老年痴呆症的病因,可能更病毒感染有关
GTF文件中class code 注释转录本的类型
R 删除重复数据的方法,包括duplicated 和unique 针对duplicated, 对向量的元素或数据框的行进行操作的时候,返回逻辑值,以下面的数据框为例: dat A B C D1 a b a c2 c k b d3 c k c c4...
搭建自己的生信编程环境eclipse+perl+python+R(java环境)
利用GEO数据TCGA数据筛选疾病相关标志分子,miRNA,mRNA,lncRNA,circRNA等;
gdc-client 下载TCGA数据
叶绿体是绿色植物进行光合作用的细胞器,具有合成蛋白质、淀粉、色素等功能,普遍存在于真核自养生物中,尤其是藻类和陆生植物,其基因组可自主遗传。
SNP2CAPS可将SNP转换为CAPS标记,其具体用法: perl SNP2CAPS.pl chr5D:9950377.fa_1 link_gcg AanI,AarI,AasI,AatII,Aba6411II,AbaB8342IV,AbaCIII > chr5D:9950377.txt 其中...
在merged.gtf文件中有所有外显子的信息,下面的脚本可根据此文件提取转录本的所有外显子位置信息。 merged.gtf文件实例: Chr00 Cufflinks exon 37990 38333 . + ...
聚合酶链式反应,其英文Polymease Chain Reaction(PCR)是体外酶促合成特异DNA片段的一种方法,由高温变性、低温退火及适温延伸等几步反应组成一个周期,循环进行,使目的DNA得以迅速扩增,...
系统聚类Hierarchical clustering(层次聚类、谱系聚类)— 最短距离法(single linkage)— 最长距离法 (complete linkage)— 中间距离法 (median method)— 可变距离法 (flexible median)— 重心...
随着分子生物学研究方法的发展,很多的研究领域都越来越多的分析到了蛋白层面,下面我们就简单介绍几种常用的蛋白互作研究方法: 酵母双杂交: 酵母双杂交由Fields在1989年提出,它的产生...