基因组组装的时候,有些片段无法挂载到染色体上,因此除了染色体外还有一些片段留在参考基因组当中,有的基因组将这些片段之间加N链接成super序列,也有的直接不处理以scoffold出现,具体可查参考基因组网站的说明。
回答于 2018-07-19 10:46
可以适当删除一些比对较差的GAP区域,保留比对结果中比较保守的区域,再进行系统进化树构建。至于系统进化树的好坏,可以变换下参数,再做几次,看看有没有符合预期的;
回答于 2018-07-18 17:42
这条代码是 blast 比对: query_file:替换自己查询fasta序列文件,使用的是blastp,输入文件为蛋白质序列; database:输入blast比对数据库文件路径; xyz.blast:输出文件 其他参数默认照抄就好了 更详细的可观看:《基因家族视频课程》有详细操作说明。
回答于 2018-07-18 09:52
有很多软件可以实现,如下: MEGA、DNAStar(MegAlign)、DNAman、T-coffee( http://tcoffee.vital-it.ch/apps/tcoffee/index.html )、 ESPript(http://espript.ibcp.fr/ESPript/ESPript/); ESPript结果: MEGA比对结果:
回答于 2018-07-18 09:43
1.hg19和hg38不同的基因组版本,本身参考序列就有差异,反应在位置上也会有差异,正常的。真想看看差异,可以把不同版本基因组的对应的UTR序列截取下来看看有没有差异。
回答于 2018-07-17 14:06
你检查你的,输入文件,第一行是不是有问题,确定是不是66列;再看看文章:如何提问。现有的信息只能帮你到这里。
回答于 2018-07-12 17:39
一类基因家族的基因,往往都含有相同的保守结构域,这些保守结构域收录在pfam数据库当中。 基因家族的鉴定可采用hmmer搜索的方法: 首先你要知道你要研究的基因家族的Pfam编号,然后可到pfam数据库当中根据编号下载对应的保守结构域的隐马尔科夫模型,就可以用hmmer根据你下载的隐马尔科夫模型搜索鉴定自己物种中的基因家...
回答于 2018-07-12 17:22
计算串联重复基因的KAks有专门的软件:https://www.sciencedirect.com/science/article/pii/S1672022907600072 详细用法可观看基因家族视频课程。
回答于 2018-07-12 17:13
共线性分析的原理,这里可以简单的说明一下:例如这里有两个基因组分别来自不同的物种,将两个基因组当中所有的基因互相用blast比对,然后MCScanX会利用比对关系,发现基因组之间的共线性关系,例如下图,两个红方框之间有一串基因存在很强的同源性,且一一对应,那么就可以认为两个基因组之间的这两个区段存在共线性关系。...
回答于 2018-07-12 17:10
lncRNA 为长链非编码RNA,长链非编码RNA有带polyA结构的,也有不带polyA结构的,常规的转录组mRNA建库会使用ployT磁珠筛选mRNA,理论上那些带ployA尾巴的lncRNA也会存在于普通mRNA转录组测序的数据当中,是可以分析这部分内容的,但是会丢掉很多lncRNA的信息。通常测lncRNA公司会建议多测一些数据,以检测那些表达量较低的l...
回答于 2018-07-12 10:19