看脚本和文件都没有问题,你输入的位置信息文件:gen-weizhi.txt 检查一下这个文件每一列是不是用一个tab分隔的; 我看截取的时候报的输入的不是数字;split分隔文件可能错了; 确保分隔符正确,可将文件内容张贴到excel,然后另存为: 制表符分隔的txt文件:
回答于 2018-08-24 11:41
NCBI上的基因组数据库,会对基因组的染色体,基因编号等等重新命名编号,截图中已经有注释说明,请仔细看; 你要是不嫌麻烦可以根据GFF的注释信息提取ID的对应关系。 拟南芥建议上ensembl上下载基因组信息,会有更友好一些:https://www.omicsclass.com/article/58
回答于 2018-08-24 11:22
所有基因家族的PFAM号,可到PFam数据库里面直接得到,目前最新的是31版本: pfam数据库主页:http://pfam.xfam.org/ 所有基因家族的hmm模型: ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam31.0/Pfam-A.hmm.gz
回答于 2018-08-22 12:11
那篇nbs鉴定的原文 是哪篇?提供链接; 手动鉴定结构域建议用NCBI的:https://www.omicsclass.com/article/310 如果一个基因的多条转录本都有结构域建议选择第一条转录本为基因的代表序列,如果只有一个转录本就用那个转录本就好; 例如下面: 参考文献:https://bmcgenomics.biomedcentral.com/articles/10.118...
回答于 2018-08-22 10:38
perl 取出多个hash的值,可以用循环: 下面的代码是遍历hash: while(($key, $value) = each(%HASH)) { # do something with $key and $value}#-----------------------------foreach $key (keys %HASH) { $value = $HASH{$key}; # do something with $key and $value}#-----------------------------# %f...
回答于 2018-08-20 20:48
如果是用hmmsearch命令查询我们序列中的保守结构域: target length是我们输入序列总长度;query length 输入的查询序列也就是蛋白结构域的总长度;筛选的时候不应该筛选这两个长度,没有意义;应该看后面的两个from to 看看这两条序列从哪里到哪里比对上了; 一般我们会筛选第7列的E-value值; 要知道怎么筛选先看...
回答于 2018-08-19 08:26