分析motif可能会遇到的问题
1.分析过后有些基因没有找到motif,此时需要调整meme参数重新查找一下:
举例:第一次输入的命令为:
meme protein.fa -protein oc ./ -nostatus -time 18000 -maxsize 6000000 -mod anr -nmotifs 10 -minw 6 -maxw 200
计算的结果发现某些基因没有查到motif的结果,此时我们需要修改输入的命令
(修改的原因:根据第一次分析的motif结果进行修改参数,举例;第一次分析结果,某些基因没有找到motif,可能是motif的氨基酸长度较长,因此可以调节搜索的上限值,同时也可以调节查找的motif数量值,这样可能会更容易查找)
即在Linux输入的命令如下:
meme protein.fa -protein oc ./ -nostatus -time 18000 -maxsize 6000000 -mod anr -nmotifs 20 -minw 6 -maxw 300
为什么要这样修改以及各项参数所代表的含义:
meme:名为memed的程序
protein.fa :查询的序列蛋白质文件
-protein: 输入的是蛋白文件,因此为 —protein
-oc ./ :输出到当前目录
-time 18000:meme搜索序列的时间是18000s,时间设置的长一些是为了让meme反复搜,以致于可以找到序列
-maxsize 6000000:指定输入文件的大小
- mod anr :模型选择anr即可
nmotifs 15 :在搜素的序列当中一共搜素的motif个数
-minw 6:搜素motif长度范围,最小有6个氨基酸
-maxw 200 :搜素motif长度范围,最大有200个氨基酸
更改的参数:
-nmotifs 10 →20
-maxw 200 →300
meme的各项参数:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!