你这个提取序列脚本是提取基因上游的promoter序列吗? 如果是的话,有些基因位置位于序列的开头,或者结尾,导致promoter序列(比如1500bp)就没有足够的序列可以提取导致程序报错; 这个脚本比较老了,我们新课程已经更新了这个脚本; https://study.omicsclass.com/index
回答于 2022-08-24 09:46
我们已经不用vbox下的biolinux了,用更好的虚拟机docker : https://www.omicsclass.com/article/1198
回答于 2022-08-23 15:55
没法再详细了,看不懂命令,看看视频吧:https://study.163.com/course/introduction.htm?share=2&shareId=400000000234009&courseId=1212025847
回答于 2022-08-23 15:50
1.不要用记事本编辑文件,会导致linux不兼容。用notepad++等专业的文本编辑软件 2.你的蛋白ID和GFF里面的mRNAID 不一样,一个t1 后缀,一个是 p1 后缀,你想办法统一一下;
回答于 2022-08-22 20:29
脚本的最前面有个 export PATH命令没有执行, 每次重启docker之后脚本开头的环境变量要运行一下才行;
回答于 2022-08-22 14:24
blast 搜索的 结果,首先你得知道你的结构域序列在蛋白序列上的位置,可以借助samtools 等工具批量截取序列: 截取序列: https://www.omicsclass.com/article/1169 https://www.omicsclass.com/article/1245
回答于 2022-08-19 10:52
excel的问题,你可以手动用excel搜索一下; 如果不是excel问题,你的这个数据基因特殊没有数据蛋白互作的数据,或者没有STRING没有收录
回答于 2022-08-19 10:49