我们进行kegg富集分析之后,除了会得到差异基因和KO编号对应的KOlist信息,还会拿到kegg pathway map的信息,分为html和png的结果展示,大概是这样的结果:
一般来说我们最好检查一下,这里面涉及到得基因和我们的差异基因是不是一致。这个时候我们可以利用一下html里的信息:
1. 合并所有html
cat pathway/*html > html
2. 找到含有基因和KO编号信息的行
grep "href='http" html > info
3. 提取KO编号信息
awk -F "K" '{ print "K"$3}' h1 | cut -d "(" -f1 | cut -d " " -f1 > ko
awk -F "K" '{ print "K"$3}' h1 | cut -d "(" -f1 > ko-gene
4. 和我们的基因-KO编号list文件进行比较
cut -d "|" -f1 KOlist | sed "s/\t/ /g" > kegg.ko
cat ko |while read -r line; do if grep -q " [[:space:]]*$line$" kegg.ko ; then echo "$line";else echo "false" ;fi ;done > result
result文件里面如果没有false那就说明我们pathway map里面都是差异基因
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!