在生命科學研究中,KEGG 通路圖是理解基因功能、代謝網絡和疾病機制的核心工具。但面對密密麻麻的節點和箭頭,很多人直呼 “像天書一樣難懂"。別擔心,這篇指南將用通俗的語言和實操案例,帶你一步步揭開 KEGG 通路圖的神秘面紗。
第一部分:KEGG概覽
KEGG(Kyoto Encyclopediaof Genesand Genomes,京都基因與基因組百科全書)是一個整合基因、代謝物、疾病等信息的數據庫((圖1是KEGG全景概覽,可以說包羅萬象,不愧是百科全書),而通路圖是它的 “靈魂"。簡單來說,它用圖形化的方式展示了生物體內基因/蛋白、化合物之間的相互作用網絡,比如代謝反應、信號傳遞、疾病相關通路等。
舉個例子:當你研究腫瘤細胞的能量代謝時,KEGG 通路圖會告訴你,葡萄糖如何通過糖酵解轉化為丙酮酸,丙酮酸又如何進入三羧酸循環產生能量 —— 這就是“糖酵解/糖異生通路(map00010)"的核心邏輯。通路圖就像一張“生物地圖",幫你快速定位關鍵分子和調控路徑。
更新: 知識庫和網站功能不定期更新,最近一次更新Release 115.1, August 1, 2025(圖2)
圖1
圖2
用途:
1. 包含16個子數據庫,有代謝通路、基因信息、化合物、酶、藥物等等(見圖3),均包含大量有用的信息,但最經常使用的是KEGG PATHWAY查詢與分析。(見圖4)
圖3
圖4
知識點:KEGG數據庫中包括各種數據對象,這些內容均配有標識符(KEGG ID)標識,標識符由一個與數據庫相關的前綴加上五個數字構成。(見圖5)
圖5
特別說明:1個子數據庫可能有1個或者多個前綴,如KEGG Pathway中,就有map、ko、ec、rn以及 <org>5種前綴,分別代表不同的子類(請看后面的“KEGG Pathway 的5小類")
2. KEGG Pathway數據庫將生物代謝通路劃分為7大類(1級分類)(見圖6),分別為:新陳代謝(Metabolism)、遺傳信息處理(Genetic Information Processing)、環境信息處理(Environmental Information Processing)、細胞過程(Cellular Processes)、生物體系統(Organismal Systems)、人類疾病(Human Diseases),藥物開發(Drug Development)[網頁版KEGG]。其中每大類又被系統分類為B、C、D 3個級別。其中B級分類目前包括有50種子功能:C級分類即為代謝通路圖:D級分類為每個代謝通路圖的具體注釋信息。
圖6
第二部分:實際操作
1. 登陸KEGG的,進入KEGG首頁。點擊“kegg pathway",將會進入kegg的通路列表,如圖7。從這個列表,我們可以知道,kegg的通路分類也是分層級的。層級一共可以分為三級。以下圖7為例,在Metabolism為1級,其下面包括了“Global and overview maps"、“Carbohydrate metabolism"、“Energy metabolism"等十幾個B級通路。而B級通路下又會包含若干C級通路。比如圖7中的“Global and overview maps"下面又包含了若干個下一級(C級)通路如“Glycolysis / Gluconeogenesis"。我們通常看生信分析KEGG的結果,看到的通路名稱其實就是C級的結果。點擊“Glycolysis / Gluconeogenesis"即進入“Glycolysis / Gluconeogenesis"代謝通路圖。
圖7
知識點:KEGG Pathway的5個小類:(具體操作如圖8)
ü map - manually drawn reference pathways linked to KO, EC, and reaction entries
? 手工繪制的通路圖
? 通路圖的框無填充色;代謝相關的通路圖中,方框鏈接對應的基因、該基因編碼的酶以及這個酶參加的反應;非代謝相關通路中,方框鏈接對應的基因
ü ko - reference pathway highlighting KOs (blue boxes)
? ko編號,KEGG中的基因標識符,不同物種間相同的基因ko號一樣
? 通路圖的框填充淺紫色;通路圖中的框只鏈接對應的基因
ü ec - reference metabolic pathway highlighting EC numbers (blue boxes)
? EC編號,例如3.1.3.10,是國際酶學委員會對葡萄糖-1-磷酸酶(glucose-1-phosphatase)設定的識別編號
? 通路圖的框填充藍色;通路中的框只鏈接相關的酶
ürn - reference metabolic pathway highlighting reactions (blue boxes)
? 通路圖的框填充藍色;通路中的框只鏈接該點參與的某個反應、反應物及反應類型
ü org - organism-specific pathway maps for "org" linked to gene entries (green boxes)
? 物種特異的通路圖,前綴是物種名稱的縮寫,如人類是hsa,小鼠是mmu
? 通路圖的框填充綠色(沒有填充色的表示該物種中沒有該基因),通路中的框鏈接該物種對應該基因的信息
圖8
2. 可與其他大型數據庫鏈接,可同時檢索相關的基因組信息數據,如NCBI、ENSEMBL等。
第三部分:怎么看懂KEGG信號通路圖
1. 首先KEGG信號通路圖是由很多元素組成的,本質是一副線框圖,即由點和線構成的基因-代謝物關系圖,要讀懂這張圖,我們需要先了解這些元素代表什么。我們以“FoxO signaling pathway"這個通路圖為案例,介紹KEGG通路圖中各個元素的含義。
圖9
知識點:kegg中各元素的含義(不記得各元素代表什么沒關系,點擊通路圖上方的“Help"里面有詳細說明)
圖10
? 點代表通路圖中的節點,主要由基因、代謝物和上下游隔壁通路構成。如上圖,對應三種不同的形狀的符號(長方形、圓點和鈍角長方形)。
? 線代表通路中分子的互作關系,主要由幾類箭頭構成,具體意義也請見上圖。
? 三類關系:就是點和線構成的分子間的關系類型。關系類型可以分為蛋白-蛋白互作關系,基因表達關系和酶-酶關系。
? 鈍角方框暗示這個通路其實有著非常復雜的過程,是與該通路相關的另外一個通路,具體過程請點擊查閱另外一個通路。
kegg通路圖之間并非孤立的,而是常常會標注該通路中的基因或代謝物來自或流向其他隔壁的通路。或者,該通路中的某個看起來非常簡單的步驟,其實有非常復雜的構成,需要在另外一個通路中才能詳細展開。那么,這個相關的通路也會在圖中標注出來。
圖11
點擊“FoxO signaling pathway"中的FOXO這個基因,就會跳轉到FOXO基因的介紹頁面。在基因介紹的部分,涉及的信息主要包括:(1)基因信息(Entry, Name, Definition)(2)Pathway,該基因參與了哪些通路(3)Disease,該基因涉及哪些疾病(4)Brite,該基因涉及的通路的分級關系(5)genes,該基因的各個物種中的同源基因。前三個字母是這個物種拉丁名的簡寫,例如,HSA代表人。(6)該基因的參考文獻的信息。kegg提供的參考文獻都是比較經典的關于這個基因的文獻,值得翻一翻。
特別說明:
? kegg中的基因是以功能分類的,所以每個通路節點的基因代表的是一類功能基因(或者說是一個基因家族)。比如FOXO在人體內就有FOXO6、FOXO1、FOXO3、FOXO4四個同源基因。所以,下次你看到kegg通路某個位置既有基因上調也有基因下調,不要感到意外,因為這個位置不止有1個基因。
? 該基因在其他物種中的同源基因kegg也會提供列表。不過也主要集中在一些模式生物,其他非模式生物不會提供這些信息或者提供的不全。所以,非模式生物往往需要我們自己進行kegg注釋。
2. 其次生物體內信號通路交叉調控,形成了復雜的網絡,因此KEGG中的通路圖,大多也是幾個通路膠合在一起的,再看通路圖時,我們需要化繁為簡。
圖12
? 在通路圖中,可以目標分子出發,任一經過該點的線,都可認為是一條信號通路骨架,如上圖紅色箭頭所示從左到右,表示上下游關系
? 可以看到,FOXO上游還先后受Insulin和Pl3k-Akt兩個信號通路調控,下游可調控細胞周期、凋亡、自噬等多種過程
? Insulin信號通路,可點擊上方的 “Insulin signaling pathway“進入該通路的圖譜。細胞外的胰島素(INS)跟細胞膜上的胰島素受體(INSR)結合,激活底物(IRS)
? Pl3k-Akt信號通路。上游被激活的IRS促進Pl3k活性,Pl3k催化PIP2生成PIP3,從而激活磷脂酰肌醇依賴性激酶(PDK1/2),PDK1/2可以促進Akt磷酸化
? FOXO信號通路:細胞質內的FOXO會進入細胞核,調控DNA轉錄,影響P21、P27的表達,從而影響細胞周期;而其上游磷酸化的Akt則可通過促進FOXO磷酸化,從而抑制FOXO入核,抑制其功能
3. 最后,在通路圖中,我們只能獲得通路的上下游關系以及調控方式信息,更多細節比如,Akt如何通過磷酸化FOXO抑制其入核,具體磷酸化哪個位點,則需進一步檢索相關文獻了解。
KEGG PATHWAY數據庫是進行基因功能分析和代謝網絡研究的強有力工具,不管你是做轉錄組、蛋白組還是微生物組,相信通過今天的分享大家已經能看懂KEGG通路圖了。在后續的文章中,我們將逐漸解析學習一些經典的信號通路。你對些通路比較感興趣呢?歡迎留言,我們將陸續安排解讀。