2020-07-06
(重要列說明(ming),部分列隱藏)
A列(lie):蛋白的登陸號。
B列(lie):蛋白的全(quan)稱。
C-H列(lie):每個樣(yang)本(ben)中蛋白(bai)相對定量(liang)的值(zhi)。
蛋白(bai)(bai)組(zu)(zu)主要(yao)目的(de)(de)是(shi)尋(xun)找(zhao)不(bu)同比較組(zu)(zu)之間(jian)的(de)(de)差(cha)異(yi)蛋白(bai)(bai)。差(cha)異(yi)分析一(yi)(yi)般涉及兩(liang)個(ge)標(biao)準,差(cha)異(yi)倍(bei)數 fold change 和 p 值(zhi),一(yi)(yi)般認為(wei)上調(diao)或(huo)(huo)者下調(diao)在2或(huo)(huo)1.5倍(bei)以上,且同時p值(zhi)小(xiao)于0.05,才認為(wei)該蛋白(bai)(bai)在兩(liang)個(ge)比較組(zu)(zu)間(jian)發(fa)生了(le)顯著的(de)(de)差(cha)異(yi)變化。按照這一(yi)(yi)標(biao)準篩(shai)選出來的(de)(de)差(cha)異(yi)蛋白(bai)(bai)即為(wei)蛋白(bai)(bai)組(zu)(zu)找(zhao)到(dao)的(de)(de)顯著差(cha)異(yi)蛋白(bai)(bai)集。
當(dang)(dang)差異蛋白的個(ge)(ge)(ge)數太多(duo)時(shi)(shi),可(ke)(ke)以(yi)考(kao)慮(lv)收縮篩選(xuan)標準,比(bi)如調大差異倍數,調小p值范圍,若差異基(ji)因個(ge)(ge)(ge)數仍然較(jiao)多(duo),可(ke)(ke)以(yi)調整為(wei)比(bi)p值更嚴格(ge)的 P adj 或(huo)者 FDR 來進行(xing)篩選(xuan);當(dang)(dang)差異蛋白的個(ge)(ge)(ge)數太少(shao)時(shi)(shi),可(ke)(ke)以(yi)考(kao)慮(lv)放寬篩選(xuan)標準,比(bi)如調小差異倍數。
1、組間差異蛋白鑒定
(重要列說明,部分(fen)列隱藏(zang))
綠色(se)底紋(wen)標(biao)記(ji)的是下(xia)調蛋白(bai),上調蛋白會用紅色底紋標(biao)示
B-D列(lie):蛋白在GO數據庫的三大功能類(lei)中的編號。
E列:蛋(dan)白(bai)在KEGG數(shu)據庫中的編(bian)號。
G-I列:蛋白質(zhi)氨基(ji)酸數目、分(fen)子量、等電點。
J列(lie):基(ji)于相對定量(liang)結果得出的蛋白組間(jian)差異倍數(shu)。
K列:組間(jian)差異鑒定事件(jian)對應(ying)的顯著(zhu)性P值(zhi)。
2、組間(jian)差異蛋(dan)白(bai)火山圖
差(cha)異蛋白火山圖
①、紅色的點(dian)為上調(diao)蛋(dan)白(bai)(bai),藍色的點(dian)為下調(diao)蛋(dan)白(bai)(bai),灰色點(dian)為非(fei)顯著差異蛋(dan)白(bai)(bai)。
②、橫(heng)坐標(biao)為差異倍數,取log2是(shi)為了作(zuo)圖的對稱(cheng)性。
②、縱坐(zuo)標為(wei)P值,取-log10(P value)是為(wei)了(le)作圖的(de)美觀性,橫(heng)向直線對應的(de)值為(wei)1.3,對應P = 0.05。
3、組間差異蛋(dan)白聚類(lei)熱圖
一(yi)般熱(re)圖都呈現的(de)是雙向聚(ju)(ju)類的(de)結果,即(ji)橫坐標對樣(yang)本(ben)聚(ju)(ju)類,縱坐標對蛋白進(jin)行聚(ju)(ju)類,表(biao)達模式相(xiang)近的(de)蛋白或者(zhe)樣(yang)本(ben)會(hui)聚(ju)(ju)到(dao)一(yi)起。
①、熱圖(tu)只能做橫向比(bi)較(jiao),即比(bi)較(jiao)同一(yi)個蛋白在不同樣本中表達變化,縱向沒有可比(bi)性,因為生物體內(nei)不同蛋白豐度本身就有差異。根(gen)據圖(tu)例可知,顏(yan)色(se)越紅表達量(liang)越高(gao),顏(yan)色(se)越藍表達量(liang)越低。
②、橫坐(zuo)標為樣(yang)本名稱,縱坐(zuo)標為蛋白名稱。
在進(jin)行(xing)蛋(dan)(dan)白質組(zu)學(xue)研究時(shi),我們的(de)研究對象是細胞、組(zu)織或生物(wu)體中全部(bu)蛋(dan)(dan)白質的(de)集合(he),了解哪(na)一(yi)些功能或生物(wu)學(xue)途徑受(shou)到生物(wu)學(xue)處理(li)的(de)顯著影響是首要任(ren)務(wu)。因此,需(xu)要從更(geng)為(wei)(wei)系統和(he)概括的(de)層(ceng)次和(he)角度,對所研究的(de)蛋(dan)(dan)白及其(qi)功能進(jin)行(xing)概括和(he)分(fen)(fen)析。GO與KEGG為(wei)(wei)基(ji)本的(de)基(ji)因或蛋(dan)(dan)白功能富集分(fen)(fen)析,兩種分(fen)(fen)析的(de)大部(bu)分(fen)(fen)結果(guo)圖展示形(xing)式相同,為(wei)(wei)避免重(zhong)復,下面的(de)分(fen)(fen)析圖片中,相同圖形(xing)僅在GO或者(zhe)KEGG部(bu)分(fen)(fen)展示。
功能富(fu)集結果(guo)挖(wa)掘(jue)建議:首(shou)先結合研究方向與表型(xing)等(deng)因素考(kao)慮,在顯(xian)著富(fu)集的通(tong)路中主觀選(xuan)擇關鍵通(tong)路查看。如(ru)果(guo)沒有明確目標,可以(yi)根據顯(xian)著性排序、富(fu)集因子大小、富(fu)集蛋白(bai)數(shu)目多少等(deng)方面篩選(xuan)關鍵通(tong)路,再進一(yi)步查看通(tong)路中富(fu)集的蛋白(bai)。
1、GO功(gong)能富集分析
GO(基(ji)(ji)因本體論(lun)聯合(he)會建(jian)立(li)的(de)(de)數(shu)據庫 //geneontology.org/,Gene Ontology)是一(yi)個(ge)(ge)國際標準化的(de)(de)基(ji)(ji)因功(gong)能(neng)分(fen)類體系,提供了一(yi)套動態(tai)更新(xin)的(de)(de)標準詞匯表來全面(mian)描述生物(wu)體中基(ji)(ji)因和基(ji)(ji)因產(chan)物(wu)的(de)(de)屬性。GO 涵蓋三個(ge)(ge)方面(mian),分(fen)別描述基(ji)(ji)因的(de)(de)分(fen)子功(gong)能(neng)(Molecular Function)、細胞的(de)(de)組(zu)件(jian)作用(Cellular Component)、參與的(de)(de)生物(wu)學(xue)過程(Biological Process)。GO 的(de)(de)基(ji)(ji)本單元(yuan)是 Term,每個(ge)(ge) Term 有(you)一(yi)個(ge)(ge)唯(wei)一(yi)的(de)(de)標示符(由 “GO:” 加上 7個(ge)(ge)數(shu)字組(zu)成,例如 GO:0072669)。
①、用(yong)不(bu)同的顏色(se)代(dai)表3個不(bu)同的GO功能大類,橫(heng)坐標為GO term名稱。
②、縱坐標為term上富集的蛋白(bai)數目以及占分析時提(ti)交總蛋白(bai)數目的百分比。
2、KEGG功能富集分析
氣泡圖也是功能富集分析中的常見展示形式。選擇顯著性排名前10或者20的通路做圖形展示。
①、左側縱坐標為通路(lu)名稱(cheng)。右上方圖例為FDR值(zhi)的示(shi)意,顏色越(yue)紅越(yue)顯著。右下方圖例的圓點越(yue)大(da)表(biao)示(shi)該通路(lu)上富集的基因數目越(yue)多。
②、橫(heng)坐(zuo)標為(wei)富集因(yin)子。為(wei)該通(tong)路上富集的差異蛋(dan)(dan)白(bai)占分析時該通(tong)路上提交(jiao)所有蛋(dan)(dan)白(bai)個數的百分比(bi)。
每個KEGG通路都對應了一張詳細的代謝通路圖,KEGG通路是跨物種的,分析時會結合實際樣本結果對該通路圖進行差異蛋白標注。該圖查看方式:在KEGG結果表格中打開網頁鏈接即可查看對應通路的通路圖,待圖形緩沖完成,可以鼠標右擊另存為保存。差異蛋白的標注方式會有多種形式,如遇到有疑問的可就具體問題咨詢我們。
圖中以紅色框表示參與該通路的所有差異蛋白質,綠色框線表示本物種中的蛋白(KEGG是跨物種的數據庫)。小圓圈表示小分子代謝物,大圓框代表其他通路。
在生物體中,蛋(dan)白(bai)(bai)質(zhi)(zhi)并(bing)不是(shi)獨立存(cun)在的,其功能的行使必須(xu)借助于其他蛋(dan)白(bai)(bai)質(zhi)(zhi)的調節和(he)介導(dao)。這種調節或(huo)(huo)介導(dao)作(zuo)(zuo)用(yong)(yong)的實現首先要求(qiu)蛋(dan)白(bai)(bai)質(zhi)(zhi)之間有結合作(zuo)(zuo)用(yong)(yong)或(huo)(huo)相互(hu)(hu)作(zuo)(zuo)用(yong)(yong)。對(dui)蛋(dan)白(bai)(bai)質(zhi)(zhi)之間的相互(hu)(hu)作(zuo)(zuo)用(yong)(yong)及(ji)相互(hu)(hu)作(zuo)(zuo)用(yong)(yong)形成的網(wang)絡進(jin)行研究(jiu),對(dui)于揭(jie)示蛋(dan)白(bai)(bai)質(zhi)(zhi)的功能具有重(zhong)要意義。
PPI是(shi)(shi)一般是(shi)(shi)基(ji)于(yu)(yu)STRING數據(ju)庫來做的(de)(de)(de)。它(//string-db.org/)是(shi)(shi)一個搜尋已知的(de)(de)(de)和基(ji)于(yu)(yu)預測的(de)(de)(de)蛋(dan)(dan)白質之(zhi)間(jian)相互(hu)(hu)作(zuo)(zuo)(zuo)用的(de)(de)(de)系統(tong)。其(qi)中人、小鼠、大鼠、擬南芥等,可獲得的(de)(de)(de)互(hu)(hu)作(zuo)(zuo)(zuo)信(xin)息已較為完善,PPI的(de)(de)(de)結果信(xin)息多,互(hu)(hu)作(zuo)(zuo)(zuo)關(guan)系準(zhun)確(que)(que)。但是(shi)(shi)對于(yu)(yu)參考(kao)(kao)基(ji)因組蛋(dan)(dan)白注釋不佳(jia),尤其(qi)是(shi)(shi)無考(kao)(kao)考(kao)(kao)基(ji)因組的(de)(de)(de)物種(zhong),我們需(xu)要通過尋找數據(ju)庫中的(de)(de)(de)近(jin)源蛋(dan)(dan)白來做PPI,如果能對應(ying)到的(de)(de)(de)近(jin)源蛋(dan)(dan)白不多,那么PPI互(hu)(hu)作(zuo)(zuo)(zuo)網絡中的(de)(de)(de)蛋(dan)(dan)白則較少,且互(hu)(hu)作(zuo)(zuo)(zuo)關(guan)系的(de)(de)(de)準(zhun)確(que)(que)性也僅供參考(kao)(kao)。
每個比較組對應一張PPI圖,不同的圓圈代表不同的蛋白,中間有連線表明可能存在互作關系。