隨(sui)著測(ce)序技術的進(jin)步(bu),常規(gui)轉錄(lu)組(zu)測(ce)序憑借高通量(liang)、價(jia)格低、周期短等優勢,成為入門(men)級組(zu)學技術,廣(guang)泛應用(yong)于農醫(yi)學研(yan)究中。而發表高級轉錄(lu)組(zu)文章的過程中,對目(mu)標(biao)基因(yin)集(ji)(ji)的挖掘和(he)討(tao)論,往往才(cai)是(shi)重(zhong)點(dian)。轉錄(lu)組(zu)數據量(liang)龐大,如何快速對目(mu)標(biao)基因(yin)集(ji)(ji)進(jin)行分析,從海量(liang)的分析結果(guo)中篩(shai)(shai)(shai)(shai)選關(guan)鍵(jian)(jian)目(mu)標(biao)基因(yin),下(xia)面小派將對快速篩(shai)(shai)(shai)(shai)出候選基因(yin)提(ti)供(gong)以(yi)下(xia)通用(yong)性的建議(yi)和(he)方法,您也可以(yi)結合其他篩(shai)(shai)(shai)(shai)選指標(biao)一起篩(shai)(shai)(shai)(shai)選出關(guan)鍵(jian)(jian)基因(yin)。
篩選思路
候選基因(yin)(yin)應該與(yu)老(lao)師所(suo)研(yan)(yan)究(jiu)的(de)(de)(de)(de)生物學問題密切相(xiang)(xiang)關(guan),并在(zai)某一(yi)生命過程中(zhong)發揮核心的(de)(de)(de)(de)生物學功(gong)能、參與(yu)重要的(de)(de)(de)(de)通路。基因(yin)(yin)功(gong)能的(de)(de)(de)(de)背景信息(xi)可(ke)以來源于參考(kao)基因(yin)(yin)組注(zhu)釋、基因(yin)(yin)功(gong)能數(shu)據(ju)庫(如GO、KEGG)注(zhu)釋或者相(xiang)(xiang)關(guan)研(yan)(yan)究(jiu)的(de)(de)(de)(de)文獻和綜述等,獲取可(ke)能相(xiang)(xiang)關(guan)的(de)(de)(de)(de)基因(yin)(yin)、GO和KEGG通路信息(xi),然(ran)后在(zai)自己的(de)(de)(de)(de)測序結(jie)果中(zhong)進行(xing)篩(shai)選。無論通過怎(zen)樣(yang)的(de)(de)(de)(de)方式進行(xing)數(shu)據(ju)篩(shai)選,人(ren)為的(de)(de)(de)(de)解讀和數(shu)據(ju)挖(wa)掘是必不可(ke)少的(de)(de)(de)(de)。
篩選(xuan)方(fang)法
1、基于(yu)GO/KEGG富集分析結果(guo)
①打開GO富(fu)集結果*_download_enrichment.xls文件,在(zai)Term列中,用關(guan)鍵詞逐一篩選與您研究相(xiang)關(guan)的(de)(de)生物學功能,通(tong)常認為(wei)pvalue小于0.05的(de)(de)Term達到(dao)了顯著富(fu)集程度(du),可以重點關(guan)注。獲得(de)相(xiang)關(guan)顯著富(fu)集的(de)(de)GO Term后(hou)可以在(zai)同表格里看到(dao)注釋到(dao)相(xiang)關(guan)GO Term的(de)(de)所有差(cha)異(yi)基因(yin)信息,示例如(ru)下:
②打(da)開KEGG通路(lu)富(fu)(fu)集結果*_KEGG_download_enrichment.xls文件,在(zai)pathway列中,用關(guan)鍵(jian)詞逐一篩(shai)選(xuan)與您研究(jiu)相(xiang)關(guan)的(de)通路(lu),常認為pvalue小于0.05的(de)通路(lu)達到了顯著(zhu)富(fu)(fu)集程度,可(ke)以(yi)重(zhong)點關(guan)注。獲取(qu)關(guan)注通路(lu)的(de)富(fu)(fu)集情況(kuang)后(hou)可(ke)以(yi)參照GO篩(shai)選(xuan)方法,即可(ke)獲得注釋(shi)到關(guan)注通路(lu)的(de)所有(you)差異顯著(zhu)基因的(de)信息。以(yi)查找“cGMP-PKG signaling pathway”為例(li)(li),示例(li)(li)如下(xia):
注:在(zai)某些實(shi)驗處理條件下,差異(yi)表達(da)基因可(ke)能(neng)較少(shao),因而(er)GO和KEGG通(tong)路(lu)富(fu)集結果較少(shao),如(ru)果已經(jing)有關注的(de)GO或KEGG通(tong)路(lu),可(ke)直接(jie)從*.DESeq2.xls表中的(de)GO列(lie)(lie)或KEGG列(lie)(lie)進行篩選,獲(huo)取(qu)候選基因信息。
2、基于GSEA分析結果
GSEA從基(ji)(ji)(ji)因(yin)(yin)集的(de)富集角(jiao)度出發(fa),理論上更容易囊括(kuo)細微但協調性的(de)變(bian)化對(dui)生物通路的(de)影響(xiang)。我們可以(yi)基(ji)(ji)(ji)于GSEA分析結(jie)果篩選在(zai)實驗組或對(dui)照組中富集的(de)基(ji)(ji)(ji)因(yin)(yin)集(GO條目、KEGG通路等),然后可以(yi)關注CORE ENRICHMENT(對(dui)ES值(zhi)有(you)主(zhu)要貢獻的(de)基(ji)(ji)(ji)因(yin)(yin))。
3、縮小(xiao)范圍
表達豐度:受系統噪音影響(xiang),低表達豐度(du)基(ji)因(FPKM值<10)可(ke)能并不(bu)可(ke)靠,建議選擇(ze)表達豐度(du)中等水平(ping)的基(ji)因進行(xing)后續研究。
差異篩選:若(ruo)已有(you)關(guan)注(zhu)(zhu)基(ji)因(yin)(yin)(yin)可(ke)以(yi)直接篩選查看對(dui)應基(ji)因(yin)(yin)(yin)的差(cha)異情況,若(ruo)無關(guan)注(zhu)(zhu)基(ji)因(yin)(yin)(yin),可(ke)根據差(cha)異倍數或者(zhe)p值排序(xu)篩選極顯著且(qie)差(cha)異較大(da)的基(ji)因(yin)(yin)(yin)作為候(hou)選基(ji)因(yin)(yin)(yin)。
基因新(xin)舊:在PubMed上查詢候(hou)選基(ji)因的相關文章數(shu)量,建議選擇較新的基(ji)因(文獻數(shu)量<100)開展深入(ru)研究,請注意同一個(ge)基(ji)因常(chang)存在多個(ge)別名。
分子(zi)大小:考(kao)慮到后續功(gong)能驗證(zheng)實驗是否能開展,建議選擇0.5~2.5K大小的(de)基因。
特殊基因:可以通(tong)過轉錄因子家族分析或者蛋白(bai)質-蛋白(bai)質相互(hu)作用(PPI)網絡(luo)分析篩選關鍵基因或者核心蛋白(bai)。
詳情請(qing)點擊:
Cytoscape軟(ruan)文:
【干貨(huo)】如何使用(yong)cytoscape玩轉(zhuan)網絡圖?(一)
【干貨(huo)】如何使(shi)用cytoscape玩轉網(wang)絡圖?(二)
【干貨】如何(he)使用cytoscape玩(wan)轉網絡圖?(三)
4、組合篩選
有(you)時候我們(men)需(xu)要(yao)在多個細(xi)胞系(xi)中探(tan)索敲除(或(huo)(huo)(huo)敲減(jian))某(mou)基(ji)因(yin)(yin)后(hou)共同差異(yi)變化(hua)的(de)(de)基(ji)因(yin)(yin),或(huo)(huo)(huo)者是過表達某(mou)基(ji)因(yin)(yin)或(huo)(huo)(huo)敲減(jian)某(mou)基(ji)因(yin)(yin)的(de)(de)體系(xi)中變化(hua)相(xiang)反的(de)(de)基(ji)因(yin)(yin),或(huo)(huo)(huo)者是動物模型或(huo)(huo)(huo)細(xi)胞模型中用藥后(hou)表達有(you)回復(fu)的(de)(de)基(ji)因(yin)(yin),亦或(huo)(huo)(huo)者是關(guan)注響應時間序列(lie)或(huo)(huo)(huo)濃度(du)梯度(du)變化(hua)的(de)(de)基(ji)因(yin)(yin),上述(shu)目的(de)(de)往(wang)往(wang)需(xu)要(yao)結(jie)合兩(liang)個比較組或(huo)(huo)(huo)多個比較組的(de)(de)差異(yi)分析(xi)信息,以下(xia)篩選方法供參(can)考:
(1)韋恩(en)圖:
可(ke)以(yi)用韋(wei)恩(en)(en)圖篩選(xuan)不同(tong)(tong)(tong)比(bi)較組(不同(tong)(tong)(tong)基因(yin)集)共(gong)同(tong)(tong)(tong)的元(yuan)素和特有元(yuan)素,比(bi)如共(gong)同(tong)(tong)(tong)差(cha)異表(biao)達(da)(da)基因(yin)、特有差(cha)異表(biao)達(da)(da)基因(yin)等(deng),并將這種篩選(xuan)過程(cheng)和結果(guo)可(ke)視化(hua)。靈活(huo)利(li)用韋(wei)恩(en)(en)圖可(ke)以(yi)通(tong)過一(yi)(yi)次(ci)篩選(xuan)或多次(ci)篩選(xuan)獲(huo)取(qu)我們關注的核心(xin)基因(yin)集,然后可(ke)以(yi)對核心(xin)基因(yin)集進行進一(yi)(yi)步分析。比(bi)如利(li)用韋(wei)恩(en)(en)圖篩選(xuan)某基因(yin)敲(qiao)減(jian)組差(cha)異上調基因(yin)和過表(biao)達(da)(da)組差(cha)異下調基因(yin)的交集。
(2)表達模式分析:
當老師樣(yang)(yang)本為(wei)不同時(shi)間節點、濃(nong)度(du)梯度(du)、治療或用(yong)藥前(qian)后的(de)(de)這(zhe)種設置時(shi),若(ruo)進(jin)行兩(liang)兩(liang)比較篩(shai)選(xuan),當樣(yang)(yang)本組(zu)較多時(shi)可能需要多次的(de)(de)相交(jiao)篩(shai)選(xuan)才能獲(huo)得目標變(bian)化趨勢(shi)的(de)(de)基(ji)(ji)因(yin)集。老師可以基(ji)(ji)于STEM(//www.cs.cmu.edu/~jernst/stem/)的(de)(de)基(ji)(ji)因(yin)表達模式聚類分(fen)(fen)析或者(zhe)常(chang)規趨勢(shi)分(fen)(fen)析可以快速獲(huo)得我們(men)關注趨勢(shi)的(de)(de)基(ji)(ji)因(yin)集或者(zhe)哪(na)種變(bian)化趨勢(shi)是最顯著的(de)(de)變(bian)化趨勢(shi)。然后針對目標基(ji)(ji)因(yin)集進(jin)一(yi)步分(fen)(fen)析即可。
(3)加權共(gong)表達網絡分(fen)析
加權基(ji)因(yin)共表達網絡(luo)分析(WGCAN,Weighted correlation network analysis)是(shi)用(yong)來描(miao)述不同(tong)樣品之間基(ji)因(yin)關聯模(mo)式(shi)的(de)(de)系統生(sheng)物(wu)學方法(fa),可以用(yong)來鑒定高度協同(tong)變化的(de)(de)基(ji)因(yin)集(ji),并根據(ju)基(ji)因(yin)集(ji)的(de)(de)內連性(xing)和基(ji)因(yin)集(ji)與表型之間的(de)(de)關聯鑒定候(hou)補生(sheng)物(wu)標記基(ji)因(yin)或治療靶點。WGCNA適用(yong)于(yu)(yu)復雜(za)的(de)(de)數據(ju)模(mo)式(shi),如果(guo)樣本數大于(yu)(yu)15,可以考慮開展WGCNA分析。
通過以上(shang)這幾種分析(xi)方式可以找到目標功能、性狀或不同實(shi)驗處理(li)中的(de)核心基因。
那么如(ru)何基于轉錄組(zu)測序找到(dao)下(xia)游可(ke)驗證基因,我(wo)們到(dao)這里(li)就介紹完了(le),下(xia)方(fang)也繪制(zhi)了(le)我(wo)們今天講到(dao)的(de)分析(xi)思路路線圖,有需(xu)要的(de)老(lao)師可(ke)以收藏奧~當然,除了(le)已(yi)經介紹過(guo)的(de)方(fang)法外,將(jiang)轉錄組(zu)數據(ju)與蛋白組(zu)/代謝組(zu)等組(zu)學數據(ju)進行聯合分析(xi)也可(ke)以進一步縮小目標(biao)基因的(de)篩選范圍(wei)。
將多(duo)種分析方法及篩選(xuan)路徑結合使(shi)用,更能(neng)提升(sheng)我(wo)們篩選(xuan)到的核心基(ji)因(yin)的可靠(kao)程度,降低后續(xu)實(shi)驗失敗(bai)的概率(lv)。最后再(zai)重點強調一(yi)下,無論哪種方式挑(tiao)選(xuan)出來的基(ji)因(yin),都需(xu)要盡量(liang)滿足基(ji)于表達量(liang)和差異(yi)的目標基(ji)因(yin)篩選(xuan)標準進行(xing),老師們快來試試吧(ba)。