分析(xi)項目 | 類別 | 分析 | 備注 |
原始數據整理、過濾及質量評估 | A | √ | |
與參考基因組序(xu)列(lie)比(bi)對 | A | √ | |
Peak Calling | A | √ | |
基因(yin)附近及Peak中心信(xin)號(hao)分布圖 | A | √ | |
Peak鄰近基因功(gong)能分析 | A | √ | |
差異(yi)Peak序列Motif及注釋分析 | A | √ | |
差異Peak鄰近基因功(gong)能分析 | A | √ | |
Overlap基(ji)因功能分析 | A | √ |
Peak Calling
使用統計(ji)學方法計(ji)算出(chu)參考(kao)基(ji)因組上比對(dui)上的(de) Reads 顯著富集的(de)區(qu)域(yu)(稱為 Peak),這(zhe)些區(qu)域(yu)在不同(tong)的(de)實驗中表示不同(tong)的(de)研究(jiu)重點,獲(huo)得 Peak 后,可(ke)對(dui) Peak 進(jin)行后續的(de) Peak 序列 Motif 分析(xi)、 Peak 注釋等分析(xi),進(jin)一(yi)步挖掘感興趣(qu)的(de)方向。Peak 在外顯子、內(nei)含子、5’UTR、3’UTR、基(ji)因間區(qu)等區(qu)域(yu)上的(de)分布情況如下:
功(gong)能性區(qu)域Peak分布
Peak序列Motif分析
轉(zhuan)錄(lu)(lu)因(yin)子(zi)(zi)(zi)往往傾向于結(jie)合在(zai)特定的(de)(de) DNA 序列上,這(zhe)些 DNA 序列通(tong)常具有高度相似的(de)(de)核苷酸(suan)序列模(mo)式(shi),即每個(ge)轉(zhuan)錄(lu)(lu)因(yin)子(zi)(zi)(zi)都有一個(ge)目標 DNA 序列的(de)(de) Motif,公(gong)開(kai)發表的(de)(de)轉(zhuan)錄(lu)(lu)因(yin)子(zi)(zi)(zi)數據庫中一般記錄(lu)(lu)了轉(zhuan)錄(lu)(lu)因(yin)子(zi)(zi)(zi)對應的(de)(de) Motif 信息(xi)。對 Peak 序列計算 Motif,在(zai)公(gong)共數據庫中搜(sou)索這(zhe)些 Motif 對應的(de)(de)轉(zhuan)錄(lu)(lu)因(yin)子(zi)(zi)(zi),即可得到此種狀態下染色(se)質開(kai)放區可能結(jie)合的(de)(de)轉(zhuan)錄(lu)(lu)因(yin)子(zi)(zi)(zi)。
Motif分析示意圖
Peak鄰近基因GO富集分析
統(tong)計Peak鄰近(jin)基因(yin)顯著富集的GO條目(mu),從(cong)而展示可能(neng)被轉(zhuan)錄因(yin)子調(diao)控的基因(yin)功(gong)能(neng),對每個Peak鄰近(jin)基因(yin)進行GO注釋,得(de)到其所(suo)有的GO功(gong)能(neng)條目(mu)。
GO富集柱狀圖
差異Peak鄰近基因Pathway富集分析
統計各(ge)個KEGG Pathway上包含的差異Peak鄰(lin)近基(ji)因數(shu)目及富集(ji)程度(du),進而確定差異Peak鄰(lin)近基(ji)因主要參與的代謝途(tu)徑和(he)信號通(tong)路。
KEGG富(fu)集分析(xi)
Overlap基因分析
為了研究(jiu)轉錄(lu)因(yin)(yin)(yin)子/組蛋(dan)(dan)白(bai)修(xiu)飾(shi)(shi)是(shi)如(ru)何調控(kong)下(xia)游基因(yin)(yin)(yin),通常要結合(he)表(biao)達數據 RNA-seq 分(fen)析,進一步研究(jiu)轉錄(lu)因(yin)(yin)(yin)子/組蛋(dan)(dan)白(bai)修(xiu)飾(shi)(shi)的(de)調控(kong)作用,即促進或抑制基因(yin)(yin)(yin)表(biao)達。
韋恩圖