国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>行業資訊>新聞詳情

Nature|基于人類表觀基因組圖譜EpiMap,廣泛揭示人類疾病位點調控回路

2021-03-24

在分子(zi)水平(ping)注釋人類疾病仍然(ran)是(shi)一個挑戰,因(yin)為93%與(yu)疾病相關的(de)(de)突變位(wei)點位(wei)于基因(yin)組的(de)(de)非編碼區(qu)域(yu),而這些區(qu)域(yu)如何(he)調控基因(yin)的(de)(de)轉錄和翻譯仍然(ran)未知。為此,來自麻省理工學院的(de)(de)研究人員基于多個大型合作基因(yin)組圖(tu)譜(pu)(pu)項(xiang)目(包括ENCODE、Roadmap Epigenomics、Genomics of Gene Regulation)的(de)(de)數(shu)據(ju),提出(chu)了一個新的(de)(de)人類表(biao)觀基因(yin)組圖(tu)譜(pu)(pu),命名為EpiMap(Epigenome Integration across Multiple Annotation Projects)。這項(xiang)研究結果以 “Regulatory genomic circuitry of human disease loci by integrative epigenomics”為題于近日發表(biao)在Nature上。

文章發表于Nature

利用EpiMap,研究人員:

  1. 基于(yu)多個表觀遺傳修飾信號注(zhu)釋了染色質狀態(tai)(chromatin states),同時結合DNA可及性注(zhu)釋增(zeng)強子;

  2. 將增強子分為(wei)不(bu)同的模(mo)塊(enhancer modules),并根據(ju)轉錄(lu)因(yin)子motif和GO富集結果推斷(duan)每個模(mo)塊的上游調控轉錄(lu)因(yin)子和下游遠程調控基因(yin);

  3. 整合增(zeng)強子位置,增(zeng)強子和基(ji)因(yin)的(de)遠程交互作用和GWAS SNP結果,預(yu)測SNP的(de)靶基(ji)因(yin)和組(zu)織(zhi)特異性;

  4. 將(jiang)GWAS性狀劃分為“單因子(zi)”和“多因子(zi)”性狀,揭示了它們(men)與疾病(bing)的關系;

  5. 區分(fen)了“單(dan)效(xiao)(xiao)”和“多(duo)效(xiao)(xiao)”位點(dian),并發現(xian)得分(fen)最高(gao)的位點(dian)通常有多(duo)個(ge)(ge)驅動突變,通過不同(tong)的方式發揮(hui)“多(duo)效(xiao)(xiao)”功(gong)能:多(duo)個(ge)(ge)增強子和一個(ge)(ge)共(gong)同(tong)的靶基(ji)(ji)因(yin)、調控(kong)單(dan)個(ge)(ge)組(zu)織中的多(duo)個(ge)(ge)基(ji)(ji)因(yin)或多(duo)個(ge)(ge)組(zu)織中發揮(hui)功(gong)能。

研究內容與結果 

研究人(ren)員使(shi)用(yong)統一的(de)(de)數據(ju)處理流程分析(xi)了來自859個樣(yang)本的(de)(de)3,030個數據(ju)集,并另外使(shi)用(yong)算(suan)法推算(suan)出(chu)了14,952個數據(ju)集,極大地擴展了數據(ju)集的(de)(de)覆蓋范(fan)圍。

接著研究人員使用(yong)表(biao)觀基(ji)因(yin)組數據(ju)注釋了18中不(bu)同的染(ran)色質狀態(tai)(chromatin states),并結(jie)合其中的活躍(yue)增(zeng)(zeng)強子狀態(tai)與DNase-seq數據(ju)注釋了210萬個(ge)(ge)活躍(yue)的增(zeng)(zeng)強子區(qu)域。這些區(qu)域累(lei)積(ji)覆蓋(gai)13%的基(ji)因(yin)組區(qu)域,單(dan)個(ge)(ge)生(sheng)物樣(yang)本(ben)平均覆蓋(gai)率達到(dao)了0.8%,這相對于ENCODE 2020版本(ben)增(zeng)(zeng)加了兩倍以(yi)上。

圖1. EpiMap資源概述,來源:Nature

研究(jiu)人員在833個(ge)生物樣本中定義了基于(yu)H3K27ac的局部活(huo)性水(shui)平,并基于(yu)此(ci)將增強(qiang)子(zi)分為(wei)300個(ge)增強(qiang)子(zi)模(mo)塊(enhancer modules),包括290個(ge)組織特異性模(mo)塊和10個(ge)廣泛活(huo)躍的模(mo)塊。

結(jie)合表觀基(ji)因組(zu)-轉錄組(zu)的相(xiang)關性(xing)以(yi)及增(zeng)強子(zi)與(yu)鄰近基(ji)因的距離(li),研究(jiu)人(ren)員預(yu)測了330萬個組(zu)織特異性(xing)的增(zeng)強子(zi)-基(ji)因交(jiao)互(enhancer-gene links),這在預(yu)測的交(jiao)互數量上和生物學相(xiang)關性(xing)上都超越了以(yi)前(qian)的方法。

研究人員預測了其中(zhong)(zhong)273個(ge)模塊的(de)上(shang)游調控轉(zhuan)錄(lu)因(yin)(yin)子(zi)(zi),涉及1,175個(ge)motifs,分為160個(ge)原(yuan)(yuan)型(xing)(archetypes),包括(kuo)152個(ge)組織特異性原(yuan)(yuan)型(xing)和(he)(he)(he)8個(ge)通用(yong)原(yuan)(yuan)型(xing)。組織特異性的(de)轉(zhuan)錄(lu)因(yin)(yin)子(zi)(zi)motif包括(kuo):血(xue)液和(he)(he)(he)免疫樣本中(zhong)(zhong)的(de)GATA和(he)(he)(he)SPI1;大腦和(he)(he)(he)周圍神經(jing)系統中(zhong)(zhong)的(de)NEUROD2和(he)(he)(he)RFX4;消化組織中(zhong)(zhong)的(de)KLF4;胎(tai)盤、肌(ji)衛星和(he)(he)(he)上(shang)皮細胞中(zhong)(zhong)的(de)TEAD3。通用(yong)的(de)motif包括(kuo)肝,腎和(he)(he)(he)胰腺中(zhong)(zhong)的(de)HNF1A(與NR5A2共同作用(yong));免疫,骨骼和(he)(he)(he)癌癥樣本中(zhong)(zhong)的(de)AP-1(也稱(cheng)為JUN)或JDP2;TEAD3在不同的(de)組織中(zhong)(zhong)與不同的(de)轉(zhuan)錄(lu)因(yin)(yin)子(zi)(zi)協(xie)作:MYF6(肌(ji)球(qiu)蛋白),TFAP2A(胎(tai)盤)和(he)(he)(he)AP-1(基(ji)質)。

Motif富(fu)集將組織分類為(wei)(wei)不同(tong)的亞組,比如(ru)心(xin)臟(zang)(zang)被劃分為(wei)(wei)胚胎心(xin)臟(zang)(zang)(NFIX和(he)(he)(he)E2F1)、主動脈(mo)和(he)(he)(he)動脈(mo)(SRF和(he)(he)(he)PAX5)以及心(xin)腔(qiang)(MEF2D和(he)(he)(he)ESRRG);大腦被細(xi)(xi)分為(wei)(wei)胚胎(NFIX和(he)(he)(he)NEUROD2),成人大腦(RFX2和(he)(he)(he)SOX10)和(he)(he)(he)星形膠質細(xi)(xi)胞(bao)(NFE2L2和(he)(he)(he)JDP2);造血(xue)細(xi)(xi)胞(bao)被細(xi)(xi)分為(wei)(wei)為(wei)(wei)自然(ran)殺傷(shang)細(xi)(xi)胞(bao)(ETV2)、B細(xi)(xi)胞(bao)(NFKB2和(he)(he)(he)SPIB)和(he)(he)(he)多能(neng)祖細(xi)(xi)胞(bao)(GATA1和(he)(he)(he)NFE2L2)。

圖2. 增強子模塊(kuai)回路,來源:Nature

接下來,研(yan)究(jiu)(jiu)人(ren)員(yuan)使用210萬個增強(qiang)子注釋及其組(zu)織特異性來解釋與復雜性狀相關的GWAS位點(dian)(dian)。研(yan)究(jiu)(jiu)人(ren)員(yuan)匯總了(le)了(le)一份來自803項GWAS研(yan)究(jiu)(jiu)的GWAS位點(dian)(dian)數(shu)據集,捕獲了(le)70,000 多個GWAS位點(dian)(dian)。研(yan)究(jiu)(jiu)人(ren)員(yuan)發(fa)現(xian)了(le)17,658個顯著的性狀-組(zu)織富(fu)集,覆蓋了(le)245個性狀中(zhong)的27,000多個候選GWAS SNP。

研究人員(yuan)結(jie)合表觀基因(yin)組學的(de)(de)(de)注釋和增強子-基因(yin)的(de)(de)(de)遠(yuan)程交(jiao)互作(zuo)用,對(dui)疾(ji)(ji)病(bing)相關的(de)(de)(de)位(wei)點產生(sheng)(sheng)了新(xin)的(de)(de)(de)認識。例如(ru)乳(ru)腺癌GWAS富集在上(shang)皮(pi)細胞和癌細胞樣本(ben)中(zhong),其(qi)中(zhong)SNP rs17356907位(wei)于(yu)(yu)靠(kao)近USP44基因(yin)的(de)(de)(de)增強子內(nei)部(bu),但與(yu)(yu)另一個(ge)(ge)基因(yin)NTN4交(jiao)互,而NTN4與(yu)(yu)腫瘤發生(sheng)(sheng)和血管生(sheng)(sheng)成有關。精(jing)神(shen)分裂(lie)癥GWAS在中(zhong)額葉皮(pi)質樣本(ben)中(zhong)富集,其(qi)中(zhong)SNP rs2007044位(wei)于(yu)(yu)一組靠(kao)近DCP1B啟(qi)動子的(de)(de)(de)增強子內(nei)部(bu),所有這些增強子都與(yu)(yu)CACNA1C交(jiao)互,已知(zhi)CACNA1C編碼與(yu)(yu)神(shen)經精(jing)神(shen)疾(ji)(ji)病(bing)有關的(de)(de)(de)鈣(gai)通道蛋白,提示多種變異可能共同導致(zhi)其(qi)失(shi)調。研究人員(yuan)已經提供了一個(ge)(ge)交(jiao)互式網站(//compbio.mit.edu/epimap),用于(yu)(yu)探索與(yu)(yu)500多個(ge)(ge)性狀相關的(de)(de)(de)超(chao)過30,000個(ge)(ge)額外(wai)的(de)(de)(de)GWAS位(wei)點。

圖3. 基于(yu)增強子活性距離(li)的833個生物樣本的層次聚類,來源:Nature 

然(ran)后(hou),研(yan)究人員(yuan)研(yan)究了性狀-組織(zhi)、性狀-性狀和組織(zhi)-組織(zhi)表觀(guan)基因組GWAS共富集模式,以(yi)了解(jie)它們之間(jian)復雜的相互作用(yong)。

首先,研究人員使用在(zai)每個(ge)性(xing)狀(zhuang)(zhuang)中(zhong)(zhong)(zhong)富(fu)(fu)集(ji)的組織數量來將性(xing)狀(zhuang)(zhuang)劃(hua)分(fen)為(wei)兩類(lei):56個(ge)“單因子(zi)”性(xing)狀(zhuang)(zhuang)(22%)在(zai)一個(ge)組織中(zhong)(zhong)(zhong)具有(you)最(zui)多富(fu)(fu)集(ji)(例如(ru),心(xin)臟(zang)的QT間期、腦(nao)的受教育程(cheng)度和免疫(yi)細胞(bao)的甲狀(zhuang)(zhuang)腺功能(neng)減退),而192個(ge)“多因子(zi)”性(xing)狀(zhuang)(zhuang)(79%)平(ping)均(jun)富(fu)(fu)集(ji)在(zai)五個(ge)組織類(lei)別(bie)中(zhong)(zhong)(zhong)(例如(ru),免疫(yi)細胞(bao)和大(da)腦(nao)中(zhong)(zhong)(zhong)的阿爾茨(ci)海(hai)默病(bing);脂(zhi)肪、肌(ji)肉(rou)、腎(shen)臟(zang)和消化組織中(zhong)(zhong)(zhong)的腰臀比),其中(zhong)(zhong)(zhong)26個(ge)“多因子(zi)”性(xing)狀(zhuang)(zhuang)(11%)平(ping)均(jun)富(fu)(fu)集(ji)在(zai)14個(ge)組織類(lei)別(bie)中(zhong)(zhong)(zhong)(包括冠狀(zhuang)(zhuang)動脈疾病(bing)(CAD)在(zai)19個(ge)組織組中(zhong)(zhong)(zhong),包括肝臟(zang)、心(xin)臟(zang)、脂(zhi)肪、肌(ji)肉(rou)和內分(fen)泌樣本(ben))。

根據組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)的共富集特(te)性來(lai)區分(fen)每個GWAS性狀的“主(zhu)要(yao)”組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)(例如(ru)免疫細胞,肝臟(zang),心臟(zang),大腦和脂(zhi)肪組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi))與“伙(huo)伴(ban)”組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)(例如(ru),消(xiao)化(hua)、肺、肌肉(rou)和上皮(pi)(pi)組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)),“主(zhu)要(yao)”組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)和“伙(huo)伴(ban)”組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)相(xiang)比(bi)始終(zhong)表現出更(geng)高的富集,這表明它們具有驅動作用(yong)而不是輔(fu)助作用(yong)。特(te)定的主(zhu)要(yao)-伙(huo)伴(ban)組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)共同(tong)發生(sheng)的頻率比(bi)預期的要(yao)高,并且(qie)揭示(shi)了它們可能在性狀上共同(tong)發揮(hui)作用(yong),包(bao)括:肝臟(zang)與脂(zhi)肪組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)(膽(dan)固醇特(te)征)、消(xiao)化(hua)組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)(膽(dan)結石(shi))和血細胞(血清(qing)蛋白水(shui)平);以(yi)及脂(zhi)肪組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)與內皮(pi)(pi)細胞(腰臀比(bi))、心臟(zang)組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)(心房顫動)和肌肉(rou)組(zu)(zu)(zu)(zu)(zu)(zu)織(zhi)(zhi)(血壓)。

圖4. 性狀(zhuang)-性狀(zhuang)網絡,來源:Nature  

最后,研究(jiu)人(ren)員(yuan)將“多(duo)因子(zi)”性狀的(de)SNPs劃分為組(zu)(zu)織特異性的(de)組(zu)(zu)分。例(li)如,339個(ge)(ge)與CAD相關的(de)SNPs劃分為:195個(ge)(ge)富含動脈、心臟和血管形態發(fa)生(sheng)的(de)心臟增強(qiang)子(zi)SNPs;171個(ge)(ge)脂質穩態的(de)內(nei)分泌增強(qiang)子(zi)SNPs;169個(ge)(ge)膽(dan)固(gu)醇和脂質代謝(xie)和轉運的(de)肝臟增強(qiang)子(zi)SNPs;軸突導(dao)向和局(ju)灶粘(zhan)附中122個(ge)(ge)脂肪增強(qiang)子(zi)SNPs,與脂肪組(zu)(zu)織神經(jing)支配過程一致;112個(ge)(ge)胚胎干細胞衍生(sheng)的(de)肌肉增強(qiang)子(zi)SNPs,富含中隔形態發(fa)生(sheng)、腔(qiang)和主動脈發(fa)育。

這些分(fen)區也顯示出不(bu)一樣的協同(tong)關(guan)(guan)系。例如:心臟(zang),肌(ji)肉和(he)內(nei)皮細胞(bao)增(zeng)強(qiang)子中的CAD SNPs均與(yu)與(yu)高(gao)血壓(ya)和(he)心房顫動相關(guan)(guan);肝臟(zang)和(he)內(nei)分(fen)泌(mi)增(zeng)強(qiang)子中的CAD SNPs與(yu)收(shou)縮壓(ya)相關(guan)(guan);脂肪增(zeng)強(qiang)CAD SNP與(yu)腰臀比相關(guan)(guan);以及肝臟(zang),脂肪和(he)內(nei)分(fen)泌(mi)CAD SNPs與(yu)HDL膽固(gu)醇(chun)相關(guan)(guan)。

從單個(ge)(ge)多因子(zi)性狀(zhuang)位點來(lai)看,既有在(zai)單個(ge)(ge)組織中(zhong)富(fu)集的(de),也有在(zai)多個(ge)(ge)組織中(zhong)富(fu)集的(de)。一些CAD SNP位點僅與(yu)心臟(zang)增強(qiang)子(zi)重疊(例如EDNRA、TCF21和ADAMTS7),一些僅與(yu)肝臟(zang)增強(qiang)子(zi)重疊例如PCSK9),一些不(bu)位于(yu)任何增強(qiang)子(zi)中(zhong),許多位于(yu)廣泛(fan)活躍的(de)增強(qiang)子(zi)中(zhong)(例如,LDLR、APOE、SH2B3和COL4A1),這表明(ming)即使在(zai)單個(ge)(ge)SNP位點水平上也存(cun)在(zai)多種調控機(ji)制。

即使看似單(dan)一的(de)(de)(de)SNP也會在(zai)其他組(zu)織(zhi)里(li):rs17114046在(zai)肝(gan)臟(zang)中(zhong)有很強的(de)(de)(de)信號,同時它(ta)位(wei)于多個(ge)(ge)增(zeng)強子中(zhong),并(bing)調(diao)控基因PLPP3,肝(gan)臟(zang)特(te)(te)異性(xing)PLPP3缺失(shi)會增(zeng)加動脈(mo)粥樣(yang)硬化;然而這(zhe)個(ge)(ge)SNP也同時連接(jie)到另一個(ge)(ge)肝(gan)臟(zang)產生的(de)(de)(de)補(bu)體因子C8A,并(bing)通過心臟(zang)特(te)(te)異性(xing)和肌(ji)肉特(te)(te)異性(xing)的(de)(de)(de)交(jiao)互連接(jie)到PRKAA2。這(zhe)說明單(dan)個(ge)(ge)SNP也可能具有多種功能,這(zhe)一特(te)(te)性(xing)存在(zai)與許多高度富集的(de)(de)(de)SNP中(zhong)。

圖5. 多(duo)因子性狀的(de)劃(hua)分,來源:Nature 

小結 

該(gai)研究(jiu)結果(guo)證明了高(gao)通量、豐富多維、高(gao)分(fen)辨率(lv)的表觀基(ji)因組和(he)調控回路注釋在研究(jiu)基(ji)因調控、復(fu)雜性狀(zhuang)和(he)疾病位點機制研究(jiu)中的實(shi)用性,使得(de)生(sheng)物空間和(he)疾病復(fu)雜性的規模(mo)、范圍和(he)覆蓋(gai)面達到較大(da)的程度。