国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

Nature文章精選 | 130條單倍型人基因組破解MHC、著絲粒等 “生命暗區”

2025-08-10

文章亮點

1.文章完成65個不同人群(qun)、130條近乎完整(T2T)的單倍型基因組(zu)組(zu)裝(zhuang),顯著提(ti)升了(le)結構變異檢(jian)測精度(du),填補了(le)著絲(si)粒(li)、MHC、SMN1/2等復(fu)雜區域的空白。

2.組裝(zhuang)并分析1,246個人(ren)類著(zhu)絲粒,發現α衛星陣列(lie)長度差異達30倍(bei),7%的(de)染色體存在(zai)“雙動粒”結構,并系統(tong)揭示Alu/L1等移動元件在(zai)著(zhu)絲粒的(de)插入(ru)模式。

3.派森諾提供泛基因組分析一站式解決(jue)方案:從樣本檢測到基因組分析,專業解析基因組的復雜差異和變化機制,助力生(sheng)物(wu)學(xue)和醫(yi)學(xue)研究突破。

文章信息

文(wen)章題目(mu):Complex genetic variation in nearly complete human genomes

中文題目:近乎完整人類(lei)基因組中(zhong)的復雜遺傳變異

發表期刊(kan):Nature

影響因(yin)子:48.5

發表時(shi)間:2025年7月

涉及組學:基因組Denovo、泛基因組分析、轉錄組測序(xu)

技術(shu)路線

摘(zhai) 要

本研究對65個(ge)(ge)(ge)具有多(duo)樣性的(de)人(ren)類基因組(zu)進行測序,構建了(le)(le)(le)(le)130個(ge)(ge)(ge)高質量的(de)單倍型組(zu)裝(zhuang)(zhuang),不僅(jin)閉合了(le)(le)(le)(le)92%的(de)組(zu)裝(zhuang)(zhuang)缺口(kou),還使39%的(de)染色體實現(xian)了(le)(le)(le)(le)端粒(li)(li)到(dao)端粒(li)(li)的(de)完整組(zu)裝(zhuang)(zhuang),全面解析(xi)了(le)(le)(le)(le)復雜區域如MHC、SMN1/SMN2等和1,852個(ge)(ge)(ge)結構變異(yi)。同(tong)時,首次完整組(zu)裝(zhuang)(zhuang)并驗證了(le)(le)(le)(le)1,246個(ge)(ge)(ge)著(zhu)絲粒(li)(li),揭示其在α-衛星(xing)重復序列長度和移動元件(jian)插入方面存在高度變異(yi)。結合現(xian)有泛基因組(zu)參考,該成果顯著(zhu)提升了(le)(le)(le)(le)短(duan)讀長數據的(de)基因分型準確性,每(mei)個(ge)(ge)(ge)個(ge)(ge)(ge)體可檢測到(dao)約26,000個(ge)(ge)(ge)結構變異(yi),為人(ren)類基因組(zu)多(duo)樣性研究和疾病關聯(lian)分析(xi)提供了(le)(le)(le)(le)關鍵(jian)資(zi)源(yuan)。

研究(jiu)背景

長(chang)讀長(chang)測序(xu)(Long-read sequencing, LRS)技(ji)術(shu)在(zai)完(wan)成首個(ge)人類基因(yin)組(zu)時發揮(hui)了(le)(le)關鍵作用。LRS顯著(zhu)提升(sheng)了(le)(le)結構變異(SVs,定義(yi)為長(chang)度(du)(du)≥50 bp的變異)的檢測靈敏度(du)(du)。本研究(jiu)基于人類基因(yin)組(zu)結構變異聯盟(HGSVC)的最新工作,利用PacBio HiFi與Oxford Nanopore超長(chang)讀長(chang)等(deng)互(hu)補的長(chang)讀長(chang)測序(xu)技(ji)術(shu),結合Hi-C、Strand-seq和(he)三親本信(xin)息,在(zai)65個(ge)來自千人基因(yin)組(zu)計劃(hua)的多(duo)樣性(xing)人群中(zhong),構建幾乎無(wu)缺口的高(gao)質量染色體組(zu)裝(zhuang),重點解(jie)(jie)決了(le)(le)以(yi)往在(zai)著(zhu)絲粒和(he)高(gao)同源段復制區(qu)域中(zhong)存在(zai)的組(zu)裝(zhuang)難題,為全面解(jie)(jie)析人類結構變異和(he)完(wan)善泛基因(yin)組(zu)參考奠定了(le)(le)基礎(chu)。

研究(jiu)結果(guo)

1.130個單倍(bei)型(xing)基因組組裝(zhuang)

研(yan)究(jiu)人員(yuan)選取來自五(wu)大洲28個(ge)人群的65位(wei)個(ge)體(ti),利用PacBio HiFi與Oxford Nanopore超長讀長測序技術,結(jie)合Strand-seq、Hi-C等(deng)輔助(zhu)數據,構建(jian)了(le)130個(ge)高質量、單(dan)倍(bei)型解析的人類(lei)基(ji)(ji)因(yin)組(zu)(zu)組(zu)(zu)裝(zhuang)。使用Verkko工具,實現(xian)了(le)中(zhong)(zhong)位(wei)數為10條染(ran)色(se)體(ti)的端粒到(dao)端粒(T2T)組(zu)(zu)裝(zhuang),以及中(zhong)(zhong)位(wei)數為8條染(ran)色(se)體(ti)的高質量scaffold組(zu)(zu)裝(zhuang),顯著提升了(le)組(zu)(zu)裝(zhuang)連(lian)續性(xing)(xing)和準確(que)性(xing)(xing),單(dan)拷(kao)貝(bei)基(ji)(ji)因(yin)的組(zu)(zu)裝(zhuang)完(wan)整(zheng)性(xing)(xing)達99%。針對T2T-CHM13參考(kao)基(ji)(ji)因(yin)組(zu)(zu),檢測到(dao)約18.8萬(wan)個(ge)結(jie)構變異(yi)、630萬(wan)個(ge)indel和2390萬(wan)個(ge)SNV;對GRCh38參考(kao)組(zu)(zu)也獲得了(le)相應變異(yi)集。相比(bi)以往研(yan)究(jiu),SV檢測量提高59%,假陽性(xing)(xing)率(lv)降低55%。

圖1 65個人類基因組的組裝和(he)變異識(shi)別

2.基因組(zu)資源挖掘

研(yan)究(jiu)人員(yuan)系統分析(xi)了(le)(le)(le)來自130個(ge)(ge)單倍(bei)型組裝(zhuang)的(de)結(jie)構(gou)(gou)變異(SVs),涵蓋移動(dong)元件(jian)插(cha)入(ru)(MEIs)、倒(dao)位、片段重復(SDs)和Y染(ran)(ran)色(se)體(ti)變異等。共鑒定出12,919個(ge)(ge)MEIs,其(qi)中大部(bu)分全長(chang)L1插(cha)入(ru)具備潛在(zai)反轉(zhuan)錄(lu)轉(zhuan)座(zuo)能(neng)力。倒(dao)位分析(xi)發現多個(ge)(ge)新倒(dao)位事件(jian),包(bao)括與(yu)Sotos綜合征相關的(de)大型倒(dao)位。片段重復方面,平均每個(ge)(ge)基(ji)因(yin)組含168.1 Mb的(de)SDs,并識別出多個(ge)(ge)此(ci)前未注釋的(de)拷貝數(shu)多態性(xing)區域(yu),尤其(qi)在(zai)非洲人群中更為豐富(fu)。此(ci)外,我們(men)高(gao)質(zhi)量組裝(zhuang)了(le)(le)(le)30條(tiao)Y染(ran)(ran)色(se)體(ti),首次(ci)解析(xi)了(le)(le)(le)多個(ge)(ge)Yq12區域(yu)的(de)復雜結(jie)構(gou)(gou)。功能(neng)層(ceng)面,1,535個(ge)(ge)SVs影(ying)響了(le)(le)(le)985個(ge)(ge)蛋(dan)白編碼基(ji)因(yin),其(qi)中大多數(shu)為多態性(xing)變異,部(bu)分仍保持基(ji)因(yin)功能(neng)。研(yan)究(jiu)還結(jie)合Iso-Seq和Hi-C數(shu)據揭示SV對轉(zhuan)錄(lu)本異構(gou)(gou)性(xing)、基(ji)因(yin)表達及(ji)染(ran)(ran)色(se)質(zhi)結(jie)構(gou)(gou)的(de)影(ying)響。

圖2 復雜區域改進(jin)的基因(yin)組資源(yuan)

3.基因分型(xing)綜合參考

研(yan)究人員通過構建包含107個人類基因(yin)(yin)組(zu)的(de)(de)(de)(de)泛基因(yin)(yin)組(zu)參考圖譜,利用PanGenie工具(ju)對千人基因(yin)(yin)組(zu)計劃(1kGP)3,202個個體進(jin)行(xing)全基因(yin)(yin)組(zu)變(bian)異分(fen)(fen)型(xing)(xing),共檢測到超過3,000萬(wan)個變(bian)異位(wei)(wei)點,包括25.7百(bai)萬(wan)SNP、5.8百(bai)萬(wan)插入缺失和47.9萬(wan)結構變(bian)異(SV)。相(xiang)比既往HPRC和1kGP-HC數(shu)據(ju)集,新方(fang)法(fa)顯(xian)著提高(gao)了稀有SV檢出率(非(fei)洲個體達1,490個/基因(yin)(yin)組(zu))。通過整合短讀(du)長(chang)數(shu)據(ju)與單倍(bei)型(xing)(xing)定相(xiang)技術,實現了中(zhong)(zhong)位(wei)(wei)k-mer質(zhi)(zhi)量值48的(de)(de)(de)(de)基因(yin)(yin)組(zu)重(zhong)建,較傳統(tong)方(fang)法(fa)顯(xian)著提升。針對復雜醫學相(xiang)關基因(yin)(yin)位(wei)(wei)點,采用Locityper靶向分(fen)(fen)型(xing)(xing)使(shi)單倍(bei)型(xing)(xing)預(yu)測準確率(質(zhi)(zhi)量值≥30)從74.6%提升至80%,其中(zhong)(zhong)HLA等關鍵基因(yin)(yin)分(fen)(fen)型(xing)(xing)性能改善尤為(wei)顯(xian)著。研(yan)究表明,擴大參考單倍(bei)型(xing)(xing)庫可(ke)進(jin)一步(bu)提高(gao)難測基因(yin)(yin)位(wei)(wei)點的(de)(de)(de)(de)分(fen)(fen)型(xing)(xing)精度,為(wei)疾病研(yan)究提供更(geng)可(ke)靠的(de)(de)(de)(de)基因(yin)(yin)組(zu)分(fen)(fen)析(xi)工具(ju)。

圖3 結構變異分(fen)型情況比較

4.主要(yao)組織相容性(xing)復合體(MHC)

研(yan)究人員對主(zhu)要組(zu)織(zhi)相(xiang)容性復合體(MHC)區域(yu)進行了(le)全(quan)面(mian)分析,注釋了(le)130條單倍型中的(de)(de)HLA和非HLA基(ji)(ji)(ji)因(yin),修正了(le)826個(ge)不完整的(de)(de)HLA等位基(ji)(ji)(ji)因(yin)注釋,并發(fa)現了(le)170個(ge)新的(de)(de)結(jie)構變異。研(yan)究揭(jie)示了(le)MHC II類(lei)單倍型(如DR8和DR1)的(de)(de)演(yan)化(hua)機制,解析了(le)RCCX基(ji)(ji)(ji)因(yin)簇的(de)(de)復雜模塊(kuai)結(jie)構及其進化(hua)中的(de)(de)基(ji)(ji)(ji)因(yin)轉換事件,同時開發(fa)了(le)Locityper工具將等位基(ji)(ji)(ji)因(yin)預測準確率提升至97.1%。通過(guo)泛基(ji)(ji)(ji)因(yin)組(zu)分析不僅驗證了(le)傳(chuan)統HLA-DR分組(zu)系(xi)統,還(huan)發(fa)現了(le)潛在的(de)(de)細分亞(ya)類(lei),為疾(ji)病關聯研(yan)究和精準醫療提供了(le)重(zhong)要資源(yuan)。

圖4 MHC位(wei)點的(de)結構可變區

5.SV檢測(ce)與泛基(ji)因(yin)組構建(jian)

長(chang)(chang)讀長(chang)(chang)組(zu)裝基(ji)(ji)因(yin)(yin)(yin)組(zu)顯著(zhu)提升了(le)(le)復雜結構變異(CSV)的(de)檢(jian)測能力,尤其是在重(zhong)復序列(lie)(如串聯重(zhong)復和轉座元件)中更準確(que)地識別(bie)變異。最新的(de)PAV工(gong)具(ju)可識別(bie)嵌套在大型重(zhong)復區域(yu)中的(de)CSV。基(ji)(ji)于(yu)T2T-CHM13參考(kao)基(ji)(ji)因(yin)(yin)(yin)組(zu)的(de)分析顯示,平均每個基(ji)(ji)因(yin)(yin)(yin)組(zu)含72個CSV,累計識別(bie)出1,247個CSV,涵(han)蓋128種(zhong)結構特(te)征,其中不少由(you)串聯重(zhong)復介導,如DEL-INV-DEL、INVDUP-INV-DEL等。研究人員重(zhong)點(dian)解析了(le)(le)與大腦(nao)發(fa)育相關的(de)NOTCH2NL和NBPF基(ji)(ji)因(yin)(yin)(yin)的(de)三種(zhong)CSV單(dan)倍(bei)型,以(yi)及(ji)與脊髓(sui)性肌萎縮(suo)癥相關的(de)SMN1/2區域(yu),成(cheng)功(gong)組(zu)裝了(le)(le)101種(zhong)單(dan)倍(bei)型,明確(que)了(le)(le)拷貝(bei)數和功(gong)能基(ji)(ji)因(yin)(yin)(yin)。淀(dian)粉酶基(ji)(ji)因(yin)(yin)(yin)簇(cu)區域(yu)也被(bei)完全解析,共識別(bie)39種(zhong)單(dan)倍(bei)型,其中H1a.1、H3r.1等四種(zhong)最常見(jian),最長(chang)(chang)的(de)單(dan)倍(bei)型含11個AMY1拷貝(bei)。

圖5 人類基因組中復雜的(de)結構變異

6.著絲(si)粒研究

人類著(zhu)絲粒(li)(li)是高度變(bian)異(yi)的(de)基(ji)因(yin)組(zu)區域,由α-衛(wei)星(xing)DNA構成的(de)高級重(zhong)復單(dan)元(yuan)(HORs)組(zu)成,長度和(he)(he)結(jie)(jie)構在不同個(ge)體(ti)間差(cha)異(yi)顯著(zhu)。研(yan)究人員(yuan)利用(yong)Verkko和(he)(he)hifiasm兩(liang)種算法,首(shou)次在65個(ge)基(ji)因(yin)組(zu)中高質量(liang)組(zu)裝出(chu)1,246個(ge)完整著(zhu)絲粒(li)(li),平均每個(ge)基(ji)因(yin)組(zu)約19.5個(ge)。研(yan)究發現(xian)α-衛(wei)星(xing)陣(zhen)列在長度上差(cha)異(yi)較大,并識別出(chu)4,153種新型HOR變(bian)體(ti)和(he)(he)陣(zhen)列結(jie)(jie)構,部分(fen)染(ran)色體(ti)上出(chu)現(xian)陣(zhen)列分(fen)裂(lie)現(xian)象(xiang)。通過CpG甲基(ji)化分(fen)析(xi),所有(you)著(zhu)絲粒(li)(li)均存在低甲基(ji)化區域(CDR),部分(fen)染(ran)色體(ti)呈現(xian)“雙(shuang)CDR”,提示可(ke)(ke)能(neng)存在雙(shuang)動粒(li)(li)結(jie)(jie)構。此外,約30%的(de)α-衛(wei)星(xing)陣(zhen)列中含有(you)移動元(yuan)件插(cha)(cha)入(MEI),主要為L1HS和(he)(he)Alu,大多分(fen)布在CDR之外。個(ge)別插(cha)(cha)入可(ke)(ke)能(neng)影響CDR結(jie)(jie)構,提示其在調控動粒(li)(li)定位和(he)(he)染(ran)色質結(jie)(jie)構中可(ke)(ke)能(neng)具有(you)功能(neng)作(zuo)用(yong)。

圖6 人類著絲粒中的(de)序列(lie)和結構情(qing)況

總(zong) 結

本研究通過對65個(ge)來自(zi)不同人群的(de)人類基(ji)因(yin)組(zu)進行高(gao)連續性(xing)測(ce)(ce)序與組(zu)裝,構建(jian)了130條近(jin)乎完(wan)整、無(wu)間隙的(de)單倍型基(ji)因(yin)組(zu),首次系統解(jie)析了復(fu)(fu)雜結(jie)構變(bian)異(yi)、著絲粒α衛(wei)星陣列的(de)多樣性(xing)、Y染色體結(jie)構、MHC區域(yu)的(de)多態性(xing),以及SMN1/2、AMY1/2等復(fu)(fu)雜基(ji)因(yin)座的(de)結(jie)構特征。研究還結(jie)合泛基(ji)因(yin)組(zu)圖譜(pu),顯著提升了短(duan)讀長測(ce)(ce)序數據在復(fu)(fu)雜區域(yu)的(de)基(ji)因(yin)型推斷準確(que)性(xing),為疾(ji)病關(guan)聯研究提供了更全面的(de)遺傳變(bian)異(yi)資源。