国产午夜精品无码一区二区,国产成人无码网站,日本少妇xxxx做受,欧美视频二区欧美影视,女人被躁到高潮嗷嗷叫游戏

首頁> 關于我們 >新聞中心>公司新聞>新聞詳情

三代單分子測序技術結合多種策略組裝出迄今最高質量的植物基因組

2017-06-01

與二代(dai)測(ce)(ce)序(xu)(xu)(xu)(xu)技(ji)(ji)術(shu)(shu)(shu)相比(bi),三(san)代(dai)測(ce)(ce)序(xu)(xu)(xu)(xu)技(ji)(ji)術(shu)(shu)(shu)具有(you)(you)(you)讀(du)長(chang)長(chang)、無(wu)GC偏好性的(de)(de)(de)特點(dian)(dian)。雖然目前三(san)代(dai)測(ce)(ce)序(xu)(xu)(xu)(xu)技(ji)(ji)術(shu)(shu)(shu)單條測(ce)(ce)序(xu)(xu)(xu)(xu)序(xu)(xu)(xu)(xu)列的(de)(de)(de)錯(cuo)誤率高于(yu)二代(dai)測(ce)(ce)序(xu)(xu)(xu)(xu)技(ji)(ji)術(shu)(shu)(shu),但是由于(yu)這些(xie)錯(cuo)誤都是隨機的(de)(de)(de),因(yin)此可以通過提高測(ce)(ce)序(xu)(xu)(xu)(xu)深(shen)度來有(you)(you)(you)效地減少錯(cuo)誤率。三(san)代(dai)測(ce)(ce)序(xu)(xu)(xu)(xu)技(ji)(ji)術(shu)(shu)(shu)的(de)(de)(de)這些(xie)特點(dian)(dian),使其在基(ji)因(yin)組(zu)從頭組(zu)裝(zhuang)方面大顯身手(shou),能夠(gou)(gou)有(you)(you)(you)效地提高組(zu)裝(zhuang)序(xu)(xu)(xu)(xu)列contig N50的(de)(de)(de)長(chang)度。但是想要(yao)得到染色體級(ji)別的(de)(de)(de)基(ji)因(yin)組(zu)組(zu)裝(zhuang)序(xu)(xu)(xu)(xu)列,光(guang)靠三(san)代(dai)測(ce)(ce)序(xu)(xu)(xu)(xu)技(ji)(ji)術(shu)(shu)(shu)還是不夠(gou)(gou)的(de)(de)(de),還需要(yao)借(jie)助其他的(de)(de)(de)技(ji)(ji)術(shu)(shu)(shu)手(shou)段(duan)(duan)。比(bi)較常用(yong)的(de)(de)(de)手(shou)段(duan)(duan)有(you)(you)(you)遺傳圖譜、長(chang)插(cha)入片段(duan)(duan)文庫以及光(guang)學(xue)圖譜等技(ji)(ji)術(shu)(shu)(shu)手(shou)段(duan)(duan)。

長插(cha)入(ru)片(pian)段文(wen)(wen)(wen)庫(ku)(ku)能夠(gou)(gou)(gou)跨過較(jiao)大的(de)(de)重復(fu)片(pian)段的(de)(de)區域,因(yin)(yin)(yin)(yin)而(er)在(zai)以(yi)往的(de)(de)基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)組(zu)(zu)(zu)組(zu)(zu)(zu)裝(zhuang)中都(dou)發(fa)揮(hui)著重要(yao)作用(yong)(yong)。與BAC庫(ku)(ku)等長插(cha)入(ru)片(pian)段文(wen)(wen)(wen)庫(ku)(ku)相比(bi)(bi),fosmid庫(ku)(ku)具(ju)有(you)構(gou)(gou)建(jian)時間短(duan)、花(hua)費較(jiao)低(di)(di)、基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)組(zu)(zu)(zu)覆蓋均勻等特點。將這(zhe)些長片(pian)段文(wen)(wen)(wen)庫(ku)(ku)再構(gou)(gou)建(jian)小的(de)(de)subclone,然(ran)后利用(yong)(yong)一代測序(xu)技(ji)術(shu)測序(xu)能夠(gou)(gou)(gou)獲得(de)(de)(de)精確的(de)(de)基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)組(zu)(zu)(zu)信息(clone-based 組(zu)(zu)(zu)裝(zhuang)策(ce)略(lve))。目前很(hen)多模式(shi)生物的(de)(de)基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)組(zu)(zu)(zu)都(dou)是(shi)(shi)基(ji)(ji)(ji)(ji)于(yu)這(zhe)種策(ce)略(lve)來構(gou)(gou)建(jian)的(de)(de),比(bi)(bi)如(ru)人,水(shui)(shui)稻,擬(ni)南芥等。但(dan)是(shi)(shi)這(zhe)種策(ce)略(lve)構(gou)(gou)建(jian)基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)組(zu)(zu)(zu)序(xu)列費用(yong)(yong)非常高。直接對這(zhe)種長片(pian)段文(wen)(wen)(wen)庫(ku)(ku)的(de)(de)兩端測序(xu),獲得(de)(de)(de)的(de)(de)序(xu)列能夠(gou)(gou)(gou)用(yong)(yong)于(yu)構(gou)(gou)建(jian)scaffold,提高全基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)組(zu)(zu)(zu)鳥槍法測序(xu)策(ce)略(lve)的(de)(de)組(zu)(zu)(zu)裝(zhuang)片(pian)段長度(du)。新興(xing)的(de)(de)光學圖譜技(ji)術(shu)根據內切酶(mei)酶(mei)切位點的(de)(de)信息,能夠(gou)(gou)(gou)提供幾(ji)百Kb到幾(ji)Mb范圍的(de)(de)基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)組(zu)(zu)(zu)物理圖譜。此(ci)方法獲得(de)(de)(de)的(de)(de)光學圖譜也可以(yi)用(yong)(yong)于(yu)構(gou)(gou)建(jian)scaffold,與fosmid庫(ku)(ku)相比(bi)(bi),更加(jia)快速(su),而(er)且花(hua)費低(di)(di)。但(dan)是(shi)(shi)由于(yu)短(duan)的(de)(de)contig(<100 Kb)上(shang)缺少酶(mei)切位點,因(yin)(yin)(yin)(yin)而(er)使用(yong)(yong)此(ci)種方法無法錨定到scaffold上(shang)。遺傳圖譜則能夠(gou)(gou)(gou)將contig/scaffold錨定到linkage group上(shang),使組(zu)(zu)(zu)裝(zhuang)水(shui)(shui)平(ping)達到染(ran)色(se)體級別(bie)。需要(yao)注(zhu)意(yi)的(de)(de)是(shi)(shi),如(ru)果contig/scaffold組(zu)(zu)(zu)裝(zhuang)的(de)(de)效果不(bu)好,加(jia)上(shang)遺傳圖譜,雖然(ran)可以(yi)得(de)(de)(de)到染(ran)色(se)體級別(bie)的(de)(de)基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)組(zu)(zu)(zu)組(zu)(zu)(zu)裝(zhuang)水(shui)(shui)平(ping),但(dan)是(shi)(shi)序(xu)列中會含有(you)大量的(de)(de)N。基(ji)(ji)(ji)(ji)于(yu)這(zhe)種基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)組(zu)(zu)(zu)序(xu)列的(de)(de)基(ji)(ji)(ji)(ji)因(yin)(yin)(yin)(yin)注(zhu)釋水(shui)(shui)平(ping)等都(dou)比(bi)(bi)較(jiao)低(di)(di),不(bu)利于(yu)后續功能研究。

今年5月,Nature communications在線發表了一個迄今為止最高質量的植物基因組序列。該研究組裝的物種是水稻(Oryza sativa, 2n=2x=24),品種是Shuhui498,組裝策略綜合利用了三代單分子測序技術、fosmid文庫和Bionano光學圖譜,最終組裝的序列僅有1%的缺失。水稻現有的參考基因組為日本晴(Nipponbare),是基于clone-based的策略構建的。Shuhui498最終組裝的準確性和完整性都優于日本晴。下面小編就來分享一下這篇文章,看如果利用這些技術得到了如此高質量的基因組序列。


測(ce)序策(ce)略(lve)

本研(yan)究(jiu)(jiu)獲(huo)(huo)得(de)(de)了(le)47 Gb的(de)PacBio的(de)序(xu)列,覆(fu)蓋(gai)(gai)基(ji)因(yin)(yin)(yin)組(zu)(zu)(zu)~118 X。同時構(gou)(gou)建(jian)(jian)了(le)插入片(pian)段(duan)大小為(wei)(wei)(wei)~40 Kb 的(de)fosmid文庫(ku),564個fosmid pools,每(mei)(mei)個pools有(you)~1,000個clone。對這(zhe)些(xie)fosmid文庫(ku),本研(yan)究(jiu)(jiu)采用(yong)了(le)GBS的(de)測(ce)序(xu)方(fang)法,每(mei)(mei)個tag的(de)測(ce)序(xu)深度為(wei)(wei)(wei)~3 X,共(gong)(gong)(gong)獲(huo)(huo)得(de)(de)6.3 Gb的(de)數(shu)據(ju)(ju)(ju)(ju)。本研(yan)究(jiu)(jiu)還構(gou)(gou)建(jian)(jian)了(le)Shuhui498和Nipponbare的(de)重組(zu)(zu)(zu)自交系。為(wei)(wei)(wei)了(le)構(gou)(gou)建(jian)(jian)遺(yi)傳圖(tu)譜(pu),作者挑選(xuan)了(le)F3群體(ti)中(zhong)364個個體(ti),采用(yong)GBS測(ce)序(xu)的(de)方(fang)法,每(mei)(mei)個tag的(de)測(ce)序(xu)深度為(wei)(wei)(wei)~4 X,每(mei)(mei)個個體(ti)平均測(ce)序(xu)數(shu)據(ju)(ju)(ju)(ju)為(wei)(wei)(wei)73 Mb,一共(gong)(gong)(gong)獲(huo)(huo)得(de)(de)26.9 Gb的(de)數(shu)據(ju)(ju)(ju)(ju)。本研(yan)究(jiu)(jiu)獲(huo)(huo)得(de)(de)了(le)99 Gb的(de)光(guang)(guang)學圖(tu)譜(pu)數(shu)據(ju)(ju)(ju)(ju),基(ji)因(yin)(yin)(yin)組(zu)(zu)(zu)覆(fu)蓋(gai)(gai)度為(wei)(wei)(wei)250 X。構(gou)(gou)建(jian)(jian)這(zhe)些(xie)光(guang)(guang)學圖(tu)譜(pu)的(de)分子片(pian)段(duan)>100 Kb, N50為(wei)(wei)(wei)202 Kb。這(zhe)些(xie)數(shu)據(ju)(ju)(ju)(ju)組(zu)(zu)(zu)裝后共(gong)(gong)(gong)得(de)(de)到453個genome map,總長度為(wei)(wei)(wei)406 Mb,N50為(wei)(wei)(wei)2.48 Mb。此外,本研(yan)究(jiu)(jiu)也構(gou)(gou)建(jian)(jian)了(le)插入片(pian)段(duan)為(wei)(wei)(wei)450 bp的(de)二代測(ce)序(xu)文庫(ku)并獲(huo)(huo)得(de)(de)了(le)38.7 GB的(de)測(ce)序(xu)數(shu)據(ju)(ju)(ju)(ju),覆(fu)蓋(gai)(gai)基(ji)因(yin)(yin)(yin)組(zu)(zu)(zu)~100 X。本研(yan)究(jiu)(jiu)還對多(duo)個組(zu)(zu)(zu)織進(jin)行了(le)RNA-seq,用(yong)于(yu)更好的(de)注釋基(ji)因(yin)(yin)(yin)組(zu)(zu)(zu)和評(ping)估組(zu)(zu)(zu)裝效果。具體(ti)的(de)測(ce)序(xu)策(ce)略見下表。


測序的策略


組裝策(ce)略(lve)

1. Contig構建

首先,采用PBcR pipeline對原始的(de)PacBio序(xu)(xu)(xu)列糾錯(cuo),獲得(de)16.2 Gb的(de)糾錯(cuo)后序(xu)(xu)(xu)列。然后采用PBcR的(de)low stringency (LS) 和high stringency (HS)模式、CANU和Falcon組裝糾錯(cuo)后序(xu)(xu)(xu)列。同時(shi),將(jiang)fosmid測(ce)序(xu)(xu)(xu)的(de)序(xu)(xu)(xu)列比(bi)對到糾錯(cuo)后的(de)序(xu)(xu)(xu)列上,挑選出含有(you)fosmid測(ce)序(xu)(xu)(xu)序(xu)(xu)(xu)列的(de)PacBio序(xu)(xu)(xu)列,并對每個fosmid pool的(de)序(xu)(xu)(xu)列單獨組裝,獲得(de)fosmid contig。contig組裝的(de)詳(xiang)細(xi)結果(guo)見下表:


Contig組(zu)裝的結果


2. 遺(yi)傳(chuan)圖譜(pu)構建并將contig錨(mao)定到遺(yi)傳(chuan)圖譜(pu)上(shang)

PBcR LS組裝的contig N50最長,因此被選為(wei)reference來構建(jian)遺(yi)傳圖(tu)(tu)譜(pu)。該(gai)(gai)遺(yi)傳圖(tu)(tu)譜(pu)共獲得12個(ge)linkage group (LG)。497個(ge)contig錨定到(dao)了該(gai)(gai)遺(yi)傳圖(tu)(tu)譜(pu)上,序列總(zong)長為(wei)355.9 Mb。


3. Super-contig構建(jian)

被錨定到遺傳圖譜上的(de)(de)(de)497個(ge)contig,被進(jin)一步連(lian)(lian)成(cheng)(cheng)super-contig。原(yuan)理(li)就(jiu)是如果(guo)fosmid contig與兩個(ge)contig有overlap,那(nei)么(me)這(zhe)兩個(ge)contig就(jiu)被連(lian)(lian)成(cheng)(cheng)一個(ge)super-contig。全(quan)基因組組裝(zhuang)的(de)(de)(de)時(shi)候,也會產生(sheng)一些(xie)錯(cuo)誤(wu)的(de)(de)(de)contig。這(zhe)些(xie)contig也能夠在super-contig構(gou)建的(de)(de)(de)過程中被糾正。原(yuan)理(li)就(jiu)是如果(guo)一個(ge)contig與周圍(wei)的(de)(de)(de)contig有overlap,而且(qie)這(zhe)個(ge)overlap也被fosmid contig驗證,那(nei)么(me)這(zhe)個(ge)contig就(jiu)會在有overlap的(de)(de)(de)地(di)方分開,分成(cheng)(cheng)多個(ge)contig。具體(ti)的(de)(de)(de)原(yuan)理(li)圖見(jian)下圖:


Super-contig構建(jian)的原理


4. Super-contig糾錯(cuo)

Bionano構(gou)建的(de)genome map被用于(yu)super-contig的(de)糾錯。作者首先查看了著絲粒(li)和(he)近端(duan)粒(li)區域(yu),發現著絲粒(li)區域(yu)與genome map完全(quan)一致,而24個近端(duan)粒(li)區域(yu)中有21個與genome map一致。然后Quiver被用于(yu)來糾正2 Kb的組裝錯誤。


5. 組裝效果評估(gu)

將Illumina DNA的短序(xu)列(lie),RNA-seq的數據(ju)比(bi)對到組裝(zhuang)的基(ji)因組上,評估(gu)出基(ji)因組組裝(zhuang)的堿基(ji)錯(cuo)誤率<0.0017%。這(zhe)(zhe)個錯(cuo)誤率低于水(shui)稻現有(you)(you)(you)的參考基(ji)因組日本(ben)晴的序(xu)列(lie)。而存(cun)在于最(zui)終(zhong)組裝(zhuang)序(xu)列(lie)的fosmid contig的堿基(ji)錯(cuo)誤率為0.0017%,略高(gao)于其它區域,可能是以為這(zhe)(zhe)些區域含有(you)(you)(you)高(gao)重復序(xu)列(lie)。基(ji)于這(zhe)(zhe)個比(bi)對結果和genome map的比(bi)對結果,大約有(you)(you)(you)1%的序(xu)列(lie)未組裝(zhuang)到最(zui)終(zhong)的基(ji)因組序(xu)列(lie)中。


Shuhui498與(yu)日本晴(qing)基因組比較

比(bi)較(jiao)Shuhui498與日(ri)本晴基(ji)因(yin)(yin)組(zu)序(xu)列(lie),發現(xian)Shuhui498的著絲粒區域更完整、含有(you)更少(shao)的葉(xie)綠體和線粒體序(xu)列(lie)。并且,二(er)者(zhe)(zhe)在(zai)染色體上的相似(si)性非常高(gao),不過也存在(zai)~250萬個(ge)SNP和很多的大片(pian)段結構變異(具體見下圖)。比(bi)較(jiao)二(er)者(zhe)(zhe)的基(ji)因(yin)(yin)序(xu)列(lie)發現(xian),二(er)者(zhe)(zhe)只有(you)~27%的基(ji)因(yin)(yin)蛋白質(zhi)序(xu)列(lie)完全一(yi)致。雖然二(er)者(zhe)(zhe)的重(zhong)復序(xu)列(lie)比(bi)例一(yi)致,但是(shi)重(zhong)復序(xu)列(lie)的內容卻不一(yi)樣。



Shuhui498與其它水稻基(ji)因組比較(jiao)

最后,本研究(jiu)比(bi)較了Shuhui498基(ji)因(yin)(yin)組(zu)(zu)和(he)其它(ta)17個 高覆蓋測序(xu)的水稻基(ji)因(yin)(yin)組(zu)(zu)序(xu)列。Shuhui498與(yu)同屬于(yu)秈稻的MH63 和(he) ZS97基(ji)因(yin)(yin)組(zu)(zu)更相似。同時,本研究(jiu)鑒(jian)定(ding)了Shuhui498和(he)日本晴基(ji)因(yin)(yin)組(zu)(zu)中相對(dui)于(yu)其它(ta)水稻基(ji)因(yin)(yin)組(zu)(zu)的presence variation (PV),發現PV廣泛存在。


總結

利用三代單(dan)分子(zi)測序技術(shu),再結合長插入片段文庫、光學圖譜(pu)和遺傳圖譜(pu)數據,本研究構建了一(yi)個僅有1%缺(que)失的(de)基因組序列,是迄今(jin)為止(zhi)質量最(zui)高的(de)植物基因組。



參考文獻:

Du H, et al. Sequencing and de novo assembly of a near complete indica rice genome. Nat Commun. 2017, 8:15324. doi: 10.1038/ncomms15324.