2020-06-19
長久以來,困擾著無數科研人(ren)員的(de)(de)難題(ti)之一就是(shi)樣本(ben)總量不足。很多時候,有了好的(de)(de)想(xiang)法,但樣本(ben)的(de)(de)獲(huo)得卻(que)受諸多條件的(de)(de)限制(zhi),比如(ru)樣品(pin)珍貴、樣品(pin)來源稀缺、組織大小本(ben)身受限、或者含(han)量極少的(de)(de)微生物(wu)、細胞等等。對于此類樣本(ben),想(xiang)進行(xing)基因組測(ce)序是(shi)非常困難的(de)(de)。
在保留(liu)傳(chuan)統測序(xu)文庫(ku)構建(jian)優(you)勢的基礎上,我(wo)們不斷優(you)化建(jian)庫(ku)流程(cheng),力求(qiu)用(yong)較少的樣本獲得較高的文庫(ku)轉化效率。以往常規全基因組(zu)PE建(jian)庫(ku)一(yi)次投入的DNA總量(liang)需要500ng以上,隨著實驗(yan)方(fang)案的不斷優(you)化,現(xian)在我(wo)們能夠(gou)做(zuo)到以300ng起(qi)始建(jian)庫(ku)。
但即便如此,仍然會有很多(duo)老師的樣本無法滿足建庫要求。針對此種情(qing)況,我(wo)們進(jin)(jin)一步(bu)改進(jin)(jin)建庫方(fang)案,目(mu)前派森諾已有兩(liang)套完善(shan)有效的微量建庫方(fang)案可以對最(zui)低5ng起始(shi)量的DNA進(jin)(jin)行常規(gui)PE文(wen)庫構建。
本文(wen)就帶大(da)家了解(jie)下我們全新推(tui)出的兩(liang)種微量建庫(ku)方(fang)案:
一種是先通過全基因組擴增(whole genome amplification, WGA)無序列傾向性的富集基因組DNA,隨后進行正常建庫;另一種是對微量DNA直接建庫測序。
1.1、微(wei)量擴增方案
全(quan)基因組擴增指的(de)(de)是對全(quan)基因組通過擴增的(de)(de)方法(fa)增加DNA的(de)(de)總量。目前(qian)有(you)很多(duo)種可用于全(quan)基因組擴增的(de)(de)技(ji)術方法(fa),總體(ti)有(you)兩類(lei),一類(lei)是基于熱循環PCR的(de)(de)擴增方式如(ru)LA- PCR(linker adaptor PCR)、T- PCR(Tagged PCR)、DOP- PCR(degenerate oligonucleotide- primed PCR,)等(deng);另一類(lei)則是不依賴(lai)PCR擴增的(de)(de)方法(fa)如(ru)多(duo)重鏈置換擴增(Multiple Displacement Amplification, MDA)等(deng)。
第(di)一類(lei)方(fang)法由于用到(dao)(dao)熱循環PCR擴(kuo)(kuo)(kuo)增(zeng)(zeng),擴(kuo)(kuo)(kuo)增(zeng)(zeng)過程中存在一定程度的偏(pian)好性,最終擴(kuo)(kuo)(kuo)增(zeng)(zeng)結(jie)果對全(quan)基因(yin)組的覆蓋度有限(xian)并造(zao)成部分(fen)區域相對增(zeng)(zeng)多,且這(zhe)類(lei)方(fang)法常用到(dao)(dao)Taq DNA聚合酶,擴(kuo)(kuo)(kuo)增(zeng)(zeng)長(chang)度很難超(chao)過3K、保真性有限(xian)。
多(duo)重置換(huan)擴(kuo)(kuo)增(zeng)(zeng)(MDA)是1998年由耶魯大(da)學Lizardi博士(shi)首次提出。這種恒(heng)溫(wen)擴(kuo)(kuo)增(zeng)(zeng)的(de)(de)方法依賴于(yu)鏈置換(huan)擴(kuo)(kuo)增(zeng)(zeng)原(yuan)理,利用噬菌體Phi29 DNA聚合(he)(he)酶(mei)(mei),高(gao)度(du)擴(kuo)(kuo)增(zeng)(zeng)DNA。該酶(mei)(mei)具有極(ji)強的(de)(de)模板結(jie)合(he)(he)能力,能克服(fu)很(hen)多(duo)DNA復(fu)雜結(jie)構如發卡環(huan)等,連續擴(kuo)(kuo)增(zeng)(zeng)100kb的(de)(de)DNA模板而不(bu)解(jie)離;同時這種酶(mei)(mei)具有極(ji)強的(de)(de)3’-5’外切酶(mei)(mei)活性(xing),其保(bao)真度(du)是Taq酶(mei)(mei)的(de)(de)1000倍(bei)。Phi29 DNA聚合(he)(he)酶(mei)(mei)強大(da)的(de)(de)延伸(shen)活性(xing)和高(gao)保(bao)真度(du)使得通(tong)過MDA可從(cong)極(ji)少量的(de)(de)DNA樣本獲取大(da)量高(gao)質量的(de)(de)DNA(通(tong)常以5ng起始最(zui)終(zhong)能得到(dao)5-20ug的(de)(de)DNA),MDA擴(kuo)(kuo)增(zeng)(zeng)產(chan)物(wu)可達(da)到(dao)95%以上(shang)的(de)(de)覆(fu)蓋度(du),擴(kuo)(kuo)增(zeng)(zeng)產(chan)物(wu)大(da)小平(ping)均大(da)于(yu)20 kb,可廣(guang)泛適用于(yu)全(quan)基因(yin)組(zu)和外顯(xian)子(zi)測序、大(da)片(pian)段(duan)拷貝數變異(yi)分(fen)析(xi)、微(wei)衛星分(fen)析(xi)、qPCR分(fen)析(xi)、基因(yin)芯片(pian)分(fen)析(xi),是目(mu)前為(wei)止對整個基因(yin)組(zu)覆(fu)蓋最(zui)廣(guang)、各位(wei)點擴(kuo)(kuo)增(zeng)(zeng)偏好最(zui)小的(de)(de)WGA方法。
MDA主(zhu)要用到phi29 DNA聚合酶和硫代修飾(shi)的(de)(de)(de)六堿基隨機(ji)引物。在(zai)恒溫條件下(xia),隨機(ji)引物在(zai)多個位點與模板退(tui)火(huo),隨后(hou)在(zai)phi29 DNA聚合酶作(zuo)用下(xia)啟動復制反應;沿模板合成的(de)(de)(de)新鏈在(zai)延(yan)伸(shen)過程中(zhong)從模板中(zhong)置換(huan)出(chu)下(xia)游已(yi)復制的(de)(de)(de)DNA鏈,被(bei)置換(huan)出(chu)的(de)(de)(de)DNA鏈又作(zuo)為新的(de)(de)(de)模板,在(zai)phi29 DNA和隨機(ji)引物的(de)(de)(de)作(zuo)用下(xia)繼(ji)續合成新的(de)(de)(de)DNA鏈直(zhi)至引物和原料(liao)耗盡達到擴增反應的(de)(de)(de)最大濃度(如圖一所示(shi))。最終得到的(de)(de)(de)DNA可以直(zhi)接(jie)用于后(hou)續分子(zi)實(shi)驗。
圖一 MDA反應示意圖
1.2、全基(ji)因組DNA直接微(wei)量(liang)建庫方案
MDA能(neng)得(de)到高(gao)(gao)質(zhi)量的(de)可直(zhi)接用于(yu)建(jian)庫(ku)的(de)DNA,但(dan)(dan)也有(you)其局(ju)限性(xing)。第一(yi),MDA對模板的(de)靈敏度(du)(du)極高(gao)(gao),提取(qu)(qu)到的(de)DNA或(huo)者(zhe)在(zai)MDA擴增(zeng)中如(ru)(ru)果(guo)有(you)任何輕(qing)微異源污染都會在(zai)后續(xu)擴增(zeng)中成倍(bei)放大,所以其對整個實(shi)驗階段要求(qiu)極高(gao)(gao)。第二,目前雖然有(you)95%的(de)覆蓋率和(he)高(gao)(gao)保真(zhen)性(xing),但(dan)(dan)和(he)直(zhi)接提取(qu)(qu)的(de)DNA仍然有(you)一(yi)定的(de)區別。第三,MDA方(fang)案對DNA的(de)完(wan)整性(xing)和(he)純(chun)度(du)(du)有(you)極高(gao)(gao)的(de)要求(qiu);如(ru)(ru)果(guo)完(wan)整度(du)(du)和(he)純(chun)度(du)(du)不足,擴增(zeng)后會存(cun)在(zai)部(bu)分(fen)染色體錯(cuo)位或(huo)等位基因(yin)丟失的(de)現(xian)象(xiang),這(zhe)對提取(qu)(qu)的(de)要求(qiu)就會很高(gao)(gao)。通過優化MDA的(de)實(shi)驗方(fang)案能(neng)夠在(zai)一(yi)定程(cheng)度(du)(du)上(shang)改善這(zhe)些問題,但(dan)(dan)直(zhi)接將原始DNA用于(yu)后續(xu)建(jian)庫(ku)測序實(shi)驗顯然是更有(you)效的(de)方(fang)案。
根(gen)據以往優化實(shi)驗中積累的(de)(de)(de)大(da)量經驗,我們開(kai)發了(le)一套派森諾獨有的(de)(de)(de)直接以極低(di)起始量DNA為模(mo)板進行(xing)建庫(ku)(ku)的(de)(de)(de)方(fang)案。經過(guo)大(da)量實(shi)際上機測試,微量建庫(ku)(ku)結果(guo)與高起始量的(de)(de)(de)常規(gui)建庫(ku)(ku)結果(guo)高度一致。
使用相同樣品(水稻(dao)葉片)同時使用兩種方案建(jian)庫:300ng起(qi)始量(liang)(liang)和5ng起(qi)始量(liang)(liang)建(jian)庫上機(ji)。我(wo)們分別從文庫質量(liang)(liang)、下機(ji)數(shu)據質量(liang)(liang)、與參考(kao)基因組比對率幾個方面(mian)進行比較兩種建(jian)庫方案。
1.2.1、文庫(ku)質檢(jian)
對文庫(ku)(ku)分別用qubit(ng/ul)和(he)qPCR(nM)兩種方式定量,使用labchip對文庫(ku)(ku)的大小檢(jian)測(表一(yi)、圖二、圖三所示)。根(gen)據(ju)質檢(jian)結果,兩種方案(an)最終(zhong)文庫(ku)(ku)質量基本一(yi)致,文庫(ku)(ku)大小均(jun)集中在500bp左右。
表一 文庫濃度詳(xiang)表
圖二 微量文庫labchip檢測結果
圖三(san) 常規文庫labchip檢測結果
1.2.2、下(xia)機數據質(zhi)量(liang)比較
將兩種文庫同時測序,按照6G/樣上機,上機模式為Novaseq PE150。分別對兩個文庫的下機數據進行統計,結果如表二所示。兩個文庫的下機數據量均在6G以上,N(%)比例、GC含量正常;Q30高,數據可信度高。
Sample:樣品名;
Reads Num.:Reads 總數;
Total Bases(bp):堿(jian)基(ji)總數(shu);
N(%):模(mo)糊堿基所占百分比;
GC(%):GC 含量;
Q20(%):堿(jian)基(ji)識別準確率在 99%以上的堿(jian)基(ji)所占(zhan)百分比;
Q30(%):堿基(ji)識別準確率(lv)在 99.9%以上(shang)的堿基(ji)所占百分比。
表(biao)二 測序數據統計
1.2.3、高質量數據(ju)獲(huo)取
將(jiang)原始下機數據(raw data)過濾(lv)生(sheng)成高(gao)質量序(xu)列(high quality data)。數據過濾(lv)的基本情(qing)況見表三。
Sample:樣品名;
Reads Num.:Reads 總數;
Total Bases(bp):堿基總(zong)數;
N(%):模糊堿基所占百分比;
GC(%):GC 含量;
Q20(%):堿基(ji)識(shi)別準確率(lv)在(zai) 99%以上的堿基(ji)所占百分(fen)比;
Q30(%):堿基(ji)識別準確率(lv)在 99.9%以上的堿基(ji)所占百分比。
表三 測序數(shu)據過濾統計(ji)
1.2.4、序(xu)列比對(dui)
將過濾后得到(dao)的高質(zhi)量數(shu)據比對(dui)到(dao)參考(kao)基因組上(shang)。序列比對(dui)結果統計(ji)見表四。
Sample:樣(yang)本名;
HQ reads:過濾后(hou)的高(gao)質量 reads 數量;
Mapped reads:比對至參考(kao)基(ji)因組上的(de) reads 數量(包(bao)括(kuo)單(dan)端(duan)比對和雙端(duan)比對);
Mapping rate:比(bi)對率,比(bi)對至參考基(ji)因組上的 reads 數量占總 reads 數量的百分比(bi)。
表四 序(xu)列比對結果統(tong)計(ji)
根據(ju)(ju)下(xia)(xia)機數據(ju)(ju)結(jie)果(guo)對(dui)比(bi)顯示(shi),兩種方案的(de)文庫(ku)質量(liang)、下(xia)(xia)機數據(ju)(ju)質量(liang)基(ji)本一(yi)致(zhi),過(guo)濾后的(de)高質量(liang)數據(ju)(ju)在(zai)參考基(ji)因(yin)組上的(de)比(bi)對(dui)率(lv)基(ji)本一(yi)致(zhi)。除(chu)水稻等大型植(zhi)物(wu)外,我們還對(dui)動物(wu)、微生物(wu)、環境等多種不同類型樣(yang)本進行建庫(ku)上機測試(shi),微量(liang)方案和常規方案在(zai)文庫(ku)質量(liang)、下(xia)(xia)機數據(ju)(ju)質量(liang)等方面(mian)都保持一(yi)致(zhi),在(zai)此就不一(yi)一(yi)贅(zhui)述~
以上便是派(pai)森諾對于低起(qi)始量模板的(de)(de)兩種建(jian)庫(ku)方(fang)案。微(wei)量擴增方(fang)案對樣(yang)品(pin)和操作環境要求高,需要最大可(ke)能避(bi)免外源樣(yang)品(pin)的(de)(de)污染(ran),這對取(qu)樣(yang)、提取(qu)、建(jian)庫(ku)環節都有著極高的(de)(de)要求。
全基(ji)因(yin)組DNA直接微(wei)量(liang)(liang)建(jian)庫優勢在于使用了提取(qu)后的原始DNA,能保證(zheng)微(wei)量(liang)(liang)建(jian)庫結果和正常(chang)高(gao)起始量(liang)(liang)建(jian)庫測(ce)序結果一致。