2024-10-12
單細胞(bao)RNA測(ce)序(scRNA-seq)被越來越多(duo)地用于(yu)研究植(zhi)物(wu)中由基(ji)(ji)因(yin)(yin)表達和細胞(bao)類型組成的(de)物(wu)種間差(cha)異(yi)。隨著大量植(zhi)物(wu)scRNA-seq數據發(fa)表,植(zhi)物(wu)的(de)獨特多(duo)樣性使物(wu)種之間的(de)比較評估變得重(zhong)要。但(dan)是與哺乳動物(wu)不(bu)同,在哺乳動物(wu)中同源基(ji)(ji)因(yin)(yin)和結構很容易被識別,植(zhi)物(wu)基(ji)(ji)因(yin)(yin)家族經常(chang)通過全基(ji)(ji)因(yin)(yin)組復制、多(duo)倍體化(hua)和串聯基(ji)(ji)因(yin)(yin)復制來進(jin)行(xing)擴展,使得識別一對(dui)一的(de)同源基(ji)(ji)因(yin)(yin)變得困難,從而阻礙了(le)進(jin)行(xing)跨物(wu)種比較分析。
2024年6月27日美國紐約冷(leng)泉港冷(leng)泉港實驗室基因(yin)組學部在(zai)(zai)《nature plants》上(shang)發表了一(yi)篇關(guan)于植物跨物種單細胞數據整合的(de)文章(IF:15.8):Coexpression enhances cross-species integration of single-cell RNA sequencing across diverse plant species。這項研究旨在(zai)(zai)通(tong)過使用共(gong)表達(da)來識別基因(yin)對,從而解決植物跨物種單細胞數據整合的(de)難題(ti)。這些(xie)基因(yin)對雖(sui)然不是排他性(xing)的(de)直(zhi)系同源物,但在(zai)(zai)功能(neng)上(shang)足夠相關(guan),能(neng)夠整合這些(xie)高維(wei)數據。通(tong)過減少整合的(de)障礙,為發現對植物適應和馴化至關(guan)重(zhong)要的(de)新(xin)型細胞類型特異性(xing)創新(xin)奠定了基礎。
技術(shu)方法及結果
該(gai)方法的(de)(de)本質是(shi)使(shi)用(yong)(yong)以前批量RNA測序數(shu)(shu)(shu)(shu)據(ju)分析來定義跨物(wu)(wu)(wu)種基(ji)因對(dui)(dui)(dui)(即,共表達(da)代(dai)理),這(zhe)些(xie)基(ji)因對(dui)(dui)(dui)可以應(ying)用(yong)(yong)于更(geng)具體(ti)但更(geng)稀(xi)疏(shu)的(de)(de)單細胞(bao)數(shu)(shu)(shu)(shu)據(ju)。通(tong)過利用(yong)(yong)由16000多(duo)個公開可用(yong)(yong)的(de)(de)RNA測序數(shu)(shu)(shu)(shu)據(ju)集構建(jian)的(de)(de)穩健共表達(da)網(wang)絡(luo),以及OrthoDB v11的(de)(de)基(ji)因系統(tong)發育(yu),共表達(da)代(dai)理準確(que)反映了它(ta)們(men)從10,11中(zhong)提取的(de)(de)每個物(wu)(wu)(wu)種對(dui)(dui)(dui)的(de)(de)潛在生(sheng)物(wu)(wu)(wu)學,同時共表達(da)數(shu)(shu)(shu)(shu)據(ju)和(he)基(ji)因系統(tong)發育(yu)識別了擴展(zhan)一(yi)對(dui)(dui)(dui)一(yi)基(ji)因空間的(de)(de)基(ji)因對(dui)(dui)(dui),改善了已知細胞(bao)類型之間的(de)(de)數(shu)(shu)(shu)(shu)據(ju)整(zheng)合和(he)比對(dui)(dui)(dui),并突出了物(wu)(wu)(wu)種之間的(de)(de)新細胞(bao)(圖1-a)。通(tong)過進一(yi)步(bu)的(de)(de)改進整(zheng)合,此方法也(ye)成功能(neng)夠在它(ta)們(men)的(de)(de)scRNA-seq數(shu)(shu)(shu)(shu)據(ju)中(zhong)識別新的(de)(de)和(he)保守的(de)(de)細胞(bao)類型。
圖(tu)1
實例一(yi)
整合擬南芥單細胞數(shu)據集分割(ge)成兩個偽“物種(zhong)”
第一(yi)個“物(wu)種”是通(tong)過隨(sui)(sui)機選(xuan)擇一(yi)半(ban)的(de)(de)(de)(de)(de)(de)(de)細(xi)(xi)(xi)胞(bao)(bao)和一(yi)半(ban)的(de)(de)(de)(de)(de)(de)(de)基(ji)(ji)(ji)因(yin)(yin)(yin)組(zu)(zu)產(chan)生的(de)(de)(de)(de)(de)(de)(de)。對(dui)于(yu)這(zhe)(zhe)些細(xi)(xi)(xi)胞(bao)(bao),基(ji)(ji)(ji)因(yin)(yin)(yin)組(zu)(zu)的(de)(de)(de)(de)(de)(de)(de)后(hou)半(ban)部分(fen)被移除(chu)。然后(hou),取出剩余的(de)(de)(de)(de)(de)(de)(de)細(xi)(xi)(xi)胞(bao)(bao),這(zhe)(zhe)些細(xi)(xi)(xi)胞(bao)(bao)將(jiang)成(cheng)(cheng)為(wei)第二個“物(wu)種”,并(bing)去除(chu)第一(yi)組(zu)(zu)細(xi)(xi)(xi)胞(bao)(bao)中(zhong)存在(zai)(zai)的(de)(de)(de)(de)(de)(de)(de)一(yi)半(ban)基(ji)(ji)(ji)因(yin)(yin)(yin)組(zu)(zu)(圖(tu)2-a)。接(jie)著,確(que)定(ding)(ding)(ding)了兩(liang)(liang)個子集基(ji)(ji)(ji)因(yin)(yin)(yin)組(zu)(zu)之(zhi)間(jian)(jian)的(de)(de)(de)(de)(de)(de)(de)共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)代(dai)理(li)(li)(li)(li),找(zhao)到(dao)了具(ju)有(you)相(xiang)(xiang)似表(biao)(biao)(biao)達(da)(da)(da)譜(pu)(pu)(pu)(pu)的(de)(de)(de)(de)(de)(de)(de)基(ji)(ji)(ji)因(yin)(yin)(yin)對(dui)。例如(ru),所選(xuan)的(de)(de)(de)(de)(de)(de)(de)共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)代(dai)理(li)(li)(li)(li)基(ji)(ji)(ji)因(yin)(yin)(yin)AT1G16150與靶基(ji)(ji)(ji)因(yin)(yin)(yin)AT1G1610的(de)(de)(de)(de)(de)(de)(de)表(biao)(biao)(biao)達(da)(da)(da)譜(pu)(pu)(pu)(pu)非常匹(pi)配。相(xiang)(xiang)比之(zhi)下,來自同(tong)一(yi)直系(xi)同(tong)源家(jia)族的(de)(de)(de)(de)(de)(de)(de)被排斥基(ji)(ji)(ji)因(yin)(yin)(yin)AT4G31100具(ju)有(you)不同(tong)的(de)(de)(de)(de)(de)(de)(de)表(biao)(biao)(biao)達(da)(da)(da)譜(pu)(pu)(pu)(pu)(圖(tu)2-b)。最(zui)后(hou),使用(yong)(yong)(yong)Scanorama v1.7.113以(yi)及(ji)(ji)找(zhao)到(dao)的(de)(de)(de)(de)(de)(de)(de)共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)代(dai)理(li)(li)(li)(li)對(dui)擬南芥(jie)的(de)(de)(de)(de)(de)(de)(de)數(shu)(shu)據集進行重(zhong)新整(zheng)(zheng)(zheng)(zheng)合(he)(he)(he)和重(zhong)新聚(ju)類,將(jiang)82%的(de)(de)(de)(de)(de)(de)(de)細(xi)(xi)(xi)胞(bao)(bao)與兩(liang)(liang)個數(shu)(shu)據集的(de)(de)(de)(de)(de)(de)(de)細(xi)(xi)(xi)胞(bao)(bao)組(zu)(zu)合(he)(he)(he)在(zai)(zai)一(yi)起(qi)(圖(tu)2-c),其(qi)(qi)中(zhong)75%匹(pi)配了相(xiang)(xiang)同(tong)細(xi)(xi)(xi)胞(bao)(bao)類型的(de)(de)(de)(de)(de)(de)(de)細(xi)(xi)(xi)胞(bao)(bao)。為(wei)了評估(gu)基(ji)(ji)(ji)因(yin)(yin)(yin)代(dai)理(li)(li)(li)(li)的(de)(de)(de)(de)(de)(de)(de)成(cheng)(cheng)功在(zai)(zai)多(duo)大(da)程(cheng)度上(shang)取決于(yu)基(ji)(ji)(ji)因(yin)(yin)(yin)系(xi)統(tong)發育的(de)(de)(de)(de)(de)(de)(de)信息(xi),以(yi)及(ji)(ji)有(you)多(duo)少(shao)信息(xi)來自共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)保守譜(pu)(pu)(pu)(pu),我(wo)(wo)(wo)們試圖(tu)使用(yong)(yong)(yong)每(mei)個直系(xi)同(tong)源組(zu)(zu)中(zhong)被拒(ju)絕(jue)最(zui)差的(de)(de)(de)(de)(de)(de)(de)代(dai)理(li)(li)(li)(li)(即(ji)共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)最(zui)低的(de)(de)(de)(de)(de)(de)(de)代(dai)理(li)(li)(li)(li))整(zheng)(zheng)(zheng)(zheng)合(he)(he)(he)數(shu)(shu)據集,細(xi)(xi)(xi)胞(bao)(bao)的(de)(de)(de)(de)(de)(de)(de)成(cheng)(cheng)功匹(pi)配率降低到(dao)65%(圖(tu)2-d)。為(wei)了確(que)定(ding)(ding)(ding)單獨(du)的(de)(de)(de)(de)(de)(de)(de)序(xu)列相(xiang)(xiang)似性是否足夠(gou),我(wo)(wo)(wo)們計算(suan)了每(mei)個擬南芥(jie)基(ji)(ji)(ji)因(yin)(yin)(yin)的(de)(de)(de)(de)(de)(de)(de)成(cheng)(cheng)對(dui)蛋白質序(xu)列相(xiang)(xiang)似性,并(bing)試圖(tu)用(yong)(yong)(yong)它(ta)來鑒定(ding)(ding)(ding)基(ji)(ji)(ji)因(yin)(yin)(yin)代(dai)理(li)(li)(li)(li)。雖(sui)然能夠(gou)比隨(sui)(sui)機表(biao)(biao)(biao)現更好,但在(zai)(zai)重(zhong)新整(zheng)(zheng)(zheng)(zheng)合(he)(he)(he)分(fen)割數(shu)(shu)據集方面,這(zhe)(zhe)一(yi)指標比共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)更差,并(bing)且完全無(wu)法(fa)(fa)重(zhong)新整(zheng)(zheng)(zheng)(zheng)合(he)(he)(he)某些集群。最(zui)后(hou),我(wo)(wo)(wo)們嘗試使用(yong)(yong)(yong)1900個隨(sui)(sui)機基(ji)(ji)(ji)因(yin)(yin)(yin)對(dui)進行整(zheng)(zheng)(zheng)(zheng)合(he)(he)(he),發現我(wo)(wo)(wo)們無(wu)法(fa)(fa)整(zheng)(zheng)(zheng)(zheng)合(he)(he)(he)(圖(tu)2-e)。進一(yi)步評估(gu)我(wo)(wo)(wo)們的(de)(de)(de)(de)(de)(de)(de)共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)代(dai)理(li)(li)(li)(li),我(wo)(wo)(wo)們評估(gu)了被拒(ju)絕(jue)和選(xuan)定(ding)(ding)(ding)的(de)(de)(de)(de)(de)(de)(de)基(ji)(ji)(ji)因(yin)(yin)(yin)對(dui)在(zai)(zai)每(mei)個基(ji)(ji)(ji)因(yin)(yin)(yin)的(de)(de)(de)(de)(de)(de)(de)基(ji)(ji)(ji)礎上(shang)在(zai)(zai)細(xi)(xi)(xi)胞(bao)(bao)類型中(zhong)顯示相(xiang)(xiang)同(tong)表(biao)(biao)(biao)達(da)(da)(da)的(de)(de)(de)(de)(de)(de)(de)程(cheng)度。發現,在(zai)(zai)不同(tong)細(xi)(xi)(xi)胞(bao)(bao)類型中(zhong),被接(jie)受的(de)(de)(de)(de)(de)(de)(de)共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)代(dai)理(li)(li)(li)(li)更接(jie)近靶的(de)(de)(de)(de)(de)(de)(de)表(biao)(biao)(biao)達(da)(da)(da)譜(pu)(pu)(pu)(pu),而被拒(ju)絕(jue)的(de)(de)(de)(de)(de)(de)(de)代(dai)理(li)(li)(li)(li)平(ping)均距(ju)離靶的(de)(de)(de)(de)(de)(de)(de)表(biao)(biao)(biao)達(da)(da)(da)高83%(圖(tu)2-f)。這(zhe)(zhe)表(biao)(biao)(biao)明(ming),與同(tong)一(yi)正交組(zu)(zu)的(de)(de)(de)(de)(de)(de)(de)其(qi)(qi)他基(ji)(ji)(ji)因(yin)(yin)(yin)相(xiang)(xiang)比,共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)代(dai)理(li)(li)(li)(li)在(zai)(zai)表(biao)(biao)(biao)達(da)(da)(da)譜(pu)(pu)(pu)(pu)上(shang)與其(qi)(qi)靶基(ji)(ji)(ji)因(yin)(yin)(yin)更相(xiang)(xiang)似。此(ci)外,運用(yong)(yong)(yong)此(ci)方法(fa)(fa)在(zai)(zai)13種植物(wu)物(wu)種之(zhi)間(jian)(jian)生成(cheng)(cheng)了共(gong)(gong)(gong)表(biao)(biao)(biao)達(da)(da)(da)代(dai)理(li)(li)(li)(li),并(bing)在(zai)(zai)物(wu)種之(zhi)間(jian)(jian)平(ping)均鑒定(ding)(ding)(ding)出5750個基(ji)(ji)(ji)因(yin)(yin)(yin)對(dui)(圖(tu)2-g)。
實例二
整合玉米(mi)以及水稻的單細(xi)胞數(shu)據
使(shi)(shi)(shi)用(yong)共(gong)表(biao)(biao)(biao)(biao)達(da)代(dai)(dai)理(li)(li),成(cheng)(cheng)功地(di)整(zheng)(zheng)(zheng)(zheng)合(he)(he)了玉米(mi)和(he)水稻數(shu)據集(ji)(主要針對(dui)四(si)種廣泛的(de)(de)(de)(de)(de)(de)細(xi)(xi)胞(bao)(bao)(bao)類(lei)型(xing)),將36%的(de)(de)(de)(de)(de)(de)細(xi)(xi)胞(bao)(bao)(bao)與(yu)兩個(ge)(ge)數(shu)據集(ji)的(de)(de)(de)(de)(de)(de)細(xi)(xi)胞(bao)(bao)(bao)準確地(di)整(zheng)(zheng)(zheng)(zheng)合(he)(he)成(cheng)(cheng)簇(圖3-a)。其余的(de)(de)(de)(de)(de)(de)細(xi)(xi)胞(bao)(bao)(bao)差異(yi)很大(da),在不同(tong)物(wu)種中仍然(ran)表(biao)(biao)(biao)(biao)現為(wei)(wei)不同(tong)的(de)(de)(de)(de)(de)(de)亞群。雖然(ran)這遠未達(da)到100%,但確實存在真正的(de)(de)(de)(de)(de)(de)跨(kua)物(wu)種差異(yi),因(yin)(yin)此尚不清楚最(zui)大(da)合(he)(he)理(li)(li)的(de)(de)(de)(de)(de)(de)整(zheng)(zheng)(zheng)(zheng)合(he)(he)百分(fen)比(bi)是(shi)多少。重要的(de)(de)(de)(de)(de)(de)是(shi),整(zheng)(zheng)(zheng)(zheng)合(he)(he)比(bi)僅(jin)使(shi)(shi)(shi)用(yong)1-1個(ge)(ge)基(ji)因(yin)(yin)對(dui)要好,后者只整(zheng)(zheng)(zheng)(zheng)合(he)(he)了14%的(de)(de)(de)(de)(de)(de)細(xi)(xi)胞(bao)(bao)(bao)(圖3-b)。為(wei)(wei)了逐個(ge)(ge)細(xi)(xi)胞(bao)(bao)(bao)類(lei)型(xing)評(ping)估整(zheng)(zheng)(zheng)(zheng)合(he)(he)情況,使(shi)(shi)(shi)用(yong)了MetaNeighbor v3.19,量化細(xi)(xi)胞(bao)(bao)(bao)類(lei)型(xing)在統(tong)計(ji)框架(jia)中跨(kua)數(shu)據集(ji)復制(zhi)的(de)(de)(de)(de)(de)(de)程(cheng)度。比(bi)較了使(shi)(shi)(shi)用(yong)scGen的(de)(de)(de)(de)(de)(de)四(si)種集(ji)成(cheng)(cheng)——利用(yong)共(gong)表(biao)(biao)(biao)(biao)達(da)代(dai)(dai)理(li)(li)和(he)1-1基(ji)因(yin)(yin),僅(jin)使(shi)(shi)(shi)用(yong)共(gong)表(biao)(biao)(biao)(biao)達(da)代(dai)(dai)理(li)(li),僅(jin)使(shi)(shi)(shi)用(yong)1-1個(ge)(ge)基(ji)因(yin)(yin)和(he)使(shi)(shi)(shi)用(yong)隨機基(ji)因(yin)(yin)(圖3-c)。可(ke)以看出,單獨的(de)(de)(de)(de)(de)(de)共(gong)表(biao)(biao)(biao)(biao)達(da)代(dai)(dai)理(li)(li)、單獨的(de)(de)(de)(de)(de)(de)1-1對(dui)和(he)組合(he)(he)都能(neng)(neng)準確、相似地(di)將不同(tong)物(wu)種的(de)(de)(de)(de)(de)(de)細(xi)(xi)胞(bao)(bao)(bao)類(lei)型(xing)分(fen)組。雖然(ran)對(dui)于(yu)這種廣泛的(de)(de)(de)(de)(de)(de)分(fen)類(lei)來(lai)說很微妙,但當用(yong)MetaNeighbor進(jin)(jin)行評(ping)估時(shi),完(wan)整(zheng)(zheng)(zheng)(zheng)的(de)(de)(de)(de)(de)(de)共(gong)表(biao)(biao)(biao)(biao)達(da)代(dai)(dai)理(li)(li)集(ji)在所(suo)有細(xi)(xi)胞(bao)(bao)(bao)類(lei)型(xing)中都比(bi)其任何一(yi)個(ge)(ge)部分(fen)集(ji)成(cheng)(cheng)得更(geng)(geng)好,反映了來(lai)自共(gong)表(biao)(biao)(biao)(biao)達(da)代(dai)(dai)理(li)(li)的(de)(de)(de)(de)(de)(de)額外信息。因(yin)(yin)為(wei)(wei)這是(shi)一(yi)個(ge)(ge)專注于(yu)明確對(dui)齊的(de)(de)(de)(de)(de)(de)驗(yan)證,所(suo)以性(xing)能(neng)(neng)通常會從高(gao)到更(geng)(geng)高(gao)。為(wei)(wei)了評(ping)估增加的(de)(de)(de)(de)(de)(de)已知基(ji)因(yin)(yin)對(dui)空間的(de)(de)(de)(de)(de)(de)效(xiao)用(yong),將共(gong)表(biao)(biao)(biao)(biao)達(da)代(dai)(dai)理(li)(li)替換為(wei)(wei)隨機對(dui),并跟蹤性(xing)能(neng)(neng)改(gai)進(jin)(jin)(圖3-d)。對(dui)于(yu)大(da)多數(shu)細(xi)(xi)胞(bao)(bao)(bao)類(lei)型(xing),性(xing)能(neng)(neng)穩(wen)步提高(gao)到接近1,表(biao)(biao)(biao)(biao)明5000個(ge)(ge)共(gong)表(biao)(biao)(biao)(biao)達(da)代(dai)(dai)理(li)(li)的(de)(de)(de)(de)(de)(de)典(dian)型(xing)數(shu)量足以整(zheng)(zheng)(zheng)(zheng)合(he)(he)跨(kua)物(wu)種數(shu)據。進(jin)(jin)一(yi)步查明共(gong)表(biao)(biao)(biao)(biao)達(da)代(dai)(dai)理(li)(li),發現它們通常代(dai)(dai)表(biao)(biao)(biao)(biao)核心保守功能(neng)(neng),如光(guang)合(he)(he)作(zuo)用(yong)、線(xian)粒(li)體(ti)蛋(dan)白和(he)核糖體(ti)代(dai)(dai)謝(圖3-e)
結(jie) 論(lun)
整合(he)跨物(wu)種單細胞數(shu)據(ju)是植物(wu)發育、進化和(he)分子生物(wu)學領域越來越普遍的(de)目標。為了促進這(zhe)一過(guo)程,使用共表達代理(li)(li)可以擴大可用于(yu)整合(he)的(de)基因空間。這(zhe)些代理(li)(li)列表為改善(shan)單細胞數(shu)據(ju)的(de)整合(he)提供了重(zhong)要資(zi)源(yuan),加(jia)速了知識從研究(jiu)良好的(de)模式生物(wu)向對全球糧(liang)食供應(ying)至(zhi)關重(zhong)要的(de)作(zuo)物(wu)系(xi)統的(de)轉移。