2025-02-26
全基(ji)因組選擇育(yu)(yu)(yu)種(zhong)(Genomic Selection, GS) 是(shi)一種(zhong)利用(yong)全基(ji)因組信息進行育(yu)(yu)(yu)種(zhong)的先(xian)進方法, 可(ke)通過分析覆蓋整(zheng)個(ge)基(ji)因組的高密度分子標(biao)記(ji)和訓練群體的表(biao)型數(shu)據, 來預測(ce)個(ge)體的育(yu)(yu)(yu)種(zhong)價值, 實現早期(qi)篩選和加速育(yu)(yu)(yu)種(zhong)進程(cheng)。最初在(zai)(zai)動(dong)物育(yu)(yu)(yu)種(zhong)中得到應(ying)用(yong),目前 GS 技術(shu)已(yi)在(zai)(zai)玉米、 水稻等作物育(yu)(yu)(yu)種(zhong)領(ling)域得到廣(guang)泛應(ying)用(yong)。近期(qi),DeepSeek憑借其(qi)出色(se)的“推理腦”成功火(huo)出圈,那它是(shi)如(ru)何看待GS技術(shu)呢?
Q1、GS在育種(zhong)中(zhong)的優勢(shi)?
DeepSeek:
1. 從(cong)“經驗育種(zhong)”到“精準預測”
傳統(tong)育種(zhong)依(yi)賴(lai)表型(xing)觀(guan)察和田(tian)間(jian)試驗(yan),周(zhou)期長、成本(ben)高,且易受環境干擾。GS技術(shu)通(tong)(tong)過分(fen)析全基(ji)因組數萬至百萬個位(wei)點,直接解碼物種(zhong)的“基(ji)因說明書(shu)”,快(kuai)速鎖定(ding)高產、抗病、耐逆等性狀(zhuang)的關鍵(jian)基(ji)因組合,將育種(zhong)周(zhou)期縮短(duan)50%以上(shang)。例如,荷(he)蘭奶牛育種(zhong)通(tong)(tong)過GS技術(shu),僅用2年(nian)時間(jian)便將乳脂產量提升15%,而傳統(tong)方(fang)法(fa)需耗費5-8年(nian)。
2. 突破復雜性狀的“黑(hei)箱”
許多重要性(xing)狀(如抗逆性(xing)、肉(rou)質(zhi)風味(wei))由數百個微效(xiao)基因共同調控,傳統手段(duan)難以捕捉。GS通過機器學習模型整合基因組與(yu)環境互(hu)作效(xiao)應(ying),實現復(fu)雜性(xing)狀的精準(zhun)預(yu)測。中(zhong)國農業科學院利用GS模型,成功篩選出耐鹽(yan)堿(jian)(jian)水稻品系(xi),在鹽(yan)堿(jian)(jian)地(di)中(zhong)實現畝產超400公斤的突破。
3. 低(di)成(cheng)本、高回報的(de)“普(pu)惠技術(shu)”
隨著基(ji)因(yin)分型成本(ben)大幅下降(植物樣本(ben)低(di)至10美元(yuan)(yuan)/個),GS技術已(yi)從實驗室(shi)走向田間地(di)頭。美國(guo)先鋒種(zhong)(zhong)業(ye)通過GS優化玉米雜交組合,每(mei)公頃增(zeng)產(chan)8%-12%;巴西(xi)肉(rou)牛養殖(zhi)企(qi)業(ye)采(cai)用GS選(xuan)育抗(kang)蜱(pi)蟲種(zhong)(zhong)群,每(mei)年減少數(shu)千萬美元(yuan)(yuan)的獸藥支(zhi)出(chu)。
Q2、GS的(de)未來(lai)展望
DeepSeek:
到2030年(nian),GS技術有望覆蓋全球60%的(de)主要(yao)經(jing)濟物種(zhong)。隨著單細(xi)胞(bao)測(ce)序、表觀基(ji)因(yin)組學的(de)融合,育種(zhong)將(jiang)進入“全息(xi)基(ji)因(yin)時代(dai)”。無(wu)論是(shi)應對氣候變化的(de)“超級作物”,還(huan)是(shi)滿足個性(xing)化需(xu)求的(de)“功能型畜禽”,GS都(dou)將(jiang)成(cheng)為(wei)核心驅動力。
派(pai)森諾:如何(he)開展“GS”分(fen)析
1.樣本選擇(ze)
在(zai)選擇樣本時,應確保樣本間(jian)(jian)無直接血緣(yuan)聯系(xi),且每個樣本都應盡(jin)可能地反映(ying)自然群(qun)體的(de)多(duo)樣性和結構(gou)。若樣本間(jian)(jian)存在(zai)親緣(yuan)關系(xi),必須詳細記錄和分(fen)析這些關系(xi)的(de)譜系(xi)圖。
保(bao)證(zheng)群(qun)體樣(yang)本(ben)數(shu)量,需要收集(ji)盡可能(neng)多的樣(yang)本(ben)以(yi)確(que)保(bao)統計結(jie)果(guo)的可靠(kao)性。對于數(shu)量性狀的研究,建議(yi)800個(ge)樣(yang)本(ben)(至少(shao)超過 500個(ge));而對于極端質量性狀的研究,可以(yi)適當減少(shao)樣(yang)本(ben)數(shu)量。
盡量選取便于(yu)獲得基(ji)因型和表型的群(qun)體,可充分利用已發表的測序數據(ju)。
2.模型選擇
模型(xing)選擇是(shi) GS 分析過程中(zhong)的關鍵。目(mu)前, GS 有(you)五大常(chang)用模型(xing)和算法(fa):基(ji)因(yin)組最佳線性無偏預(yu)測(Genomic Best Linear Unbiased Prediction, GBLUP) 、 嶺回歸 BLUP (Ridge Regression BLUP, RR-BLUP)、 貝葉斯(si)方(fang)法(fa)、 機器學(xue)習(xi)方(fang)法(fa)和深(shen)度學(xue)習(xi)方(fang)法(fa)。
3.分析流程
4.部分分析(xi)結(jie)果(guo)
SNP 檢(jian)測(ce)與(yu)注(zhu)釋+群體結構
遺傳力(li)+GWAS
不同模型基(ji)因組預(yu)測