11月4日,中國農業科學院深圳農業基因組研究所(嶺南現代農業科學與技術廣東省實驗室深圳分中心)周永鋒團隊提出利用人工智能進行葡萄育種的新方法,將大幅縮短育種周期,且預測準確度高達85%,相比傳統方法,育種效率可提高400%。該研究有望實現葡萄的精準育種設計,加速葡萄品種創新,并為其他多年生作物育種提供方法參考。相關研究成果發表在《自然·遺傳學(Nature Genetics)》上。
進入二十一世紀以來,隨著分子生物學、數量遺傳學、生物信息學等學科的興起,育種家提出育種3.0技術,即分子育種,通過分子標記來“設計”性狀,并在此基礎上,提出育種4.0,即智能設計育種,基于海量基因組和遺傳數據進行分析預測,以提高育種效率和精確度,全基因組選擇育種便是其中最具代表性的一種。
目前,葡萄育種仍停留在2.0階段。要想實現從2.0到4.0的跨越,首先需要足夠全面、準確的基因組數據。
為此,周永鋒團隊自2015年起,開始聚焦葡萄的設計育種工作,并于2023年發布首個葡萄端粒到端粒完整參考基因組圖譜。隨后,團隊又陸續對包括野生種和栽培品種在內的9個二倍體葡萄品種進行測序、組裝,得到18個端粒到端粒的單倍型基因組,并整合已有的基因組數據,構建了目前首個最全面、最準確的葡萄泛基因組。
為了進一步弄清楚葡萄基因與性狀之間的關聯,周永鋒團隊從近萬份葡萄品種中選取了400多份有代表性的葡萄品種,連續3年對包括果穗大小、漿果中代謝物含量、漿果大小和果皮顏色等在內的29個農藝性狀進行調查,構建了葡萄基因型圖譜和性狀圖譜。
在此基礎上,周永鋒團隊利用數量遺傳學分析,鑒定到148個與農藝性狀顯著相關的位點,其中122個位點為首次發現。
全面、準確的基因組數據是精準“設計”育種的基礎,而如何深入挖掘這些數據來優化育種策略并指導育種?是智能育種必須回答的問題。
周永鋒團隊決定引入機器學習,通過構建預測模型,根據評分進行早期個體的預測和選擇,從而指導、優化育種策略。在本研究中,研究人員將包含了性狀和基因型的數據劃分為三個子集:訓練集、驗證集和測試集。利用機器學習算法解析基因型與性狀數據間的復雜網絡關系,運用訓練數據集構建了首個葡萄全基因組選擇模型,研究進一步通過驗證集調整模型參數,對模型進行優化,最后利用測試數據集評估最終模型的性能。研究結果表明,結合了結構變異信息和機器學習模型的計算多基因評分預測準確率高達85%。
通過這一模型,育種家可以快速準確地評估大量育種材料的遺傳潛力,從而更好地選擇優良品種。與雜交育種需要根據葡萄成熟后的表型作出判斷相比,全基因組選擇育種技術在葡萄幼苗時期就可以預測其成熟后的性狀,盡早剔除掉不符合條件的幼苗,減少了不必要的人工成本和投入,在葡萄育種應用中有很大的應用潛力,提高葡萄育種效率,加速葡萄新種質的創制,革新葡萄育種策略。