劃重點
01中國棉花育種團(tuán)隊成功解析近3億DNA甲基化數(shù)據(jù),發(fā)現(xiàn)43個潛在參與纖維發(fā)育的eQTM基因。
02該研究構(gòu)建了涵蓋207個品種的棉花全基因組DNA甲基化圖譜,鑒定2.87億個單甲基化多態(tài)性(SMP)位點。
03湖畔實驗室融合AI、并行計算等技術(shù)開發(fā)了一套新型算法,加速海量遺傳數(shù)據(jù)的分析處理。
04除此之外,研究人員研發(fā)了深度學(xué)習(xí)模型DeepFDML,有望發(fā)現(xiàn)更多具有育種價值的信息。
05該研究成果為棉花品種改良提供新的思路,有望加速培育“超級”作物。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
棉花產(chǎn)量與纖維品質(zhì)如何受到DNA甲基化調(diào)控?在AI的幫助下,中國棉花育種專家成功破譯這一“密碼本”,并從中找出有望改良棉花品種的關(guān)鍵基因位點。
近日,由浙江大學(xué)棉花精準(zhǔn)育種團(tuán)隊、中國農(nóng)科院生物技術(shù)所和湖畔實驗室(阿里巴巴達(dá)摩院)智慧育種團(tuán)隊組成的聯(lián)合科研團(tuán)隊,綜合運用遺傳學(xué)、生物大數(shù)據(jù)和AI技術(shù),構(gòu)建了涵蓋207個品種的棉花全基因組DNA甲基化圖譜,鑒定2.87億個單甲基化多態(tài)性(SMP)位點,規(guī)模為目前所有作物之最。聯(lián)合團(tuán)隊從中發(fā)現(xiàn)43個潛在參與纖維發(fā)育的eQTM基因,為棉花育種提供重要的候選基因列表。相關(guān)論文發(fā)表在國際頂級期刊《細(xì)胞研究》(Cell Research)上。
棉花是全球最大的天然紡織纖維來源,需要通過不斷聚合優(yōu)異的基因組遺傳位點,進(jìn)行品種改良。在AI、大數(shù)據(jù)等技術(shù)加持下,農(nóng)業(yè)正在步入“智慧育種”時代,通過綜合作物基因型數(shù)據(jù)、表型數(shù)據(jù)和環(huán)境數(shù)據(jù),預(yù)測作物性狀,精準(zhǔn)篩選出優(yōu)異基因。
此次,聯(lián)合科研團(tuán)隊聚焦DNA甲基化對作物的影響。DNA甲基化可以在不改變棉花DNA序列的情況下,影響棉花產(chǎn)量、纖維品質(zhì)等農(nóng)藝性狀,并通過自然進(jìn)化和人工選擇傳遞。團(tuán)隊收集了207個品種的棉花全基因組甲基化測序數(shù)據(jù)、基因組測序數(shù)據(jù)、轉(zhuǎn)錄組測序數(shù)據(jù),再結(jié)合農(nóng)藝性狀的表型數(shù)據(jù),進(jìn)行關(guān)聯(lián)分析,首次構(gòu)建起群體尺度的棉花全基因組DNA甲基化圖譜,涵蓋2.87億個單甲基化多態(tài)性(SMP)位點。其中,僅甲基化測序數(shù)據(jù)就達(dá)到17TB。
湖畔實驗室融合AI、并行計算等技術(shù)開發(fā)了一套新型算法,加速海量遺傳數(shù)據(jù)的分析處理。湖畔實驗室智慧育種團(tuán)隊負(fù)責(zé)人顧斐表示:“相比起傳統(tǒng)方法,AI加成的分析計算速度提升近100倍,有助于開展億級序列對比、群體變異分析和多組學(xué)關(guān)聯(lián)分析,在數(shù)百個遺傳變異、數(shù)萬個基因以及數(shù)億個甲基化位點之間建立起復(fù)雜的映射關(guān)系。”
聯(lián)合科研團(tuán)隊進(jìn)而首次繪制出與棉花纖維發(fā)育相關(guān)、獨立于遺傳因素的表觀調(diào)控網(wǎng)絡(luò),揭示了43個潛在參與纖維發(fā)育的eQTM基因。其中一個位點已通過基因編輯實驗,證實其調(diào)控棉花纖維長度的作用。此外,研究人員研發(fā)了深度學(xué)習(xí)模型DeepFDML,基于DNA甲基化位點附近的序列,預(yù)測影響基因表達(dá)的甲基化位點,未來有望發(fā)現(xiàn)更多具有育種價值的信息。
圖說:群體單堿基DNA甲基化多態(tài)性的精準(zhǔn)鑒定、調(diào)控網(wǎng)絡(luò)解析與預(yù)測模型構(gòu)建
浙江大學(xué)棉花精準(zhǔn)育種團(tuán)隊方磊教授表示:“這項研究成果證明了DNA甲基化數(shù)據(jù)可作為育種資源,為棉花品種改良提供新的思路。依托生命科學(xué)+AI,育種家們將持續(xù)挖掘關(guān)鍵基因、預(yù)測農(nóng)藝性狀,加速培育‘超級’作物。”
據(jù)悉,湖畔實驗室(數(shù)據(jù)科學(xué)與應(yīng)用浙江省實驗室)成立于2020年7月,依托阿里巴巴達(dá)摩院建設(shè),聚焦數(shù)據(jù)科學(xué)領(lǐng)域的“數(shù)據(jù)智能”和“新型計算”兩大方向。在智慧育種領(lǐng)域,湖畔實驗室牽頭研發(fā)全流程智慧育種平臺,為育種家們提供包含育種數(shù)據(jù)管理和分析、計算加速、AI預(yù)測的“中央廚房”,大幅縮短培育新品種的周期。