生物所在作物智能設計育種領域取得新突破

近日,生物所創新團隊聯合攻關開發了基于人工智能的水稻染色質開放性在線預測模型,為水稻染色質開放性及其轉錄調控研究提供了新思路。相關成果發表在《遺傳學和基因組學雜志(Journal of Genetics and Genomics)》上。

染色質物理狀態由DNA折疊和縮合決定,一般分為常染色質和異染色質兩種狀態,但兩者并不是靜態不變的,而是隨著生長發育、環境響應等變化動態調整。染色質開放性(chromatin accessibility)反映了染色質轉錄活躍程度,結合其它表觀遺傳修飾如DNA甲基化等信息,可以提供全基因組的基因表達調控信息。因此,識別染色質開放性區域對理解基因表達調控如何協調生長發育與對環境刺激的響應至關重要。由于受實驗技術所限,大量染色質開放性區域至今仍未得到完全鑒定,因此開發基于人工智能的預測方法顯得尤為重要。

本研究通過分別使用正常和熱處理條件下秈粳稻的染色質開放性數據,進行智能預測模型(Smart Model for Open Chromatin region prediction, SMOC)構建。在秈粳稻模型之間的交叉驗證中,預測數據和實驗數據的皮爾森相關系數均在0.97以上。與其它機器學習方法進行性能比較發現SMOC具有更優性能。此外,染色質開放性和DNA甲基化6mA的關聯分析結果表明,染色質開放性可能與6mA協同調控基因表達。本研究開發建立了一個染色質開放性智能預測模型(http://www.elabcaas.cn/smoc/index.html),可以快捷地進行染色質開放性預測。為染色質開放性區域鑒定和信息挖掘提供新的研究思路,結合之前建立的水稻智能數據庫eRice(2020)、作物表觀遺傳智能預測模型SMEP(2021)等,初步形成鏈條式智能算法開發和模型構建,將為今后作物智能設計育種提供新的數據資源和工具。

水稻染色質開放性智能預測模型

A:基于卷曲神經網絡(CNN)的模型構建流程;B:模型性能評估;C和D:預測和實驗數據在全基因組和局部區域的比較。

生物所博士生郭位軍、碩士生劉汗青、王一凡及已畢業博士生張平賢為該論文共同第一作者,普莉研究員、田健研究員和谷曉峰研究員為共同通訊作者。相關工作得到國家自然科學基金、中央級公益性科研機構基本科研業務費等項目資助。

原文鏈接:

https://www.sciencedirect.com/science/article/pii/S1673852722000522?via%3Dihub

亚洲日韩精品A∨片无码