生物所基于人工智能預測模型實現異源蛋白的高水平表達

近日,生物所微生物蛋白設計與智造團隊與國內外多家科研單位開展合作,成功構建人工智能預測模型MPEPE,基于深度學習和分子進化的策略模擬分析異源基因在大腸桿菌中表達,提高了異源蛋白在大腸桿菌中的表達量。該研究促進了對基因序列與蛋白可溶性表達之間關系的認識,并為酶蛋白的理性分子設計提供了新方法。相關研究成果發表在《計算與結構生物技術期刊(Computational and Structural Biotechnology Journal)》上。

酶蛋白是一類具有生物學功能的特殊材料,廣泛用于工業、醫藥、農業、化學分析、環境保護、能源開發和生命科學研究等領域。實現酶蛋白的異源高水平表達對于酶的理論研究及大規模工業化生產都非常重要,但目前相關理論基礎尚不明晰,對酶蛋白定向設計的方法仍然缺乏。當前,以深度學習為代表的計算技術不斷突破, 為提升酶蛋白異源表達量的分子設計提供了新思路。

本研究嘗試采用深度學習和分子進化相結合的研究手段,構建了基于多層深度神經網絡(DNN) 的預測模型MPEPE,并選擇6438種在大腸桿菌中已知表達量的蛋白對該模型進行訓練。分子進化分析顯示,該模型可虛擬篩選出可提升酶蛋白異源表達量但不會破壞酶功能的突變位點。將該策略應用于漆酶13B22 和葡萄糖脫氫酶(FAD-AtGDH) 兩種酶蛋白的異源表達時,發現分子設計的多點突變體可大幅度提升其在大腸桿菌中的可溶性表達量。這些結果進一步表明MPEPE策略的有效性,可應用于外源蛋白表達量的分子設計。

生物所博士生丁尊丹和關菲菲博士為本論文共同第一作者,生物所田健研究員、北京畜牧獸醫研究所黃火清研究員,以色列特拉維夫大學Tamir Tuller 教授為論文的共同通訊作者。該研究得到國家重點研發計劃、中央公益性科研機構基礎研究基金的資助。

微信圖片_20220303181347_1.jpg

基于深度學習和進化分析的高表達異源蛋白分子設計流程MPEPE

原文鏈接:https://doi.org/10.1016/j.csbj.2022.02.030

亚洲日韩精品A∨片无码