AI赋能生物制造的产业化落地:香兰素一年从零起步量产百吨级、辣椒每亩增产近3成
缩短数据筛选时间,提升环境要素的匹配度,并预测设计出功效指标倍数级改良的新原料,是AI在生物制造领域从理论到实验室再到田间地头的应用路径。
尤其是以百图生科、智峪生物、创建医疗为代表的一批新兴企业,正在医药、合成生物、化妆品领域搭建AI赋能的产业应用落地项目。
AI赋能生物制造流行路径:提升酶筛选效率,挖掘新原料
今年7月,工信部披露人工智能在生物制造领域典型应用案例名单(第一批)。当中囊括了多个关于利用AI大模型针对蛋白质、酶、菌进行精准设计、改造的案例。
本月举行的第七届中国制药工业博览会上,中国电子信息产业发展研究院人工智能产业发展研究室主任于萍在演讲中提到,团队根据相关案例收集阶段的数据汇总发现,目前AI在生物制造应用主要路径中,有近3成为生物反应过程的智能控制、占比约25%的为高性能蛋白质原件设计及构建,以及12%的生物制造产品的智能检测与质量控制和11%的细胞工厂的构建及优化。
目前已取得显著成效的主要是酶的筛选设计,菌株构建效率提升、制造工艺优化升级三块领域。能够解决以往酶筛选周期长、天然酶功能有限且改造难度大大、菌株构建存在过程长、随机性大、失败率高、生产精确控制难、工艺优化依赖经验的痛点。
例如,在天然酶的筛选上,AI工具可以精准预测地球上包括酶蛋白在内的所有已知蛋白质结构,总数可达到2.14亿个。在制造工艺上,可实现温度、PH值、氧气浓度等十个关键参数的实时监测,并通过积累的大量数据深度学习建立预测模型,给出最佳工艺优化建议,减少中试次数和时间。
不过,于萍也坦言,当下仍然存在高质量数据匮乏、通用算法无法满足特定领域需求继而难以处理跨环境任务,以及复合型人才缺乏的痛点。
前述CMC药博会上,第一批应用案例名单中的不少企业/机构来到现场分享了其应用路径。其中,百图生科凭借基于AI大模型高效改造药用酶用于酶替代疗法入选了前述名单。其方式主要为通过自主研发的AI大模型,针对现有酶设计相应突变并进行多目标优化,有效提高酶的活性和稳定性,从而高效筛选潜在靶点、设计药物分子、预测药物效果并降低免疫响应。
据百图生科生物制造解决方案主任专家罗朝晖现场演讲介绍,过往生命科学前沿领域数据严重匮乏,自身不足以构建AI模型。而将海量弱相关数据经过预训练后,形成生命科学基础的大模型,可从蛋白质/基因组等序列语言中学习编码-功能的规律,从进化树多样信息中学习同源进化的约束规律。再经过微调训练,预测缺乏数据的前沿问题。例如可完成新型抗体结构、基因元件功能、RNA翻译效率、新型酶活性、菌株改造的预测。
罗朝晖谈到,公司的生物语言大模型采用多学科交叉技术,达到了数亿美元的投入强度。覆盖了药物设计、靶点预测、生物数据图谱、基因和蛋白算法、实验验证系统。
其中的一款DNA大模型,属公司给华大研究院定制的菌种大模型,旨在帮菌种改造提供基础模型框架。该案例需达成的客户需求包括对菌株物种分类、菌种生存环境、菌种间相互作用情况进行细分预测。而公司的解决方案系,系通过BioMap基因组库里100万+的Genome序列+注释,基于进化距离/生境分布,选择出代表基因组,形成10万+Genome的微生物代表基因组库,再进行菌种大模型预训练。使客户获得精准的菌种进化距离差异表征能力和精准的生境差异表征能力。
出现在第一批案例中的还有中科院天津工业生物技术研究所。该团队在菌株创制、酶库构建、AI智能系统开发、酶/菌精准化应用中,也有诸多专利成果。
中科院天津工业生物技术研究所副研究员高乐以“基于底物结构特性定制开发复合纤维素酶制剂”项目为例介绍,团队于纤维素酶loop区定点突变环节,建立了氨基酸序列机器学习方法,突破纤维素酶活力和热稳定性双提升的技术瓶颈。在菌丝形态调整环节,让里氏木霉菌丝形态成功调整为菌球状态,使之利于规模化发酵过程中传氧传质。
而在基于底物结构破译酶系组成上,由于木质纤维素复杂结构与多样性降解酶系组成之间定量构效关系仍不明确,导致基于底物结构定制的高效降解酶系精准设计难度加大。可复杂底物-酶系机器学习模型为摆脱实验先验、精准高效破坏木质纤维素提供了新策略。到了智能发酵工艺推动逐级发酵放大阶段,团队建立模型指导的智能发酵技术确保复合纤维素酶制剂规模化放大工艺可优化。
谈及机器学习助力木质素降解酶的开发,高乐坦言,过去木质素有序结构难、酶解效率低、现场方法能物耗大。而开发了荧光基因修饰的木质素底物,创新了木质素降解菌株的液滴微流控高通量筛选方法,挖掘出天然生境中解聚木质素自然生物系统200株。
其中,不溶性、可溶性木质素可高效利用,实现碱性木质素、菌体合成。全基因组注释预测了14221个蛋白质编码基因,大量潜在的响应木质素的关键元件。气质连用对M.wuxin降解木质素产物谱进行分析,鉴定出20多种中间芳香族代谢物。成功预测了包括苯乙酸途径在内的至少9种木质素衍生芳香族中间代谢物的代谢途径,丰富真菌细胞内的木质素代谢网络。并且搭建蛋白与底物配体互作机器学习模型,破解两者有效结合模式。
据悉,机器学习模型鲁棒性方面,公开数据库运行准确率超过86%。可解释性方面,能够准确预测蛋白和配体结合位点。并能理性调控底盘细胞木质素代谢网络,强化木质素定向降解和有序转化。也打通了木质素生物合成油脂蛋白技术体系——菌体中蛋白含量30.3%、油脂含量45.5%,创新了能值蛋白原料合成的新方法。
换言之,人工智能在筛选数据时提升效率、精确控制工艺反应环节上已实现从理论到实验室的闭环。
产业化落地现成路径:香料快速量产、助力农业增产、提升化妆品功效
AI的产业化落地也在生物原料、农业、日化行业得以实践。前述工信部公布的第一批案例中,智峪生科凭借高性能蛋白质元件设计及构建入选。其自主开发“ZCloud”生物计算平台和“ZBot”实验验证平台,基于机器学习和大语言模型从海量生物数据库中推理合成路径,解决“寻酶、挖酶、改酶”等核心痛点,极大提高酶法合成效率。
据智峪生科创始人王晟介绍,相比较传统化工制造以化石原料为主,存在高碳排放问题,反应还要涉及高温高压等特殊条件。生物制造则以葡萄糖、油脂等生物质原料为主,碳排放相较化工合成降低3到5成,反应条件温和。
而酶是生物制造的关键催化剂。公司从寻路到挖酶到改酶全流程基于AI研发模式。如此一来,包括基于AI的逆生物,合成路线联想算法,发掘新反应路径效率都能大幅提升。
王晟认为,AI加速了新酶的发现,助力更高效的生物合成可能性。若需要酶能跟小分子相互结合,那便要让给定结合口袋的蛋白,配体复合体柔性对接。其开发的一款算法,结合口袋预测与虚拟筛选精度提高10%以上。即AI让蛋白-配体柔性对接成为可能,精确预测各类酶的属性。
其还在演讲中展示了一个算法辅助阿魏酸催化生成香兰素的酶挖掘改造产业化案例——借助fastAF2,团队发现了一个活性是初始酶(CSO2)19.53倍的高活性替代酶SsCSO。通过算法与传统方法结合改造后,得到了活性是SsCSO野生性3.34倍的高活性突变体。
谈及酶法阿魏酸天然香兰素,王晟透露,公司从0开始立项到量产,只花费了18个月。去年年底量产后已能达到一年100吨级别的量产水平。预计今年公司的香兰素产值能达到3000万,2026年起年产值能破亿。
王晟另披露了公司在香精香料、天然保健品原料、天然化妆品原料、中药现代化四大类的不同项目阶段。其中,芹菜素、生育酚-葡萄糖苷都达到了生产环节。芹菜素预计明年产值2000万,后年破亿。
产业化落地应用不止是帮AI公司找到了商业转化的机会,更是助力实体产业在产量、质量上寻求突破。
深松生物创始人王益荣在演讲中谈到,从AI应用大背景看,联合国粮食及农业组织曾预测,到2050年,全球粮食需增产5成,而AI与合成生物学融合技术有望贡献3成的增产潜力。深松生物自2016年开始基础研发,通过菌种选择进入农业赛道。2018年完成第一代产品研发,走向实际应用。2019年进行田间种植实验、水产养殖实验。核心逻辑是通过代谢解决农业问题,即促进根系代谢物与微生物代谢物相互作用,改善作物的代谢系统,提高生长速度和产量。构建作物与微生物共生体,提升整个系统的稳定性和生产力。提升土壤健康与作物代谢,降低对化学肥料和农药依赖。
当前,深松团队主要通过HMM层基因调控建模,利用Viterbi算法寻找最优路径。预测最优的编辑靶点组合,提高编辑效率和准确性。该算法能够综合考虑隐状态转移概率和观测序列概率,确保预测结果的可靠性。
其过去两年在江苏某地的水蜜桃基地、贵州某地的辣椒种植基地试验。而辣椒基地的实验结果表明,相比于空白对照组,生物酶组的一级品率高出8个百分点。产量上生物酶组高达13948.2斤/亩,相比对照组增收3187.67斤/亩。
深耕新蛋白领域的谷孚咨询,也关注到了AI赋能植物基的两大新方向。据谷孚咨询科技经理梁烨诗介绍,在创新配方领域,Giuseppe AI平台的生成式AI,可以在30万种植物成分种根据需求生成配方。口感、质构改良范畴,相关机构则可以利用机器学习框架预测植物肉的硬度和咀嚼性,发现糖、脂肪、目标湿度是影响质感的关键因素。
对于AI赋能细胞培养肉的最新进展,梁烨诗透露,包括Gourmey和DeepLife两家公司在内,合作建立了全球首个禽类数字孪生,使用实际生产周期中收集的基因组和细胞水平数据来训练模型。加速研发、优化培养基投入,提升感官和营养水平。BioCraft则通过收集开源或数据库数据,合成细胞内部生化机制图像,分析出影响细胞增长的关键营养成分,或其他关键细胞生理机制。
而AI赋能发酵蛋白领域,以New Wave Biotech为代表的团队,结合机械模型和机器学习技术模拟生物过程,改进纯化过程,提高蛋白得率,降低生产成本。
不止农业生产实践,以应用人工智能辅助重组胶原蛋白精准设计入选工信部第一批案例的创建医疗,运用AI+BT技术,发掘关键性细胞结合位点,并进行蛋白序列设计与作用机制模拟验证,打通干湿实验闭环,精准设计蛋白序列并优化发酵纯化工艺,实现特殊型别分子重组胶原蛋白高效规模量产。
据创建医疗首席技术官李海航介绍,团队利用AI+BT发掘关键XVII型胶原蛋白核心细胞结合位点,生物功能验证完成了rhCOL17开发技术闭环。当中显示rhCOL17展示出优异的光损伤修复能力,显著修复表皮-真皮交界(DEJ)断裂,恢复结构连续性。并促进I型、III型和XVII型胶原蛋白表达水平,展现出胶原蛋白网络的调控能力。
目前的产品落地环节中,珀莱雅的源力系列2.0已采用了创建医疗的rhCOL17作为核心抗老修护成分。
“AI在美妆领域应用刚刚起步,核心应用是场景,基于场景需迭代算法、沉淀数据。”瑞德林生物研发BG总裁李加忠认为,场景包括智能挖掘新原料、功效机理验证、人体功效研究(图像识别、表观年龄识别)、工业酶设计与改造、智能配方师等精准服务。
李加忠以胶原三肽的研发为例回顾到,瑞德林团队获取了45种人源性胶原蛋白序列,穷举了2826个三肽组合,算法进行940种序列频率分析,再筛选评估出分子量小、更易透皮吸收的小分子胶原肽。
“所以,利用AI开发爆款原料的逻辑,在于爆款原料往往具有共性。包括强功效、差异化、话题性故事性和供应链稳定。而AI可以基于靶点筛选原料,且易于发现新原料。”李加忠总结道。
从增产提质到发现新原料赛道,AI正以影响生物制造关键环节的方式,重塑农业、食品、医药化妆品产业的迭代水平。
林辰/文
徐楠/编辑
最新文章
- 对穆斯林进行“无差别攻击”?印度东北邦驱逐风波再起
- 南海热带低压生成 将于17日夜至18日晨登陆琼粤沿海
- AI赋能生物制造的产业化落地:香兰素一年从零起步量产百吨级、辣椒每亩增产近3成
- 科沃斯半年狂揽86亿!扫地机器人“双雄”中报出炉,行业进入产品成熟期
- 游客质疑大理龙龛假警察管制交通,官方:确为警务人员,摆渡车已经报备
- 1至7月全国铁路完成固定资产投资4330亿元
- 青春赛道展锋芒!广东青少年田径健儿全国赛场书写新篇
- 21℃草原上的速度对决!冬奥赛道迎来千骑竞逐
- 鸿雁南飞别离久:+后续+结局(洛瑜萧晏)全文免费阅读无弹窗大结局_(洛瑜萧晏)鸿雁南飞别离久:+后续+结局免费阅读无弹窗最新章节列表_笔趣阁(洛瑜萧晏)
- 咫尺天涯烬余温:+后续+结局(阮南柚靳斯言)全文免费阅读全集完整版_咫尺天涯烬余温:+后续+结局最新章节无弹窗(阮南柚靳斯言)