AI for Science的中国机会|对谈Deep Principle深度原理创始人贾皓钧

AI for Science的中国机会|对谈Deep Principle深度原理创始人贾皓钧

hyde123 2025-07-04 装修奥秘 2 次浏览 0个评论

  AI for Science(AI驱动科学发现),正在改写科学发现的底层逻辑,逐步改变人类探索世界的方式

  来源:财经媒体人 于超

  AI for Science(AI驱动科学发现),正在改写科学发现的底层逻辑,逐步改变人类探索世界的方式。当 AlphaFold 团队摘得 2024 年诺贝尔化学奖,AI 首次以“发现者”的角色进入基础科研核心,标志着 AI for Science 的时代性拐点真正到来。

  AI开始深度介入科学探索全过程,从加速实验、辅助建模,到参与提出假设、反馈验证——AI 与物理、生命等基础科学的融合,已不再是工具升级,而是科研范式的重构。

  什么是 AI for Science (AI4S)?它不仅是用 AI 来加速实验,更是推动科学从“靠经验试错”迈向“由智能主导”的全新范式。理想形态下,它应当像科学家一样:提出假设、规划实验、分析数据,并通过反馈持续修正、迭代模型,完成闭环优化。 正如深度原理Deep Principle创始人贾皓钧所说:“AI不是要取代科学家,而是让更多人站在巨人的肩膀上,用更少的时间,推动更大的发现” 

  本期对谈中,贾皓钧这位 MIT 出身、投身 AI4S 创业的科学家型创始人,系统聊了聊 AI for Science 的三阶段演进逻辑,AI for Science的“ DeepSeek 时刻”的前提条件,讲述为什么这场科研革命在中国更具落地优势,也分享 了AI 创业中最被低估但最关键的创始人能力。 

  当 AI scientist、自动化实验与科研生态的飞轮真正启动,我们距离下一个重大科学发现,或许比想象中更近。

  01.AI 正在成为新一代科研“引擎”

  Michelle于超:现在越来越多地听到“AI正在重塑科学研究”的讨论。而深度原理Deep Principle,正是一家专注在 AI for Science(AI4S)方向的创新公司。能不能具体聊一聊,目前深度原理Deep Principle的技术方向是怎样的?产品形态发展到了哪一步?在整个科研链条中,你们主要聚焦在哪些问题、解决什么样的科学难题?作为这一波“AI + 科学”创业浪潮中走在前面的团队,你们的路径有什么特别之处?

  贾皓钧:好的,先说一下我们公司的历程。我们是在 2024 年 6 月从美国回到中国发展的,目前团队主要在杭州。其实最初这个项目是从 MIT 孵化出来的,我们最早在 2022 年就萌生了这个想法,之后也得到了很多来自 MIT 社区的支持和资源。但最终,我们还是决定把主战场放在中国。

  我们在做的事情,其实是用人工智能去解锁一些全新的化学反应路径,主要聚焦在化学材料和反应机制这块。具体一点说,就是 AI for Chemistry & Materials,像 carbon capture(碳捕捉)和功能材料发现这样的方向,是我们重点在做的。

  这两年,尤其是到了 2024 年,随着生成式 AI 的爆发,整个行业对“AI + 科学”的关注度明显提升了,美国和欧洲很多创业者和学者都看到了这个领域的潜力和机会,纷纷出来创业。我们也是其中一员。但在国内,我们应该算是最早、也是目前唯一一家具备从头到尾全链路能力、专注在化学与材料领域的 AI 科创公司。

  02.AI for Science 发展路径三阶段

  Michelle于超:在您看来,AI for Science 当前的发展路径是否已经形成一个清晰的技术分层?从数据建模、假设生成到自动化实验,不同阶段的AI介入方式分别有什么样的典型代表和挑战?

  贾皓钧:在化学和材料领域,AI for Science其实这些年发生了很大的变化。就是AI for Science这个到底是什么样的定义。

  我们一般也认为AI for science有三个阶段。

  第一个阶段是 AI 作为科学数据分析工具的阶段 (AI Assistant)。我们知道任何的科学研究都会产生一些的数据。那这些数据是怎么个分析呢?尤其是这里面可能数据的维度很高,有一堆X和一大堆Y,我们想知道某一、两个Y跟哪些X是有相关作用。因为我们可能想定向优化某些性能,所以这里面其实有个非常高维度的问题。所以能不能通过一些简单的机器学习模型来做一些数据的分析,降维来帮助我们比人脑更好的来理解这些数学,或者说是一些数据背后所隐含的一些含义。这就是AI for science的第一阶段作为AI Assistant。

  简单来说,AI 在这一阶段的作用是辅助我们理解已有数据中蕴含的科学意义,这是 AI for Science 的起点,也是在各类科研场景中已经得到广泛验证和应用的部分。

  第二阶段的话,就会更加智能一点,进入了 AI 深度参与科研过程的阶段 (AI Scientist)。大家做科研就一定要做实验,而实验通常分为两大部分,或者说科学发现分成两大部分。

  第一部分就叫做hypothesis generation(科学假设生成),就是生成一些科学性的假设。这部分过去往往只有顶尖科学家能完成,例如牛顿、爱因斯坦、薛定谔等,他们属于极少数能从复杂现象中提出突破性理论的人。但现在,AI 已经开始在这一环节提供强有力的辅助——它能够从大规模文献、数据中总结规律,辅助科学家提出可能性的理论方向。

  第二部分就叫做experimental validation(实验验证),也就是在已有假设的基础上,通过不断试验去验证是否成立。这个是绝大多数科学家一直在干的。就是很牛的人可能花一天提出一个伟大的idea,剩下的人花了十年把它来验证。

  所以这两部分其实AI都可以参与到。例如我们做实验的时候,我们的数据能不能及时被得到验证以及迭代,来指导我们下一步来做这个实验。就例如我们想做一些纯粹的“autonomous lab”(自主实验室) ,就是纯自动化的实验室。这一方向近年来已有不少突破性的成果,预计在未来一到两年内,将对科研效率带来实质性的提升。

  第三阶段其实就像我们有点像AGI了,接近 AGI 的能力边界 (AI Innovator)。我们设想是否能出现一种完全自动化的科学系统,由 AI 独立完成从提出问题、构建模型、设计算法,到发现新的科学规律的全过程。它不再只是辅助人类做科学,而是像科学家一样主动提出问题并解答问题。

  比如,它是否能够自动推导出某些新的公式,甚至发现类似牛顿三大定律这样具有划时代意义的自然法则?这就是我们常说的AI Innovator。

  我认为,这个阶段的实现可能比真正的通用人工智能(AGI)略晚一步,但不会相差太远。

  至于 AGI 究竟什么时候会真正出现,这个问题其实讨论了很很久,不同人对 AGI 的定义也有很大差异,至今没有明确的结论。我一般也不喜欢对未来做预测,我个人的观点也是“The best way to predict the future is to create it”。但可以确定的是——无论是否真正达到 AGI,AI 在科学研究上的角色已经在快速演化,将在未来持续带来重大突破。

  03.AI for Science 的“DeepSeek 时刻” 

  Michelle于超:大家都在关注 AI for Science 会不会出现类似 DeepSeek 这样的突破时刻,也就是一个真正打破现有科研范式、引发飞跃式变革的临界点。在您看来,推动这个时刻到来的核心支撑因素有哪些?是模型本身的通用能力?是垂直领域的数据质量与规模?还是科研场景中对可解释性、严谨性、工程化能力的高度要求?目前来看,距离这样的临界点,我们还缺哪一块拼图?

  贾皓钧:首先,我确实认为,任何一个行业其实都期待出现像 DeepSeek 这样的“突破时刻”。因为这通常意味着,行业内部发生了结构性的变化,并且这个变化能对整个社会产生真正的价值。所以 AI for Science 领域,也同样在期待这样一个拐点。

  科学问题本身就非常重要。人类一直在通过做实验,试图理解这个物质世界的运行规律。我们希望能找到更好的定律,发现新的材料、新的药物,从而改善我们的生活。但传统科学探索依赖大量的“试错”(trial and error)方法,在今天这个时代,其效率已经越来越难以满足现实需求。特别是在新材料、药物等高价值领域,需求越来越多、越来越紧迫,而传统方法的效率瓶颈也越发明显。

  在这个背景下,AI 成为了一个非常重要的变量。它能参与科研流程中的多个阶段,从前面说的高维数据分析,到辅助做实验,甚至进一步提出新的假设。AI 不只是一个加速器,它可能是重新定义科研范式的方式和方法。

  如果要推动 AI for Science 进入“DeepSeek 时刻”,我认为需要几个关键前提条件的配合。

  第一、是模型本身的能力

  我们谈到的通用大模型(foundation model),它的模型的通用性其实是非常关键,或者说它的模型性能本身是最关键的。它的泛化能力非常关键。比如,一个大语言模型,可能既能帮助记者生成采访提纲,也能帮科学家做文献总结,甚至辅助我们进行论文写作、论文 review 等等。不同领域的用户会提出完全不同的任务需求,因此模型需要足够通用、理解力足够强。所以它需要非常强的泛化能力来帮助他们完成这个事情。

  第二、垂直领域的数据质量与专业性

  而在 AI for Science 这个垂直领域,尤其是像材料、化学反应这类方向,模型所使用的数据质量反而更关键。我们普遍认为,模型性能由两个因素决定:一是模型架构本身,二是数据的量与质。在垂直领域里,高质量、结构化、专业的数据,可能比模型架构本身还更重要。

  因为科学问题要求极高的准确性。你不能说这个结果是 80%、90% 准确的——这在科学研究中是完全不能接受的,必须严谨。因此,大模型要想在这个领域发挥作用,就必须以高质量的专业数据为基础。

  其实,我们回头看一下 AI 的整体演进路径,从 2021 年之后,生成式模型的爆发可以说是由两股技术路径推动的:一是 NLP 领域的 transformer-based 大语言模型,二是 CV 领域的 diffusion 模型。这两类模型是生成式 AI 的两个主流技术路线。

  我们有时也会说,大语言模型更像是“文科生”。它的训练数据主要来自公开网站、语料库、文字信息,对语言理解、知识总结特别强。但你让它解高等数学,它可能也能做一点,但并不是最擅长。

  而 diffusion 模型更像是“理科生”。它最初是处理图像的,每个图像可以看作由大量 pixel 组成的矩阵,数学结构非常清晰。而科学问题的本质,最终也都需要能被数学表达。一个科学问题如果不能形式化、不能用数学语言表达,那它可能就不够“科学”。所以 diffusion 模型在理解科学结构、模拟实验数据方面可能会更有优势。

  从这个角度看,我们可以做一个分工的类比:

  大语言模型擅长 hypothesis generation(假设生成),因为它可以站在“巨人的肩膀上”——利用已有知识资料去提出推测;

  而 diffusion 模型或具备数理结构的模型,更适合 validation(实验验证),例如材料配方优化、材料结构探索等。

  第三、工具生态与交互方式的革新

  再进一步,我们谈到 AI Agent 的角色时,也可以结合这两者。因为科研过程使用的工具往往很复杂,很多工程师或科研人员并没有编程背景,比如工厂里的老师傅、材料车间里的工程师,他们习惯于在 Excel 表里操作,而不是写代码。这时候,AI Agent 就可以成为一个中介——你只需要告诉它你要什么,它就能调动一系列复杂工具、完成虚拟实验、给出结果甚至下一步建议。

  Agent 的意义在于:降低科研门槛,提高交互自由度,让 AI 真正服务于每一位科研一线人员。

  04.为什么从 MIT 回国创业?中美AI for Science生态对比

  Michelle于超:从MIT spin-off startup,再回国创业。为什么选择落地在中国推进 AI for Science?在您看来,中美在技术创新和产业化路径上有哪些结构性的差异?尤其是在新材料、新能源、化工这类领域,中国有更大的机会窗口?

  贾皓钧:首先,美国在科学研究、科技进展、商业化落地这几个维度上,其实早在很多年前就已经处于全球领先的位置了。尤其是西海岸的硅谷,它代表的是软件、AI这一块的最前沿;而东海岸,比如波士顿这一带,就偏硬件方向更多一点。你像现在很多机械狗、、3D打印等等,几乎都是从 MIT 这样的机构里 spin-off 出来的。所以你能看到,美国是双核结构:西岸偏软件,东岸偏硬件,还有一个非常大的板块就是生物医疗,东海岸那边做得也很深。

  中国这边,其实从改革开放以来一直是处于一个持续追赶的过程。但我个人感受很深的一点是:这个技术的 gap,真的越来越小了。

  特别是,中国的制造能力这个事,我觉得现在已经没啥争议了,大家基本都认同,中国制造是全球最强的,而且还会越来越强。所以,如果我们在前端能做好科学发现和技术转化,那后端的工业能力,再叠加十几亿人口的市场——不光是中国自己,周边还有东南亚、中东、非洲这些国家——这个市场的体量是巨大的。

  我们现在在做的 AI for Science,其实本质上是用 AI 去做一些新的 scientific discovery。那这些 discovery 最终都得走向工业应用,比如说材料、能源、化工,这些领域最终都要落到“怎么生产、怎么投产、怎么用”上。

  所以,我们把主战场放在国内,其实是一个很自然的决定。

  像我们深度原理Deep Principle它不仅是一个技术驱动的公司,我们其实也非常关注应用场景的选择,因为这个场景的规模,决定了我们未来业务的空间。而在中美之间对比来说,中国市场的应用场景,确实对我们更友好,也更大。

  我们现在聚焦的领域,基本就三个方向:新材料、新能源、精细化工。这三个领域有一个共同点,就是都特别需要源头创新能力——需要你对化学反应、材料机理非常懂,而这个恰好是我们擅长的。

  其实你回看国内的情况,不点名说,很多企业在这些方向上其实已经很成熟了。美国当然也有,比如杜邦、壳牌、陶氏、霍尼韦尔这些,他们都是非常有积淀的大型化学材料企业。

  但你也知道,美国的工业已经经历过一次大规模的“去工业化”浪潮。比如说,波音外包之后的质量问题,其实是大家都在讨论的。最早的一批去工业化,其实就从化工、材料这些行业开始。当时杜邦的特氟龙泄漏事件是一个标志性节点,引发了全社会对环境污染、健康风险的强烈关注。

  因为美国社会那时候比较富有,积累也够了,所以他们就把污染性行业移出本土,转移到中国、东南亚、南美这些地方。所以现在你去看,全球最大的化工、新能源、材料生产基地,其实就在中国。

  所以我们做这些事情,其实是很顺理成章地把落地场景放在国内。如果你还在美国做,你可以给那些大厂的研发团队提供 AI 工具,做“技术层支撑”。这当然也可以,但对我们来说,这不是我们想做的事。

  我们希望能真正影响生产、影响工业体系,而不是仅仅给别人当“外脑工具包”。所以我们看明白了,想清楚了,选择回国发展,其实就非常自然。

  05.AI for Science创业融资现状

  Michelle于超:过去两年创业融资并不容易,选择在这样一个时间节点创业,当时是如何判断这个窗口期的?您怎么看 AI 创业者目前面临的挑战和转机?

  贾皓钧:从 2023 年开始,中国的资本市场环境其实是极差的。我们24年刚回国的时候刚见了一个来自香港的 LP,他说得很直白,2024 年整体的美元资金比前一年少了 90% 以上,人民币资金也少了 50% 以上,这个“以上”到底是多少,很难说得清,但就是非常难。

  所以我们在 2023、2024 这个阶段出来创业,其实是很不容易的。包括我们这代创业者,现在有一些信心回升,某种程度上也是因为 AI Agent、AI 应用,特别是今年春节 DeepSeek 的发布,让大家突然意识到——原来 AI 真的是可以用的,不是只有 hype,它真的能带来效率、价值和变现。

  这才让大家的信心开始恢复,但这个过程真的挺难的。

  06.AI 时代的创业者最重要的特质

  Michelle于超:现在其实可以明显感受到,海外资金对中国科技资产的情绪正在回暖,很多海外 VC 又开始回来聊 deal。一直以来我们都在讲,时代变了,创始人的画像也在变。尤其是在 AI 时代,创始人面临的环境更不确定,需要的特质也不同。在您看来,AI 时代真正需要什么样的创业者?能够完成从 0 到 1,乃至更重要的从 1 到 100 这样非线性增长路径的人,他身上最核心的特质会是什么?应该不会再是“技术好”等一些单一维度的能力。

  贾皓钧:这是个很好问题。当然我觉得可能不同的人理解都会不太一样。可能偏技术出身的人,可能觉得技术最重要。如果你是连续创业者,那可能会更强调“创业者精神”、资源调动和判断力;但如果你来自大企业的高层管理背景,可能又会觉得执行效率、团队治理、流程操盘这些更关键。所以不同人站的位置不同,看到的那个“创始人画像”也会不一样。

  但我自己有一个很强烈的体会,甚至说是信念吧——小时候我特别喜欢看金庸,比如《倚天屠龙记》、《天龙八部》,当时印象最深的一句话就是:“天下武功,唯快不破。”

  我觉得这句话完全可以套用在今天的 AI 创业上。今天我们所处的环境,技术迭代的速度极快,外部环境变化也极其剧烈,而这两个变量其实都是我们无法控制的。

  创业者唯一能掌控的,可能就是自己的速度——你能不能更快地试错、更快地融资、更快地应用落地、更快地调整方向。哪怕你技术不是最强,但你的反应速度、执行速度、调整速度够快,这本身就可能是你最大的护城河。

  换句话说,在这个时代,速度可能是唯一确定性的竞争优势。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

转载请注明来自夏犹清建筑装饰工程有限公司,本文标题:《AI for Science的中国机会|对谈Deep Principle深度原理创始人贾皓钧》

每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,2人围观)参与讨论

还没有评论,来说两句吧...