文 | 秦明;封面 | 访者供图
2025年2月27日,百工驿举办了一场主题为“Al for Engineering(AI4E)大时代,AEC产业的大模型工程创新”的线下闭门活动,我们邀请了3位特邀嘉宾、30余位参会嘉宾围绕当下工程行业的AI创新机会,以及当下产业中的困境问题做了交流。接下来我们会分批对不同嘉宾的观点整理,输出文字版本,供大家探讨。
本期内容来自Genia联合创始人&CEO赵志昊。赵志昊出生于建筑世家,是一名连续创业者,耶鲁大学工商管理硕士、宾夕法尼亚大学计算机硕士,常年活跃于北美AEC市场。Genia,建筑业的Gen AI,成立于洛杉矶,专注于AI结构设计,近期完成数百万美元融资,由欧洲最大的建筑科技方向风险投资公司Pi Labs领投,美国硅谷风险投资公司Amplify、Boost VC、头部建商Suffolk Construction等跟投。
以下为赵志昊的内容分享,经百工驿润色编辑:
大家下午好,我是赵志昊,今天的分享主要围绕我在美国看到的建筑行业方向的创新,特别是跑的比较好的一些AI技术新应用。我会尽量通俗易懂地解释这些方向的具体内容,以及一些潜在的应用案例。
首先,大家如果从事建筑行业,应该对这张图比较熟悉。图中灰色的线代表的是整个行业的效率提升曲线,这其实是指从1995年到2015年,行业经济整体效率的变化。而最底部的线则代表建筑行业的效率提升,平均每年增长约1%。如果按实际GDP来计算,建筑行业的效率提升与二三十年前的建设方式差别不大。AI是否能够帮助AEC行业降本增效,带来显著的机会,将是我们今天探讨的重点。

全球制造业/建筑业生产率曲线图
(来源:Economist)
01 Agent与AEC创新
接下来是一些简单的观察。第一个方向叫做Agent AI。我挑选了两个比较常见的范式。一个是AI智能体,它通过调用不同工具的API来协调和管理各种资源。这个AI智能体充当了一个协调者的角色,最终帮助赋能终端用户。另一个是多个AI智能体之间的联动与协作,某些智能体可能负责整体规划,其他的则可能负责实施阶段,比如生成代码或图纸,最后,这些输出可能会交给终端用户。这种方式展示了不同AI身份的协作模式。

Agent AI的两种范式(来源:嘉宾分享)
具体的落地案例有几个可以分享。其中一家名为Datagrid的公司。
Datagrid这家公司搭建的是一个通用平台,但它的解决方案在建筑行业的实际应用中非常成功。它通过AI智能体的形式,打通了与下游工程管理平台和各种数据平台的连接,赋能终端用户。
其中一个典型案例是Procore平台,这是北美最大的建筑项目管理软件之一,成立已有二三十年,且已上市,体量相当于国内的广联达。通过与Procore平台的数据云平台进行对接,Datagrid可以从平台中的文档和图纸中提取信息,从而实现数据赋能。
通过视频我们可以看到,Datarid是一家提供智能 AI 平台的企业,专注于帮助用户存储、管理和连接多源数据,并通过创建自定义 AI 智能体实现高效的数据访问与问题解决。该平台支持与行业专用工具(如建筑行业的 Procore)集成,允许用户通过短信、移动设备等方式随时随地获取所需信息。
Datarid产品介绍(来源:企业官网)
Datagrid这个方向偏向于通过AI智能体提高数据的流动性和效率。
另一家公司叫Skema,它的工作重点更多是AI Agent模版化布局,降低人工重复性工作。具体而言,新项目的设计布局往往与历史项目有许多相似之处。Skema将这些历史项目中的可复用部分,通过AI智能体的方式进行总结和模板化,然后用户可以一键生成布局,并根据实际需求进行修改。
例如,在一个历史项目中,他们会将能够复用的部分提炼出来,形成模版。在他们的软件中,用户可以通过这个模版快速构建新项目的布局,而无需从头开始设计。这种方式通过AI智能体来优化和加速相似任务的执行,赋能未来的工作任务。只有通过AI智能体的形式,这一新的技术才能实现。
Skema产品介绍(来源:企业官网)
第三家公司叫OpenSpace,它代表了另一种方向。OpenSpace不仅仅是软件,它将虚拟与现实相结合,主要用于巡检工作。他们会为工人佩戴一个360度的摄像头,记录工人的巡检路线。在巡检过程中,AI会自动分析工人看到的视觉影像,检测其中可能与原始设计存在差异的地方。同时,系统还会自动生成项目进展报告。这个方向通过AI与现实场景的结合,利用图像数据帮助工人提高巡检效率,减少人工检查的时间和成本。

OpenSpace产品介绍(来源:嘉宾分享)
刚才提到的三个项目大多属于传统的Agentic AI形式。
02 RAG与AEC创新
接下来要讲的是另一种技术,叫做Retrieval-augmented generation (RAG)。简单来说,RAG技术是通过结合知识库的信息,帮助AI提供与特定领域相关的知识。RAG本质上是基于某一领域进行更精准的搜索。利用RAG技术,可以看到几个常见的应用场景。

RAG技术逻辑图(来源:嘉宾分享)
第一个是名为Reviuer的公司,这是一家创业公司。
举个例子,如果你查看北美的建筑规范,像加拿大的每个省都有自己的规范书,每本可能有上千页。而在美国,尽管大家都使用一本叫IBC的建筑规范,但它本身非常厚重,而且每周根据IBC的要求,还会有一些定制化的修订。比如加州只需要关注IBC第1-14章,而其他部分可能需要基于当地的修改。问题是,如何确保在遵循这些复杂的建筑规范要求的同时,确保工程师和建筑师在审图时不会漏掉任何细节?
如果这项工作由人工完成,非常容易出错,而且非常依赖经验。虽然优秀的公司和建筑师有一定的把控力,但难免会忽视一些细节。Reviuer公司通过AI来解决这个问题。用户可以将设计图纸上传,无论是建筑平面图还是其他形式的设计图,AI将这些图纸与对应的建筑规范库进行比对,审核图纸,识别可能的问题点,并用红色标记出来,随后通过批注的形式提示最终用户哪里可能存在问题。这家公司主要专注于建筑领域,但类似的技术也应用于结构、水电、空调等领域。

Reviuer产品介绍(来源:嘉宾分享)
Trunk tools这家公司的工作方式与前述的那些案例有些相似。它的产品上线一年多,其CEO的个人魅力以及在社交媒体上的宣传,使得这家公司广受关注。
实际上,它比DataGrid更进一步,提供了基于短信的沟通平台,专为总包商提升沟通效率。通过短信,用户可以快速获取大量建筑文档信息,并且能够显著提升与现场施工人员或管理人员的沟通效率。在国外,由于没有微信等即时通讯工具,很多现场沟通还是依赖短信。因此,这家公司专注于通过短信平台来改善这一沟通方式。他们的技术也得到了许多投资者的青睐。
Skema产品介绍(来源:企业官网)
03 PINN与AEC创新
最后一位其实也是我们正在研究的一个方向,叫 Physics-Informed Neural Network(PINN)。这个方向代表的是一类问题,不仅限于建筑领域,而是涉及如何在生成式AI表现良好的情况下,通过融入一些物理仿真规律,解决更精细的工程设计问题。
当前的大语言模型并不擅长精准绘制工程图纸。比如,你给它一张图,它可以大致判断出某个区域内可能存在的元素,但如果要求它精确到 XY 坐标级别的设计,基本上是不可能的。基于纯语言模型的方法,在目前的技术水平下难以实现这一点。
而传统的CPU模型在处理工程图时,也存在现实挑战。比如,在工程领域,实际可用的训练数据(图纸)并不多,因此,即便构建一个基于Stable Diffusion的强大模型,也可能面临数据匮乏的问题。此外,工程图纸本身的特性决定了它并不需要过度的创意性,因为大部分空间是留白,而不是充满设计元素。因此,我们需要另一套思路,即在物理限定的框架内,让 AI 生成符合工程需求的设计。
关于这张图,它很有代表性,因为学界目前主要有两条研究思路:第一,纯数据驱动方法——如果给 AI 模型提供完全符合物理规律的训练数据,它能否自主学习并掌握这些规律?第二,物理仿真驱动方法——如果 AI 不能自主学习物理规律,是否需要在训练过程中加入物理仿真器,通过强化学习(RL)或代理模型的方法,把基于公式计算的物理规律反馈给 AI?

纯数据驱动or物理仿真驱动思考(来源:嘉宾分享)
目前,这两条路径都在探索中,而我个人更倾向于第二种方法。
最近字节跳动在几个月前发表的一篇论文,其中对比了多种视频生成模型,探讨它们在物理世界建模中的泛化能力。他们使用了一个简单的物理引擎,模拟匀速直线运动,并在5米/秒到20米/秒的范围内生成训练数据,然后用视频生成模型进行训练。最终实验表明,即使是这种简单的物理运动,AI也只能在训练数据的范围内泛化,比如能理解2米/秒到 40 米/秒的运动,但一旦超出这个范围,就无法准确模拟符合物理规律的匀速直线运动。
这个实验说明了一个关键问题:尽管匀速运动在我们看来是简单的,但对于没有物理验证机制的AI模型来说,它的理解能力是有限的。这一点在现有的视频生成模型中也有所体现,例如在模拟碰撞、重力、透视关系(近大远小)等方面,现有模型仍然存在明显缺陷。如果AI仅依赖启发式方法去拟合物理规律,其表现仍然受到很大限制。而在这一方向上,我们正在深入探索,并已取得一些进展。
这个方向有一家比较有代表性的公司叫Stantec。他们通过AI训练了一套洪水预测模型,与美国37个州的州政府合作,帮助政府预测洪水风险。流体力学本身有一套成熟的仿真软件,Stantec会结合气象信息、河流水文数据以及地理地貌等因素,向政府提供预警和风险信号。这套系统目前来看在落地效果上表现得比较好。

Stantec产品介绍(来源:嘉宾分享)
04 Genia,AI结构设计
再说回我们自己。我们通过生成式AI的方式,把建筑图作为输入,生成对应的结构工程图。
这里涉及的物理因素包括抗风、抗雪、抗震等建筑规范要求,这些规范都需要经过物理验证。如果是低层建筑,可以直接基于公式进行结构分析。但如果是超高层建筑,就需要通过仿真模拟进行更复杂的结构分析。我们正在做的事情,就是如何把这种物理仿真能力和生成式AI结合起来。
这里展示的demo分为三部分。第一部分是申请项目并上传建筑图纸,平台通过生成式AI生成对应的结构方案。第二部分通过邮件将结果反馈给用户。最终,我们会给用户推荐3-5套符合物理规范、造价可控且表现最优的结构方案。整个过程看起来简单,但背后涉及了纵向的结构分析和多维度的成本权衡。
Genia产品介绍(来源:企业官网)
目前,我们的主要客户群体是北美的建筑设计院和总包商。北美市场有两个明显的趋势:一是大型总包公司内部往往会组建自己的工程团队,通常通过收购独立的工程公司来完成;二是北美的建筑行业分工相对独立,建筑设计、结构设计、水电暖通往往由不同公司分别完成,和国内建筑院一体化的模式差异很大。我们的产品主要面向结构工程师,为他们提供赋能工具。
刚才建元基金张宁老师也提到,建筑行业整体数字化水平还比较原始,很难直接用 AI 取代人工。因此,我们最终做的也是一种Co-pilot模式,帮助工程师提升效率,而不是完全取代他们。
今天的分享就到这里,谢谢大家!
(完)
本文来自投稿,不代表AI4ELAB立场,如若转载,请注明出处:https://ai4elab.com/4919.html