传统建筑软件如Procore主要服务大型总承包商,年费动辄数千美元,功能复杂需要专门培训。这些产品的设计假设是:用户会坐在办公室,有时间学习复杂界面,愿意手动录入大量数据。
但现实是:建筑工人一天到晚在工地,双手忙碌、环境嘈杂、无法盯屏幕。这种工作场景天然呼唤语音交互——不是作为辅助功能,而是作为主要交互方式。
Plancraft正是抓住了这个契合点。
中小企业主既是项目经理又是会计。更关键的是,小企业主此前从未用过软件,意味着不需要替换已有系统,也不存在用户习惯迁移成本。这给了AI原生应用一个从0到1的完美窗口。
很多所谓的”AI应用”本质上是在传统软件上加了个ChatGPT接口。Plancraft的差异在于:从第一天就围绕语音交互重新设计了整个产品架构。
产品的核心交互逻辑是:工人在工地说一句”今天在项目用了25平方米石膏板,工作8小时”,系统自动完成语音识别、实体抽取、单位换算、成本计算、数据归档和多端同步。整个流程1分钟内完成,而传统软件需要打开界面、选择项目、填写表单,至少10分钟。
这背后的技术难度远超通用语音识别。建筑行业充满专业术语和非标准表达:”干墙板”、”找平”、”吊顶”、”二十个平方”。通用语音模型对这些表达的识别准确率无法达到商用标准。
Plancraft的解决方案是用近10亿欧元真实项目数据训练行业专用模型。这些数据包含了不同工种的标准表达、材料消耗规律、成本结构模式。更重要的是,模型需要在工地的极端环境中工作——电钻声、卡车声、多人交谈,AI必须学会在强噪音下提取有效信息。
技术架构的第二个层次是从语音到结构化数据的智能转换。当工人说”铺了二十平方的干墙板”,系统不仅要识别文字,还要理解:这指的是20平方米石膏板,需要自动计算对应的螺丝和胶带用量,关联到项目的材料成本科目,更新库存消耗记录。这种”理解业务语义”的能力,是通过大量行业数据训练出来的。
第三个层次是多模态融合。虽然语音是主要输入方式,但系统保留了屏幕界面用于确认和审核,形成”说话输入、屏幕审核”的闭环。这种设计既保证了效率,又满足了企业对数据准确性的要求。
传统垂直行业SaaS的逻辑是”把线下流程搬到线上”——把纸质表单变成电子表单,把手写台账变成Excel。Plancraft的理念是重构工作流本身,杀死表单,消灭界面。
本文来自投稿,不代表AI4ELAB立场,如若转载,请注明出处:https://ai4elab.com/6187.html