上个月在济南参加省里的制造峰会,有个企业老板跟我说:"我们花大价钱烧了个行业垂直大模型,年底一测,还不如直接用通用大模型。"这不是个例。过去两年,"每个行业都要有自己的垂直大模型"几乎成了共识,政府发语料券、训练券,企业领补贴入场,热闹得很。但一线做下来的人都知道——这条路走不通。
炼丹:烧钱、不可控、还停不下来
行业内管训练模型叫"炼丹",这词精准得可怕。同样的原料、同样的火候,第一炉烧坏了,第二炉同样的配方烧成了——为什么成了?不知道。大模型本身就是不可解释的,你的训练结果也是。
更现实的问题是:企业那点数据量,想去影响一个千亿参数模型的权重?这就像往大海里撒了一把盐,然后指望海水变咸。有家企业老老实实烧了自己的垂直模型,年底拿它和通用大模型做对比测试,结果——啥也不是。
最致命的是第三个问题:你终于烧成了,下个月 DeepSeek 发布了新版本。怎么办?用旧的,还是重新烧一遍?重新烧,钱一分不少;凑合用旧的,你花大价钱训练的东西就过时了。这不是一次性投入,是每年都要烧的持续成本。
博士生不需要背下公司制度
换个思路想这件事。
你招了一个顶尖的博士生来公司上班。有两种用法:第一种,让他入职前把公司所有规章制度、业务流程全部背下来,考试合格才能上岗;第二种,给他配全套可检索的资料库、系统权限和业务助手,他来了就能干活,需要什么随时查。
第一种就是垂直大模型的思路——把企业数据洗进模型脑子里。第二种是企业本体语义模型的思路——数据留在企业自己的系统里,模型只是来干活的工具。
这就是我们正在做的事:不试图把企业数据洗进大模型,而是给企业构建一套信息的关联网络——生产工艺、流程、设备、产能、客户,全部建立关系和定义。AI来了,不需要"记住"你的业务,它只需要能"查到"你的业务。
大模型是电,你需要的不是发电厂
这个类比帮很多企业老板一下子想明白了:大模型就是电,我们做的是电器。你不会因为要用空调就自己建个发电厂,但你确实需要一套好的电器系统。
本体语义模型就是那套电器。它解决一个关键问题:大模型可以随时换。今天用 DeepSeek,明天换千问,后天又出了新的——没关系,你的企业知识网络不跟着换。而且大模型越强,你的系统越强,因为你始终用的是最好的"电"来驱动你的"电器"。
反过来,如果你走的是垂直大模型路线,大模型一升级你就焦虑:我到底是跟着升级重新烧,还是守着旧版本?这不是企业该有的状态。
先通电,再组电网
落地的时候别一上来就谈平台。很多企业之前被大厂的数字化项目伤过,花了几百万没做出来,现在只敢先解决眼前的小痛点。这没问题。
先做点上——CAD图纸秒级匹配、视频SOP从2天压缩到十几分钟、订单排产从加班两天变成自动拆算。2到4周上线,短平快见效。这些不白做,未来智能体上线后,现有的数字化成果都能串起来。
但心里要有根线:两年后,完成平台化改造的企业和没改造的,会形成代际差。就像手工作坊和机械化生产,不是效率差一点,是生产模式根本不在一个时代。
先做对的事情,再把事情做对
方向错了,投入再多钱也打水漂。垂直大模型这条路,大部分制造企业不该走。构建自己的本体语义网络,让大模型来"查"而非"记"——这才是企业AI落地的正确姿势。