我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

今天凌晨,大家等了很久的Claude Fable 5终于上线了。

这回的期待值格外高。因为它是Claude的一个整数代模型,而之前从4.6到4.8那几版,说句不好听的,提升实在有限,所以这次大家反而更期待了。

我为了测它,直接拿它画了一张建筑CAD:

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

还有马斯克星舰的Raptor 3发动机模型:

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

只能说一句,牛逼。

Fable 5的benchmark参数对比也放出来了,几乎全面领先上一代的Opus 4.8,也领先GPT 5.5,基本所有项都有不小的提升。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

其他技术报告全网都有,我就不多说了。

不过话说回来,从4.6到4.8那一代,benchmark分数也更高,但大家在实际体验里根本没感觉到,甚至有人觉得更差。所以这次的benchmark我也没太当真。分数是一回事,真正值得看的,是它在实际场景里到底怎么用、能做出什么东西出来。

先说怎么用。

Fable 5的定价是每百万输入token 10美元,每百万输出token 50美元,几乎翻了一倍。

从现在到6月22号,Fable 5可以在Pro Max、Team和按席位算的企业版套餐里直接用,订阅里就能用,不用额外付费。

Claude的营销策略一如既往地抽象。6月23号开始,订阅里就不能再用Fable 5了,想用得另花使用积分。API倒是一直能用。等之后资源够了,他们会再把Fable 5放回订阅里。

所以就是现在能用,趁22号之前赶紧用个爽,过了这天可能就用不上了。😆

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

具体怎么用,我其实想了很久,到底拿什么场景去测这一代AI的能力。

前段时间,大家一直在讨论把Claude Code或者Codex跟产业界的各种软件联动起来,挺好玩的。比如我之前就让Codex联动Blender,做了一个人体模型,反响还不错,挺多朋友来问怎么弄。

当时我还看到另一个更有意思的玩法:让Claude Code或者Codex去画CAD。

说干就干。

第一步,下载一个FreeCAD,这是个开源软件。然后让Claude给它配一个MCP server就行。

Fable 5给我的第一个印象就是执行速度非常快。换成用Codex配这套,明显要慢一些。

这回我给了Fable 5一段非常长的建筑CAD提示词,几乎每个细节点都写清楚了。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

Fable 5对提示词的遵循能力强了不少,思考也快,整个执行流程下来,体感上比以前流畅很多。它几乎是自己从0开始,完整做出了一张建筑CAD:

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

高清大图长这样:

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

比较牛逼的是,这次一遍就成了,全程没有一个报错。它在自检的时候也没发现任何报错,没做任何修改。从提示词到最后的成图,一遍过

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

我是Claude Pro 5X用户。画完这一整套,包括让它导出PDF、PNG和DXF文件,完整在系统里画完,只用了15%到25%的小时额度,也不算特别夸张。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

刚好这段时间我研究AI和CAD的联动已经有一阵了,也看过不少CAD建筑图。我让Codex和Fable 5互相点评了一下。能看出来这张CAD图整体是比较完整的。

墙体、门窗、可编辑性,还有出图质量,以及尺寸链、窗位链这些细分项,都做得比较齐全。

但我自己不是搞建筑土木的,没法很好地评判这张图。这时候我突然想起来,我老爹就是在土木行业干了很多年的工程师,手底下带过不少项目经理。这不就是现成的专家。

我就把图直接发给了他。

老爹只回了一句,

画得还可以,但是有错误。

光看前半句,挺让我震撼的。因为从一个专业从业者嘴里说出「画得还可以」,就说明这张图已经过了最基础的工业级门槛。也就是说,它推翻了我之前的一个看法:总觉得AI现在被吹得这么火,可在真正的产业和工业里还是创造不了价值。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

我接着问,这种图如果换专业从业者来画、换普通人来画,各要多久。老爹说,他自己画大概10到15分钟;要是普通实习生或者普通人来画,可能得花上半天到一天。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

然后老爹又仔细查了查这张图,给我挑出了一堆错误,光细致的点就列了11个。这其实也正常。大家平时看AI画CAD觉得挺炫,但里面确实还有不少错,这点得承认。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

不过只让Fable 5画一份、再让专业人士点评,普通人其实看不出太多差别,也看不出这一代模型到底比上一代强在哪。所以我又让Codex GPT 5.5 XHigh完整画了一份,做个对照

下面这张就是Codex做的。说实话,哪怕只用普通人的眼光看这张图,我自己都能挑出一堆问题。很多地方画得很离谱,比如左下角和左中部那几处玄关的开口,完全是错的,错得相当夸张。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

虽然版面要素还算齐全,普通人第一眼观感可能还行。但整个墙体几何和工程性,是完全过不了关的,明显的错误太多了。

这时候我又把老爹请了出来。我问他,这张新图怎么样,满分10分能打几分。老爹还是只回了一句:

这个更差

当场把我整尬住了……

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

至于差多少,老爹给的说法是,差了80%。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

之后我又让Fable 5给两份图打分,自己画的那张和Codex GPT 5.5 XHigh画的那张。它给自己打了8分,几乎所有项都在7分以上。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

而Codex那份,基本就是3分、5分的水平。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

绷不住了。

再说FreeCAD,它最拿手的场景其实是画模型。论画CAD,它没有AutoCAD那么专业,但用来画3D模型会更合适。

于是我又让Fable 5画了一个马斯克星舰的Raptor 3发动机模型

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

我在提示词结尾加了一条,让它自己再去调研一下Raptor 3的外观构造,然后做自检。当然Raptor 3的真实构造是保密的,外界也不太清楚,这里主要是看看整体效果。

这是它做出来的:

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

完整效果:

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

放大看其中一个泵组件的细节——

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

有意思的是,它在最后自检的时候,真的去查了相关资料做对比。查完它发现,真机有一组从喷管顶部卡箍带斜拉到托盘的花篮螺丝拉杆,于是又专门补建了4根,做了最后一轮迭代。

下面这个是Codex画的……抽象到我专门回去确认了一下自己的提示词是不是有问题,搞得我好像有点太黑Codex了:

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

改了一遍,长这样:

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

高下立判。

两个月前,我就已经完全转向Codex了,还买了Codex的Pro5X。那会儿是Claude opus 4.7、4.8的时代,我觉得这两个模型实在太差了,比4.6差远了,就干脆转过去了。

但现在,对不起了。我的忠诚度有点撑不住,接下来真得考虑要不要再回Claude的怀抱了。

最后就一句话:

GPT 6什么时候出啊?是不是也该来了?求求了。🙏

看到这里,辛苦啦。

感谢你的阅读和「在场」!

杉森楠 AI H1-H6 海内外产品交流群已 🈵,请兄弟萌关注后,进 H7 群。

机会不多,先到先得 😆。

我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分
上,如果觉得不错,随手点个赞、在看、转发三连吧,也欢迎给AI4ELAB个星标⭐,以便您第一时间收到推送~谢谢阅读,下篇内容再见
我让Claude Fable 5画了张CAD,工程师老爹愣住了,给出AI真实评分

主题测试文章,只做测试使用。发布者:Connor 秦明,转转请注明出处:https://ai4elab.com/7660.html

(0)
Connor 秦明的头像Connor 秦明

发表回复

登录后才能评论

相关推荐

联系我们
加入社群