物理AI:小鹏押注的下一个十年

汽车、飞行器、机器人,都是物理AI的载体。

小鹏汽车创始人何小鹏近期做了一场分享。核心是一个概念:物理AI。

这不是新词,但小鹏给出了自己的定义。数字世界的大模型加上物理世界的运动能力,两者融合,就是物理AI。汽车、飞行器、机器人,都是物理AI的载体。说白了,就是让AI不只是在屏幕上聊天,而是能真正控制这些实体。

小鹏在测一个叫VLA的自动驾驶大模型。

传统自动驾驶怎么做?工程师定规则,写算法。遇到红灯停车,遇到行人刹车。本质是把人的驾驶经验翻译成代码。

VLA不这么干。小鹏用海量真实驾驶数据训练模型,让模型自己学。数据足够多,模型足够大,就能涌现出新能力。

何小鹏举了三个涌现的新例子:

第一,路人招手,车会自动停下。因为训练数据里有招手停车的场景,模型学会了这个关联。

第二,红绿灯路口,人行横道的灯从绿变红时,车会有准备起步的动作,但不会真正启动。这是一种预判能力。

第三,观察前车轮胎角度判断对方是否要变道。人开车一般不会盯着前车轮胎看,但模型会。

这三个能力都不是程序员写进去的。模型自己从数据里提取出来的。

何小鹏说,复杂路段的表现提升了13倍。最终发布时可能达到50倍。

这个数字意味着很多以前解决不了的场景,现在能解决了。自动驾驶的可用范围会大幅扩展。VLA模型还在测试。实际路测效果如何,量产后稳定性怎样,这些需要时间验证。

小鹏下个月要发布新一代人形机器人。

技术路线上,做了一个叫VLT的系统。输入是视觉和语言,输出是任务执行。架构上用超五个操作系统模拟人体结构,如VOT、VOA、VOM,实现大脑、小脑、脊椎、肌肉的组合能力。

目标是让机器人从遥控型变成自主型。现在的机器人大多需要人远程操控。小鹏想做的是让机器人自己决策,自己执行。

何小鹏判断,2到5年内,人形机器人会在部分行业落地。10到20年内会进入家庭。市场规模会超过汽车。

这个预测够激进。但考虑到大模型的发展速度,也不是完全没可能。

小鹏下个月有个AI科技日。届时会公布更多细节。值得关注。

物理AI:小鹏押注的下一个十年

何小鹏,图源:现场演讲,经Sora风格化处理

以下是何小鹏的文字实录,经AI润色:

大家下午好。非常高兴在这里和大家分享小鹏对AI的思考。

过去三年,AI一直是热门话题。但我认为,目前绝大部分AI还是数字化的AI,是相对初级的AI。因为很多企业提到的AI,并不是真正的大模型AI。

今天我主要想讨论两个问题:第一,物理世界如何与AI结合?第二,大模型AI如何与物理世界耦合?这是小鹏的一些思考。

科技变迁的历史框架

站住科技演进层面,我在思考两个问题:第一,过去30年的科技变迁中,哪些公司在什么位置成为了大公司?第二,未来十年的科技变迁会在哪些位置诞生新的大公司?这如何指导我们每一步的决策?

我们简单回顾一下过去30年的几个阶段。

首先是互联网。大家都知道有个模式叫Wintel,就是Windows加Intel,这是两家公司。Windows是操作系统厂商,Intel是芯片厂商。

在1995到2005年这段时间,我们看到三种公司非常强大:第一是做操作系统的,第二是做芯片的,第三是做本体的——比如做电脑、笔记本、服务器的。

他们把这三种能力整合在一起,连接到互联网,形成了很多互联网平台公司。在中国,比如新浪、百度。在海外,30年前、20年前也有很多大型互联网公司。

2010年左右,移动互联网来了。但它发生了变化。操作系统变成了Android和iOS。本体厂商变成了智能手机厂商。芯片厂商也变了,Intel并没有在手机芯片领域保持强势。

再看汽车领域。100多年前汽车被发明,直到现在,汽车里的硬件都是绝对的主导者。所以很多汽车厂商认为,汽车不可能像互联网、移动互联网那样,最后只剩赢者通吃、大者恒大。因为在硬件领域,没有这个规则。

在硬件领域,最重要的是什么?是动力,也就是引擎,需要石油燃烧。在原来的互联网或移动互联网公司,没有”数据是燃料”这种说法。

但最近十几年出现了第一个变化,就是电动汽车。特斯拉、蔚来、小鹏、理想等一系列公司出现了。

我们看到:第一,硬件的能源发生了变化,从汽油变成电力。第二,动力发生了变化,从内燃机变成电机。这形成了新一代的新能源汽车。

物理AI的诞生

最近几年,大模型AI出现了。它变成了一个很有意思的新物种。

比如大家都知道的OpenAI。这家公司主要做了两件事:第一做了大模型,大模型是全新一代的操作系统。第二,全新一代的算力是谁?是英伟达。

但在大模型世界里,模型不是最重要的。所以我们看到Meta的Llama开源,阿里巴巴的千问开源。因为源代码已经不重要了,数据比源代码更重要。

所以新一代AI模型公司出现了变化:操作系统、算力和数据都形成了价值,但数据往往依托在模型上,紧跟着操作系统。

今天在数字AI领域,还没有形成像互联网或移动互联网那样的平台公司或生态公司。那么,如果我们把物理世界的能力和数字世界的能力合并在一起,会出现什么情况?

这是第一次,数字世界的操作系统加上数据,和物理世界的运动能力可以组合起来,形成全新的物理AI。

在物理AI里,从操作系统到算力,到动力到能源,一直到数据的价值,全部都在发生巨大变化。

换个角度说,新的AI正在创造全新的生产力。以前我们讲的生产力是改造自然的能力,现在包括了智能体,特别是物理世界的智能体改造世界的能力。

更重要的是,生产关系一定会因此改变。原来生产关系是人与人之间的关系,后来在互联网时代是人加上人与机器之间的关系,而在未来,机器会变成超级智能体。

小鹏的探索方向

小鹏汽车在这个十年里,我们真正在探索什么?

第一,未来的出行是怎样的?它一定是物理世界与AI世界的组合。第二,所有的交通工具,包括汽车、机器人,全部都是集成智能,并且真正面向全球。

所以小鹏汽车在物理AI领域,我们正在做全域研发。

这个全域研发有几个重要逻辑。大家都知道乔布斯说过一句话:真正想把软件做好的人,最终要做硬件。

在过去二三十年前、20年前,很多人不这样做,包括我的第一次创业。因为在过去,服务器也好、PC也好、智能手机也好,硬件是趋于统一的、稳定的、一致的。

但在未来的物理世界里,硬件是不同的、变化的。只有做了硬件本体和硬件动力,才有可能实现巨大创新。

在这个时候,要全栈自研,要软硬结合,要跨域融合,用AI驱动。

所以在物理AI时代,我相信:大模型是全新的操作系统;芯片自研才能发挥模型的能力;数据第一次成为硬件的核心,它燃烧驱动了未来的变化;最终结合本体和动力。

VLA自动驾驶大模型

今天和大家分享小鹏在物理AI领域的两个有趣发现。

第一个是全新的VLA自动驾驶大模型。目前我们正在测试中。

大家都知道,过去所有的自动驾驶都是用规则、算法或微型模型写出来的。本质上是人类把自己的规则和开车方法用程序实现。

但小鹏这一代VLA——我们还没有发布,正在测试中——我们发现,如果把物理世界能开车的数据,用超大型的数据、超大型的模型去让它学习,它会形成一个特别不一样的现象。

第一个现象:它在复杂路段的效果提高了1300%,也就是13倍。我认为最终发布时,它可能是超过50倍的能力。

在非常复杂的路段,如果有十倍、百倍的提高,会出现什么?会出现很多你想不到的涌现。

我和大家分享三个有趣的涌现。

第一个涌现:我们做完这个模型后发现,有些车当周边有人招手时,它竟然会自动停下来。

因为在我们的数据里,有朋友、家人招手、车停下来的数据。它看到这个人在路边定向向我们的车招手,自动驾驶模型就自动停车了。

第二个涌现:一个人在等红绿灯时,如果前方的红灯还是红灯,但人行横道的灯从绿灯转成红灯,它会怎么做?它会准备启动,但不能启动。

我们新的模型里,当人行横道的绿灯变红时,它会有一个微微的启动动作,但它就像踩住了刹车,它没有启动,它会有这样的反应。

第三个涌现:当你向前开车,你右前方有辆车的轮胎,前轮胎向左轻轻打了一下,代表什么?它想切线,但你看不到它的转向灯。

这时一个人开车不会去看右前方车的轮胎会不会向左打,但我们的模型会看。

这三个全部都是涌现,全部不是靠规则实现。当然这三个涌现,我们目前已经看到,有两个在小鹏下一代VLA中实现。

所以我特别想说:在物理世界的AI,不是用人的语言或人的规则去实现的。

全新一代人形机器人

再举个例子,小鹏全新一代机器人。

当然大家在这个视频上看到的机器人是我们去年上一代的机器人。全新一代机器人,我们下个月会正式发布。

我们即将引入一个全新的AI系统,叫做VLT。它是将视觉和语言输入直接输出,生成任务系统,甚至将来进化成思考。

在机器人领域,我们正在构建一个由超过五个操作系统组合的VOT、VOA、VOM,去实现人的高阶大脑、小脑、脊椎和肌肉的组合能力。

只有这样才有可能真正把我们现在的遥控型机器人变成自主型机器人。这是我非常期待的。

我相信人形机器人在未来两到五年里,就会在全球很多行业带来真正的巨变。而在未来十年到20年,会对所有家庭生活都产生巨变。

小鹏的产品布局

所以在小鹏的物理AI里,我们一直在做:从自动驾驶汽车到未来的robotaxi和无人驾驶汽车。明年小鹏也会第一个把前装的robotaxi汽车向全球首发。

同时我们在过去11年里做了飞行汽车,我们也在明年计划真正量产。

人形机器人我相信虽然起步会比飞行汽车和汽车要慢,但它成长的速度一定高过汽车,它未来的市场规模也会高过汽车。

这就是小鹏今天的分享。更多信息,我们希望在下个月小鹏的AI科技日里和大家再分享。今天就到这里,谢谢大家!

(完)

如有想法问题,欢迎交流链接,

更多合作:内容撰写,需求对接!

图片

本文来自微信公众号“AI4ELAB”,作者:Connor 秦明

本文来自投稿,不代表AI4ELAB立场,如若转载,请注明出处:https://ai4elab.com/6203.html

(0)
Connor 秦明的头像Connor 秦明

发表回复

登录后才能评论

相关推荐

联系我们
加入社群