半月谈记者 张漫子
最近,人形机器人赛道挤满了巨头。这或许不是最具未来感的赛道,却是感受最直观的。我国人形机器人“第一股”刚诞生半年,多家初创企业已马不停蹄拿下融资,跻身“独角兽”榜单。有了人工智能大模型的加持,机器人的新成员表现出交互性、自主性、通用性的新趋势。
“AI的下一波浪潮是物理AI。机器人将融入我们的日常,一切都将机器人化。”今年6月初,英伟达创始人作出预判。试想一下,炎炎夏日,工作一天的我们告诉机器人“半小时后到家”,机器人立刻打开电视空调、备好一桌好菜,将是多惬意的生活。
人形机器人一定是通用人工智能的终极形态吗?未必。
高岭之花,开在何处?
未来或许可以没有手机,但不能没有机器人。换句话说,比起玩具,机器人的定位是妥妥的“工具人”。
作为玩具的机器人,擅长的是聊天问答、唱歌跳舞、围棋陪练这样“锦上添花”的花活;而作为工具人的人形机器人如今正在进入端茶倒水、炒蛋炒饭、搬运重物、高空作业这样实际的刚需场景。
不久前,优必选工业版人形机器人WalkerS已进入蔚来的总装车间“实训”,成为一名眼里有活的见习厂工。它的一双灵巧手对准车头精准贴上车标,一双敏捷脚带动躯干协调地自动走位到每个座椅进行安全带的拉伸检测,一双慧眼对准车门、车身表面进行缺陷检测。
工业将是人形机器人首个大规模应用的主流场景。小米集团高级副总裁曾学忠预判,未来智能工厂将由三种劳动力构成:70%的自动化设备、20%的人形机器人、10%的人类。人类负责的是价值判定与挖掘,人形机器人则负责实现柔性制造、跨系统协同。三种劳动力协同作业,将重新定义“工人”与“工厂”。
未来的智能工厂,以环境复杂度为纵轴、操作复杂度为横轴的人形机器人从原点向第一象限发散:从小空间的固定环境,延伸到大空间的复杂环境;由自动化的直接操作,进化到使用结构化工作进行装配操作,再到灵活运用多种工具进行通用操作。
5月24日,在第七届数字中国建设峰会现场体验区,超仿生人形机器人“小柒”在向观众致意 魏培全 摄
眼下,智元机器人、小米机器人等人形机器人本体企业已着手研发能够实现汽车底盘装配、外观检测、老化测试、齿轮柱点油、物料搬运等功能的工业版人形机器人。
工业之外,农业也是兼具需求与落地潜力的场景。以农业大省山东为例,每逢苹果采摘季节,都需大量人力。山东半岛苹果树树冠高大,环境高温高湿,采摘风险大。事实上,育苗、移栽、管理、运输等环节,用工量都相当巨大。
农田作业机器人、果蔬采摘机器人、设施蔬菜生产机器人将为农业大国勾勒一个智慧农业的未来。
目前,荷兰已研发出秧苗生产机器人,意大利已研发出叶菜收获机器人,西班牙、日本也分别有了草莓采摘机器人、番茄采摘机器人。只不过受制于山地、丘陵等地形限制,杂草、特殊植被的复杂环境,加上果实的无序排列,都加大了视觉识别的难度,延长了人形机器人的落地应用时间。
具身智能,如何实现?
机器人不是新鲜事物,但这届机器人妙在何处?
底层硬件、运动控制是传统机器人的原有技术,嵌入的人工智能大模型则是新时代的产物,也是这届人形机器人最富有想象空间的地方。人工智能大模型为机器人注入了“灵魂”,使机器拥有了“大脑”,能够自主学习、决策、推理。这是人形机器人区别于传统机械臂的最显著变化,也让人们看到了机器人走向通用的可能。
过去传统的仅从事单一操作的专用机器人或机械臂,如焊接机器人、打磨机器人,本质上是一个自动化设备,仅执行人提前写好的固定程序。
搭载大模型后,人形机器人拥有了类人的三个层次:最表层的肢体运动能力,以及中级难度的多模态感知能力、更高阶的决策控制能力。这三种能力来自人形机器人的三大构成体系:执行系统、传感系统、控制系统,分别对应着人形机器人的三类“器官”——躯体、感知器官、大小脑。
人形机器人的关键不在于“形”,而在于指挥着躯体运动的“大脑”。机器人的“打法”变了。过去的机器人创业者可能是自动化或机械专业出身,但现在人形机器人承载着向具身智能(指具有物理身体并支持感知、运动、交互的智能体)进发的厚望,搞人形机器人的创业者不仅要懂硬件,更要有算法、视觉、AI等领域的积累。
大模型的迭代为机器人带来的革命性变化在于,它不仅应用于机器人“大脑”的理解、推理、规划之中,也将融入到“小脑”“躯干”参与的感知与执行过程。人形机器人拥有更加强大的泛化能力后,将更好地与物理世界交互,进一步降低部署成本、应用门槛。这也是具身智能前进的方向。
机器进化,何时入户?
最近几周,大洋彼岸的预测层出不穷:“未来,移动的物体都将实现自主运行”“人形机器人将如汽车般普及,一个人可能拥有两个人形机器人,甚至更多”……
尽管眼下,全球的人形机器人赛道面临技术关卡、数据瓶颈、量产挑战,但老龄化、少子化社会对人形机器人的呼唤一天比一天迫切。借力多模态大模型、AI智能体的持续进化,人形机器人的成长路径,也将从初级的执行操作,到完成中级的知识学习,再到高阶的智慧形成,不断进化。
人形机器人的落地,会先从进入一个场景(如工业)、实现多个功能开始,拓展到融入多个场景(物流、农业、消费等)、实现复杂功能,然后渐渐走进千家万户。进入家庭的人形机器人又将分为两步走:第一步解决陪伴需求;第二步进入服务场景,比如陪你看球的时候,能察言观色地理解你到底是支持阿根廷还是葡萄牙,然后跟你一起干杯、一起助威。
6月22日,天津举行的2024世界智能产业博览会上,观众触摸人形机器人 李然 摄
如果说Z世代是数字互联网的原住民,被称作Alpha世代的10后、20后是人工智能原住民、大模型原住民,那么下一代或许将成为人形机器人原住民、人形机器人的生活伙伴。
距离斯坦福大学只有几个街区的硅谷计算机历史博物馆中,可一睹百年来计算的变迁、硬件的迭代。硬件的使用门槛越来越低,市场规模越来越大。技术的风口来回漂移,科技巨头的交椅不断易主。往后,将是人工智能软硬件巨头的抢椅子大战。
伴随人形机器人领域新晋创业者的涌入,在人们面前展开的,是一个到2050年产业规模超过30万亿美元的庞大市场。大水之中,必有大鱼。从业者期盼,这一领域中国能诞生伟大的企业,改写重点行业机器人高端应用90%被国外垄断的历史。
回溯计算硬件从复杂到简单的进化史,人形机器人之后,或许还将有更简单、更便携、更微型的硬件取代这些与人类身高、体重、外形相似的机器人。或许,是一只黑匣子、一块屏幕,或许只是一层薄膜。只是,机器进化的方向不会改变:机器将更加主动理解人类,而不是教人类学习如何使用和适应机器。