
在新加坡ATxSummit科技峰会上,业界领袖指出,尽管以机器人形态呈现的具身人工智能(AI)正凭借硬件、仿真与传感器技术的进步变得愈发强大,但更广泛的普及仍有赖于可靠性、安全性、成本控制、数据供给以及更健全的治理标准。
英伟达首席科学家兼研究高级副总裁威廉·达利表示,机器人领域的下一个突破点在于利用AI帮助机器人完成那些未经明确编程的任务。他以一台人形机器人根据文本提示组装模型车为例,展示了机器人基础模型如何让机器在物理世界中自主行动——将视觉输入转化为运动指令。
然而,东京大学教授松尾丰对此持审慎态度。"我们目前还处于全面普及阶段之前,"他说,并补充指出,行业仍需要更优的架构、算法、数据、算力资源、成本效率和安全体系。
应用材料公司高级副总裁兼首席技术官欧姆·纳拉玛苏指出,整个行业已从"能不能造出来"转向"怎样安全可靠地部署"。他将2024年定性为概念验证阶段,2025年为演示年,2026年则进入试点阶段。
纳拉玛苏表示,要实现机器人的规模化落地,系统必须实现更低延迟、更高能效和更优成本。传感器同样至关重要,因为机器人依赖传感器融合来感知和响应物理世界。数据是另一大制约因素——现实世界的机器人数据远比训练软件AI模型所用的互联网级文本数据匮乏。
"我们需要认真考虑标准制定、互操作性和治理模型,"他补充道。
现实世界中的落地部署
商业化部署已在结构化环境中初现雏形。Galbot首席战略官赵宇立表示,该公司已在中国部署了逾1000台机器人,涵盖人形机器人运营的门店、物流设施及医药连锁企业。Galbot同时采用真实数据与合成数据对系统进行训练。
然而,泛化能力依然是一大挑战。赵宇立指出,机器人在已知或半结构化环境中表现良好,但在陌生场景中则力不从心。因此,Galbot目前优先专注于半结构化场景,让机器人从真实部署中持续学习。
Grab首席技术官苏森·托马斯·帕拉达泰斯指出,机器人行业与软件行业不同,涉及大量实体层面的顾虑,"不具备近乎零边际成本"的特性。
他解释说,每台机器人都需要硬件、维护、供应链、传感器以及与建筑物理空间的集成。更新机器人的难度也远高于更新云端软件,尤其是当整个机队需要更换传感器或进行硬件改造时。
正因如此,Grab在规模化部署前会进行大量测试。"在将机器人扩展至数百台之前,我们会先在仿真环境和少量机器人上把问题彻底解决,同时构建数据飞轮,对每次部署进行监控、学习和持续改进,"帕拉达泰斯说。
建立信任同样不可或缺。Grab的自动驾驶试点项目累计行驶了4万公里,并经历数月测试、利益相关方沟通和社区咨询,才正式面向公众开放。
帕拉达泰斯表示,Grab的方法论从客户问题出发,而非从技术本身入手。"爱上客户的问题,但不要爱上解决方案本身,"他说。
公私合作的必要性
与会嘉宾还着重强调了公私合作的重要性。赵宇立表示,中国政府的支持为具身AI创造了测试平台、战略项目和长期资金保障。松尾丰则提到了日本的AI机器人协会(AIRoA)——这是一项开放数据倡议,目标是为开发机器人基础模型的研究人员和企业提供10万小时的机器人数据。
安全标准至关重要,原因在于具身AI能直接作用于物理世界——与纯数字AI系统不同,机器人一旦出现故障,可能造成真实的物理伤害。松尾丰建议,日本和新加坡可以在安全性、互操作性和治理领域的全球标准制定中发挥引领作用。
纳拉玛苏补充道,机器人领域的进步不会是线性的,硬件、软件与数据的进展将以"倍增"的方式相互强化。
达利则强调,具身AI要真正走向实用,智能必须能够在设备本身上高效运行。"我们需要在真实机器人上运行智能,而这些机器人不能像脐带血管一样拴在数据中心上——它们必须自带智能。"这将要求更高效的芯片、软件框架和模型架构。
具身AI的前景依然令人期待。与会嘉宾指出,老龄化人口、劳动力短缺、医疗健康、制造业生产效率以及城市运营,都是该技术可望创造价值的关键领域。近期来看,工业和半结构化环境可能率先迎来大规模应用,但随着时间推移,自主机器人预计将深入公共空间乃至家庭场景。
Q&A
Q1:具身AI目前在现实世界中有哪些实际部署案例?
A:目前具身AI的商业化部署主要集中在结构化或半结构化环境中。例如,Galbot已在中国部署了逾1000台机器人,应用于人形机器人运营的门店、物流设施及医药连锁企业;Grab则在自动驾驶领域开展试点,累计行驶4万公里,并经历了数月测试和社区咨询才正式上线。总体而言,工业场景和半结构化场景是目前落地最为成熟的领域。
Q2:具身AI规模化推广面临哪些主要挑战?
A:具身AI规模化面临多重挑战:首先是可靠性与安全性,机器人在陌生环境中泛化能力不足;其次是成本问题,每台机器人都需要硬件、维护、传感器和供应链支撑,不具备软件那样的近零边际成本;此外,现实世界的机器人训练数据极度匮乏,远不及互联网文本数据丰富;最后是治理与标准缺失,行业亟需统一的互操作性和安全规范。
Q3:机器人基础模型是什么?它和传统机器人编程有何不同?
A:机器人基础模型是一种AI驱动的通用模型,能让机器人在未经明确编程的情况下自主完成任务。与传统机器人编程相比,传统方式需要为每个任务逐一编写指令,而基础模型允许机器人通过视觉输入等感知信息直接转化为运动动作,例如根据一段文字提示就能完成组装操作,具备更强的自主性和泛化潜力。
宝盈优配提示:文章来自网络,不代表本站观点。