来滨江 共同迈入具身智能时代
浙江
浙江 > 资讯 > 正文

来滨江 共同迈入具身智能时代

过去十年,人工智能产业经历了多轮技术浪潮:从机器学习到深度学习,从文本大模型到多模态大模型,从感知到认知……对于普通人来说,一个很直观的感受是:机器人等智能终端变得越来越“聪明”了。

每一次人工智能技术浪潮中,几乎都会产生全新的产业形态和商业模式,也会让传统制造业在生产效率、产品质量、创新能力等方面实现质的飞跃。

谁能把握大数据、人工智能等新经济发展机遇,谁就把准了时代脉搏。被很多年轻极客视作中国“硅谷”的杭州高新区(滨江),赶上了人工智能技术演进的每一波浪潮,培育了宇树科技等一批全球人工智能明星企业。

置身下一次人工智能浪潮的临界点,滨江能为世界人工智能产业激起怎样的浪花?让我们以三问展开。

搭载了联汇科技智能体平台的机器狗在行进

01

机器人进厂打工,现实吗?

人工智能发展史上,每一次技术的跃迁,都会给人类认知打开新的想象空间。

2016年,AlphaGo和李世石对决之前的几个礼拜,许多人还在坚称,人工智能不可能在围棋公开赛上战胜人类对手。那场人机较量的背后,其实是对深度学习技术的一次大考。结果,显而易见。

来到十年后的今天,机器人早已超越深度学习的维度,来到认知的更高阶。一个更具争议的问题在各大科技论坛上被持续讨论:机器人进厂打工,到底是泡沫还是拐点?

先从今夏人工智能领域的一场顶级大会说起。

“请找到会场中的胡萝卜玩偶,并撞击。”

7月底的上海,滨江企业联汇科技把搭载了智能体的机器狗带到世界人工智能大会上,当观众对着这只被命名为“Sugar”的机器狗发出口头指令,Sugar立马开始寻找目标物,并精准对其完成撞击动作。过程中,有观众尝试在Sugar前进的道路上丢掷障碍物,Sugar也能应对自如,主动绕行,直至抵达目标物。

联汇科技CEO兼首席科学家赵天成介绍,Sugar“类人”的行动,主要由联汇科技自主研发的视觉-语言-动作大模型(VLA)驱动。这类大模型,往往可以驱动终端同时进行视觉感知、语言理解和动作执行。用通俗一点的话来说,可以概括为九个字:看得见、听得懂、动得准。

有业内人士评价称,视觉-语言-动作大模型正是未来机器人通用的“大脑”形态之一。今年以来,全球众多公司相继发布自己的视觉-语言-动作大模型,其中,有谷歌的Gemini Robotics,英伟达的Groot N1,Figure的Helix等。

能否自主决策、行动,是决定未来机器人能否进厂打工的关键因素。全球范围内针对视觉-语言-动作大模型博弈的激烈程度,不亚于上半年的大语言模型之争。

下半年以来,滨江人工智能产业图谱内的一批企业纷纷发布视觉-语言-动作大模型。比如,当虹科技发布BlackEye2.0多模态空间大模型,该模型在工业与卫星、车载智能座舱、机器人等方向均可落地应用;海康威视基于海康观澜大模型技术体系,推出新一代多模态大模型,可以应用在工业巡检场景中……

种种案例表明,视觉-语言-动作大模型已经率先进厂,贡献工业产值。很多人工智能领域专家相信,离搭载该大模型的机器人走入产线,也不远了。这一轮,滨江在世界人工智能产业竞逐中,为中国夺下重要的一席之地。

高新区(滨江)具身智能机器人小镇

02

找到场景,为何如此重要?

值得一提的是,这一轮视觉-语言-动作大模型比拼的重心,跟上半年大语言模型接连开源有所不同——比拼的不再是谁发大模型更早、谁登上开源项目榜单更快,而是转为:谁先找到场景?

场景,听起来是一个宏大的概念,实际上它就发生在你我日常生活身边。机械臂抓取芯片,是一种场景;机器人冲泡咖啡,也是一种场景。

再往具体说,智能汽车领域的辅助驾驶,金融领域的智能风控,医疗行业的辅助诊断等,都是人工智能技术在相应场景应用的具体表现。

场景在一个新产业发展的初期阶段特别重要,其他诸如互联网、物联网等许多行业都有这个发展历程。一项新技术要变现,就得主动走向生活生产场景,走入工厂产线,走进百姓家中,走向商业验证。

今年以来,各种传统行业似乎都在主动拥抱人工智能技术、提高产线智能化渗透率,工业制造、市政巡检、安保巡逻、城市管理、医疗康养、文旅接待等领域纷纷有机器人进场,一些人工智能初创企业也开始把“能否适配场景”当作其调整技术路径的方向。

不过,找场景,如果靠企业与企业之间单方面对接,效率难免低下,很多以极客创客为主构成的人工智能初创企业也难以有专门精力去与下游企业洽谈。此时,需要一只有形之手。

杭州,在新一轮人工智能浪潮到来之前,提前预判了企业的需求。今年以来,杭州大力推进“杭州AI+”场景开放示范工程及“场景机会、场景能力”两张清单征集工作,高新区(滨江)也发布场景征集公告,以场景开放创新为关键抓手,加速技术突破与产业升级深度融合。

据了解,根据滨江人工智能产业相关政策,滨江还每年评选一定数量标杆型示范项目,给予单个项目最高250万元投资补助。

人工智能+医疗健康、人工智能+生产制造……在场景开放工程的牵引下,人工智能新兴技术为传统行业赋能的深度和广度不断拓展。数据是最直观的证明,上半年,滨江全区规上工业增加值达465.1亿元,同比增长15.4%。

高新区(滨江)具身智能机器人小镇航拍

03

什么样的机器人,适合进厂打工?

在不同商业场景的验证之下,新兴的视觉-语言-动作等大模型不断训练、迭代,机器人的大脑由此得以不断“进化”。

再回到最初的问题。机器人要想进厂打工,除了要有“聪明的”大脑,还要有什么样的本体?

前段时间,滨江企业宇树科技在数贸会“中国数谷”展位分享了一些观点。“我们认为,定义机器人的通用形态至关重要。”宇树科技副总经理杜鑫峰提到,人类90%以上的工作环境都是按人体工程学设计的,同一款人形机器人在不同岗位、不同场景之间的迁移成本非常低。

能进厂打工的机器人,要想走向千万元级以上的量产,就必须解决通用性这个关键属性。而且,这个本体,要极为“灵活”。

今夏人工智能领域还有一场顶级大会——8月底在北京举办的2025世界人形机器人运动会。

当宇树科技的H1机器人迈开仿生机械腿奋力奔跑,以6分34秒的绝对优势冲线夺金后,台下已经有人开始思考:如此灵活的机器人,如果应用在对精度要求极高的工厂产线上,能否完全取代人工呢?

宇树科技创始人、CEO王兴兴在2025世界机器人大会期间提到,宇树去年就跟汽车工厂合作,在工厂落地部署机器人。

那么,机器人究竟什么时候能够像人一样干活?王兴兴提供了一则看法:时间上,快的话可能2年至3年内会有明显进步。慢的话可能5年,这波浪潮大概率不会超过10年。

滨江,已主动站上新一轮浪潮的临界点。

人工智能时代的竞争,说到底,是人才的比拼、创新的较量。发展人工智能产业,关键在人,尤其是年轻人。在刚刚闭幕不久的2025杭州国际人才交流与项目合作大会开幕式上,杭州重磅发布首批六个“三位一体 两新融合”人才发展创新单元,其中,就有高新区(滨江)“具身智能”人才发展创新单元。

这个单元,将以3.5平方公里的滨江具身智能机器人小镇为核心策源地,联动浙江大学滨江研究院、北京航空航天大学杭州创新研究院等39家高能级科创平台,共同打造全国领先的具身智能产业生态与人才高地。

当人才、资本、技术等要素在滨江充分流动,机器人理解与创造的边界将无限拓宽,人机协同的未来将大有可为。

来滨江,共同迈入具身智能时代!

来源/浙江日报潮新闻 滨江区委宣传部

文字/王心慧 肖鳕桐 涂心如