首页 生活常识 百科知识 范文大全 经典语录 家电维修 实时讯息

银河通用创始人王鹤勾勒人形机器人产业新图景,合成数据破局具身智能落地网友怎么看

2025-06-28 20:06     更新时间:2025-06-28 19:32:37     208次浏览

  炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

  文/新浪财经上海站 陈秀颖

  6月28日于上海智能工业中心开幕的“具赋新能 智驱未来”青年科学家成果转化暨具身智能高质量发展研修会上,百余位全球青年科学家与逾130位上市公司企业家云集。

  北京大学助理教授、银河通用创始人及CTO、智源学者王鹤的演讲——合成数据赋能的具身大模型开启工商业场景规模化落地。 

  2023年5月,银河通用成立之初,便迅速拿下种子轮融资。此后,头部机构持续加入,旗下几乎汇聚了各类型顶级投资机构,由此走到聚光灯下。

  具身智能,作为让机器人具备理解物理世界并与之交互能力的尖端领域,近年来风头正劲。尤其在多模态大模型加持下,“端到端”的技术路线被普遍视为通向“通用”的曙光。

  王鹤在演讲伊始,便将具身智能与已取得长足进步的自动驾驶领域进行了量体裁衣的对比。他指出,自动驾驶历经十年发展,其辅助驾驶功能如今能在国内城市普及,核心正是端到端模型。相比之下,具身智能的任务范畴更广、所需数据量级更大、技术复杂度更高,但“端到端”之路依然值得坚持,否则规则驱动的旧范式将在可扩展性上举步维艰。

  然而,最大痛点旋即浮出水面:数据。自动驾驶数据能依托海量行驶车辆(头部车企单日可回流高达1亿条片段)自然采集。但具身智能,尤其是人形机器人领域,却深陷数据泥潭。“卖未成熟产品给用户,他们不会买单;没有用户,数据就无法自然回流。”王鹤直言。

  当前全球最大具身智能数据集仅达百万条级别,与自动驾驶的单日数据量相比相差数个量级。即使如银河通用等头部人形机器人公司,今年量产目标也仅定在“超过1000台”,离“一万台”仍有距离,与汽车百万级保有量更是相差两个数量级。更严峻的是,机器人的自由度(单臂6-7个,全身50-100个)远超汽车,意味着对数据的需求成倍增长,采集成本高昂(单人单日约采1000条)。

  面对这近乎无米之炊的困局,王鹤团队独辟蹊径,找到了关键突破口:大规模合成仿真数据。“真实数据长期看固然重要,但产业发展初期不能坐等功能成熟后才闭环数据采集。”王鹤强调,唯有以合成数据为主力,辅以少量高质量采集的真实数据,才能实现高效破局。

  银河通用通过构建庞大的仿真合成数据集,生成海量虚拟操作轨迹与标签,同时攻克“仿真-真实”差距难题,最终打造出了其核心技术——基于合成大数据预训练的端到端具身大模型。

  其代表作“”模型便是明证:这是全球首个完全依靠合成数据(10亿帧)预训练的视觉-语言-动作(VLA)大模型。它在仿真环境中模拟了桌面场景下对近百万种物体的抓取,每个场景均配有语言任务描述,并在光照、物体材质、类别等方面进行了充分随机化。

  其结果令人惊叹:模型能在完全未见过的真实环境与物体(如购物车、挖掘机模型、游泳眼镜、测电笔)中,仅凭语言指令(如“抓取测电笔”)就游刃有余地完成精准抓取,且具备闭环实时动态调整能力,且具备强抗干扰性。

  理论模型的高效,最终指向了商业化的成功。 

  王鹤展示了合成数据方案带来的革命性效率提升:仅需极少量的真实数据微调(例如,“按顺序抓取箱子中的矿泉水”技能仅需每人约2小时采集的200条数据),模型即可精确理解人类意图,并能零样本泛化到同类新物品(如从训练用的怡宝水到农夫山泉、东方树叶)。更令市场瞩目的是其在零售场景的突破性应用——基于99%合成数据+

相关文章:

上海硅光未来产业集聚区启动建设,什么是硅06-28

上海地铁上新“碰一碰”!数字人民币硬钱包06-28

国家发展改革委紧急追加安排1亿元中央预算内06-28

城区多处被淹,航拍贵州榕江最新现场具体真06-28

解码投资获得感新范式  华夏基金一年一度指06-28

新治安管理处罚法明年元旦起施行,明确治安06-28

(c)2008-2028 www.jiazhengayi.com 家政阿姨网 -生活类B2B门户网 SYSTEM All Rights Reserved