在以“重塑创新增长”为主题的“2025Inclusion·外滩大会”上,共有40余家具身智能...
在以“重塑创新增长”为主题的“2025 Inclusion·外滩大会”上,共有40余家具身智能企业亮相。如何协同产业链上下游,将技术突破转化为商业回报,成为不少与会行业人员关注的问题。
“我们的愿景是把具身智能大模型所带来的智能和高性能人形硬件本体结合起来,形成一个完整的产品力服务,让它真正能够实现跨行业应用、走进千家万户、服务千行百业。”9月12日,在“具身智能:从泛化到行动,重塑产业未来”的分论坛上,北京银河通用机器人有限公司联合创始人、大模型负责人张直政分享了团队在具身智能训练方面正在探索的途径和方向。
一个聪明的、会干活的机器人是通过场景训练出来的。在人形机器人迎来爆发的关键阶段,不少企业要面临“具身智能训练的数据从哪里来”的问题。
张直政在现场演讲中介绍,目前行业内已经有通过真机遥操作采集数据。他以特斯拉举例介绍称,在训练电池分拣任务上,需要数十万条数据,40个人要花费一个月时间进行采集。“如果按国内的人力成本来算,我们可能要花数百万人民币。”
在张直政看来,如此耗时耗力的数据采集方式是否会是通往具身智能的最终解决路径值得思考,尤其是当具身智能面临跨任务泛化时,可能需要上万亿条数据。
从2023年创立到现在,银河通用机器人坚持探索的技术路线则是用仿真合成数据。据了解,仿真合成数据具有可控性、效率高,但在文理和语义的学习上比不上真实场景的数据。
张直政表示,目前这个问题已经被图文大模型、数字大模型解决了,现在可以用更多的互联网数据让机器人学语义。银河通用目前在探索的便是,机器人学习动作用仿真数据,学习语义可以部分结合真实数据。
“从前端的各种形态、各种功能数据资产的生成,到动作轨迹的生成,再到最终的渲染,我们实现了一条完整的高效的仿真合成数据的管线。有了这样的管线,我们就可以更快速、更低成本生产更高质量的动作数据来训练我们的具身模型。”张直政讲述称。
据他介绍,银河通用已经生产出世界上目前规模最大的数据集——10亿级别的仿真合成数据,目前内部已经进一步将数量级扩大至百亿级别、千亿级别。
“有了大规模仿真合成数据,我们就能够做到通过预训练让模型在视觉、语言、动作层面实现不同维度的泛化。”张直政提到,这将直接实现效率上的提高,“同样是做电池分拣任务,一个遥操员可能只要花半天不到的时间就能够让具身智能完成技能的学习。”
“通过少量真实数据后训练,可以1000倍提升真实数据效率。”张直政表示,未来还可以打开想象,当学习更多技能时,效率提升可能是上万倍甚至是数十万倍。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
2025年9月12日 一架九三受阅运-20专机 在四架歼-20伴飞下 将30位在韩中国人民志愿军烈士遗骸 护送回国 在沈阳桃仙国际机场 停机坪上架起“水门” 向归来的志愿...
深交所网站昨日披露公告,深交所上市审核委员会2025年第17次审议会议于2025年9月11日召开,审议结果显示,鼎捷数智股份有限公司向不特定对象发行可转债符合发行条件、上市条件和信息披...
9月12日,据路透社报道,瑞银将黄金2025年底目标价格上调至3800美元/盎司,将2026年年中目标价上调至3900美元/盎司(之前为3700美元/盎司)。 瑞银表示,由于就业数据...
9月12日,在第十二批在韩中国人民志愿军烈士遗骸回国之际,沈阳市人民广场举行“强国复兴有我争当新时代好青年”升旗仪式。 新华社记者吴青昊摄pagebreak 9月12日,少先队员在...
近日,国家发展改革委、国家能源局联合印发《关于推进“人工智能+”能源高质量发展的实施意见》,明确提出推动人工智能技术在电网、能源新业态、核电等多场景深度融合与应用。在“AI+能源”的政...