发布时间:2025-03-10 13:50来源:东方网 阅读量:16723
3月10日,澎湃新闻记者从上海市经信委获悉,当天上午,智元机器人正式发布首个通用具身基座大模型——智元启元大模型GO-1。
智元提出了Vision-Language-Latent-Action架构,该架构由VLM(多模态大模型) + MoE(混合专家)组成。智元启元大模型GO-1借助人类和多种机器人数据,让机器人获得了学习能力,可泛化应用到各类环境和物品中,快速适应新任务、学习新技能。同时,它还支持部署到不同的机器人本体,并在实际的使用中持续进化。
智元机器人服务场景。
举例来说,用户给出指令告诉机器人要做的事情,比如“挂衣服”,模型就可以根据看到的画面,理解这句话对应的任务要求。然后,模型根据之前训练时看过的挂衣服流程,设想这个过程应该包括哪些操作步骤,最后执行这一连串的步骤,完成整个任务的操作。
在更深层的技术层面,GO-1大模型具备了通用的场景感知和理解能力。在构建和训练阶段,该大模型学习了互联网的大规模纯文本和图文数据,因此能够理解“挂衣服”在此情此景下的含义和要求;学习过人类操作视频和其他机器人的各种操作视频,所以能知道挂衣服这件事通常包括哪些环节;学习过仿真的不同衣服、不同衣柜、不同房间,模拟过挂衣服的操作,所以能理解环节中对应的物体和环境,并打通整个任务过程;最后,因为学习过真机的示教数据,所以机器人能完成整个任务的操作。
具体来说,该款大模型的特点可以归纳为4个方面。
一是人类视频学习:GO-1大模型可以结合互联网视频和真实人类示范进行学习,增强模型对人类行为的理解。
二是小样本快速泛化:该大模型具有泛化能力,能够在极少数据甚至零样本下泛化到新场景、新任务,降低了具身模型的使用门槛,使得后训练成本非常低。
三是一脑多形:该大模型是通用机器人策略模型,能够在不同机器人形态之间迁移,快速适配到不同本体。
四是持续进化:该大模型搭配一整套数据回流系统,可以从实际执行中遇到的问题数据中持续进化学习。
智元机器人在五种不同复杂度任务上针对GO-1的测试显示,相比已有的最优模型,GO-1的任务成功率领先,平均成功率提高了32%,其中在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(补充饮料)的任务中表现尤为突出。
声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。
深圳证券交易所上市审核委员会2025年第4次审议会议于2025年3月7日召开,湘潭电化科技股份有限公...
“数据恢复非常重要,可以帮助企业应对技术问题或其他因素导致的各种未知的情况。在中国,企业越来越多地意...
本期特邀专家/李昕陈秋梅 一周热话题 青春期,是孩子从懵懂走向成熟的转折点,也是父母与子女关系面...
在上海嘉定,有一座如同“汽车博物馆”的名车MALL,尤为吸引人们驻足的目光,在这座汽车发烧友的梦想殿...
12月14日,由内蒙古自治区人民政府驻上海办事处主办的全方位建设模范自治区暨“科技兴蒙产才融合”政策...
岁末年初,“中华商业第一街”南京路步行街将再次披上跨年节庆盛装,迎来2025年“南京路和你一起迎新年...
据上海海关23日发布的统计数据,今年前11个月,洋山特殊综合保税区进出境货物“径予放行”货值159....
近日,2025《商业周刊》彭博绿金中国ESG50最值得关注榜单(以下简称“彭博绿金ESG50榜单”)...
富士胶片商业创新(中国)有限公司12日通过线上线下的形式举办了“创新驱动非凡未来”CMKY+特殊色数...
全国单板滑雪大跳台冠军赛、全国自由式滑雪大跳台冠军赛收官广西冰雪健儿摘获1金2银1铜 2月21日,...