广告
当前位置: 首页-> 财经->内容

MIT提出掩码逆强化学习算法利用大模型赋能机器人

发布时间:2026-06-09 15:17来源:盖世汽车 阅读量:18283   

盖世汽车讯 设想在不久的将来,工作人员在仓库或办公室带一名新员工熟悉岗位,而这名新人是一台机器人。想要教会它工作,工作人员可以采用“边演示边讲解”的教学方式:实操演示多种作业方式,同步口述操作要点。

举例来说,工作人员让机器人把咖啡放到桌上,不能打扰正在线上开会的同事。工作人员希望机器人远离自己和笔记本电脑,避免打断会议。想要实现该效果,需要用完整任务数据训练机器人。以往科研人员要么录制大量实操演示,要么撰写详尽操作说明来教会机器人完成抓取作业;一旦缺少足量演示样本或详细文字指引,机器人极易误解任务要求。

对人类而言,这种“演示加讲解”的过程相当费时费力。据外媒报道,麻省理工学院计算机科学与人工智能实验室的研究团队实现了一种机器人教学自动化方案,这套方案可自动完善模糊指令,且所需演示数据减少了近五分之四。

研究提出掩码逆强化学习算法:依托首个大语言模型,结合人工演示数据补全语义含糊的指令;再由另一套大模型筛选关键信息,敲定需要写入运动规划的细节,让机器人能够在家庭、办公室、工厂环境中安全完成各类作业。

声明:免责声明:此文内容为本网站转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。

最新文章
今日 推荐
  • 拆解权益市场配置核心逻辑

    ◎农银汇理基金经理罗文波 当前,受多重因素影响,权益市场的投资难度显著增加。传统策略或已失效,资产...

  • 2026宿迁经开区首届青

    6月6日,“奔跑吧·少年”宿迁经开区首届青少年校园三大球校际联赛闭幕式在厦门路实验学校举行。 本次...

  • 万亿赛道开启商业化元年行

    2026年被不少行业专家称为太空光伏商业化元年,光伏与航天产业跨界融合进入实质落地期。近日,随着两大...

  • 电力产业链景气度持续提升

    6月份以来,多家A股上市公司集中披露中标信息,电力领域订单迎来集中释放,行业整体发展态势向好。 例...

  • 2026品牌生态联合盛典

    证券之星陆雯燕 6月3日,智绘生态碳路未来2026品牌生态联合盛典在上海举办。协鑫集成携手华为、百...

  • 连云港经开区:“山海有爱

    六月盛夏,高考大幕正式拉开。为切实助力广大学子逐梦考场,连云港经济技术开发区坚持以党建引领基层治理为...

  • “陈皮之乡”飘出咖啡香,

    在广东江门,空气中常年交织着两种香气:一种是传承数百年的新会陈皮柑香,另一种是风靡当下的咖啡焦香。 ...

  • 科技如何赋能乡村发展?气

    “生态文明建设需要脚踏实地的艰苦实践,也需要直抵人心的温情表达。”中国外文局副局长于运全介绍说,科技...

  • 文史名家齐聚南京“世界文

    6月6日下午,一场主题为“文润金陵·诗酒话千年”的文学沙龙在南京“世界文学客厅”圆满落幕。活动特邀南...

  • 盐宜高铁长江隧道国产超大

    6月4日,盐宜高铁长江隧道工程建设迎来重要进展,国产超大直径盾构机“奋楫号”刀盘与盾构机盾体精准“合...