谷歌展示全球首个多任务AI智能体 仅需100次训练便能完成任务
时间:2023-06-27 02:09:54来源:每日经济新闻

每经记者:蔡鼎 每经编辑:兰素英

机器人正迅速成为人们日常生活的一部分,但它们通常只用于特定任务。虽然人工智能领域的最新进展可以使机器人在许多方面发挥作用,但全球在通用机器人制造方面的进展仍然较慢,部分原因是收集真实世界的训练数据需要大量的时间。近日,谷歌旗下AI团队DeepMind的最新研究或可解决该领域面临的这一“痛点”。

美东时间6月20日,DeepMind展示了用于机器人的AI智能体RoboCat。DeepMind称其为全球首个能解决和适应多重任务的智能体。更重要的是,RoboCat是一个可以自我改进的AI代理,其可以操作不同的机械臂,而且只需最少100次演示即可解决任务,并从其自生成的数据中进行改进。


(资料图片)

当地时间2023年6月14日,法国巴黎,2023年VivaTech科技创新展览会举行,一位参观者怀抱着一个机器人 视觉中国图

全球首个多任务AI智能体

谷歌旗下AI团队DeepMind的最新论文介绍了一种能够进行自我改进的AI代理,本质上是由AI赋能的软件程序,相当于机器人的“大脑”,由其加持的机器人与传统机器人不同之处在于,RoboCat更具“通用性”,并可实现自我改进、自我提升。

DeepMind在之前的研究中探索了如何开发支持大规模学习多任务的机器人,并将语言模型理解与辅助机器人的现实世界能力相结合。这个名为RoboCat的机器人智能体是全球首个能解决和适应多重任务的AI智能体,能够学习在不同的机械臂上执行各种任务,然后自我生成新的训练数据来对其进行改进。

RoboCat的学习速度比其他先进模型快得多——只需要通过100次左右的演示,RoboCat就可以学会操控机械臂来完成各式各样的任务,然后通过自生成的数据来进行迭代改进。这种能力将有助于加速机器人研究,因为这减少了对人类监督训练的需求,也是创造通用机器人的重要一步。

DeepMind的研究科学家、RoboCat团队的共同作者Alex Lee表示,“我们证明,一个大模型可以解决多个真实机器人承载的各种任务,并能迅速适应新的任务。”

据DeepMind,RoboCat基于其多模态模型Gato(西班牙语“猫”的意思),它可以在模拟和物理环境中处理语言、图像和动作。DeepMind将Gato的架构与一个大型训练数据集结合并起来,该数据集由各种机器人手臂的图像序列和动作组成,可以解决数百种任务。

在DeepMind演示视频中,RoboCat已经可以通过自主学习操控机械臂,完成“套圈”“搭积木”“抓水果”等任务。这些任务看似简单,但考验了机械臂操作的精准度、理解力以及对于形状匹配难题的解决能力。目前RoboCat完成一项新任务的成功率已经在初期36%的基础上提升了一倍。

基于原始数据集和新训练产生的数据,RoboCat的数据集将包含数百万次的训练轨迹数据。它学习的新任务越多,它就能更好地学习和解决额外的新任务。DeepMind的论文认为,执行任务成功率的大幅提升,是由于RoboCat的经验越来越丰富,就像人们在特定领域加深学习时发展出更多样化的技能一样。RoboCat独立学习技能和快速自我完善的能力,特别是当应用于不同机器人设备时,将有助于为未来的研究铺平道路。

将引领AI下一个浪潮?

《每日经济新闻》记者注意到,目前在机器人领域,包括特斯拉、谷歌、亚马逊、英伟达、腾讯等巨头已经有所布局。然而,正如DeepMind上述论文指出,由于训练机器人需要大量的时间,因此智能化水平仍不足,难以实现大规模的商业化。而RoboCat的问世或许能解决这一“痛点”。

其实,DeepMind的RoboCat只是AI赋能机器人的主要案例之一。今年以来,已经有数家公司将语言模型运用到了机器人上:2023年年初,谷歌推出视觉语言模型PaLM-E,并运用到工业机器人上;4月,阿里巴巴将千问大模型接入工业机器人;5月,特斯拉人形机器人Optimus展示了精准的控制、感知能力,同月,英伟达发布全新自主移动机器人平台。

得益于此,人工智能加持的机器人化身具身智能(Embodied Intelligence)吸引了全球的广泛关注。

马斯克在特斯拉2023年股东大会上便表示,人形机器人将是今后特斯拉主要的长期价值来源,“如果人形机器人和人的比例是2比1左右,那么人们对机器人的需求量可能是100亿乃至200亿个,远超电动车的数量”。英伟达创始人黄仁勋在ITF World 2023半导体大会上也表示,AI下一个浪潮将是“具身智能”。

东吴证券研报指出,具身智能首先需要听懂人类语言,分解任务、规划子任务,移动中识别物体,与环境交互,最终完成任务。东吴证券认为人形机器人很好地契合了具身智能的要求,有望成为标杆应用。“机器人研究的关键在于让机器人适应人类环境,最终走进千家万户的生活(工业、餐饮、医疗等多领域)。人形机器人有望率先在B端上量,最终打开C端市场。远期市场空间可观。”

东吴证券预计,2035年,假设人形机器人价格为20万元,且照顾、陪伴功能分别为美国/欧洲/亚洲市场累计新增了5%、7%、4%的渗透率,即单年渗透率分别为1%/1.4%/0.8%。在较悲观/中性/较乐观的场景中,家庭场景的市场规模将分别达到3.00万亿、3.66万亿、4.26万亿元。

每日经济新闻

标签:

最新
  • 谷歌展示全球首个多任务AI智能体 仅需100次训练便能完成任务

    每经记者:蔡鼎每经编辑:兰素英机器人正迅速成为人们日常生活的一部分

  • 环球短讯!为什么说深湖比深海更可怕?是湖泊中有可怕生物,还是另有原因?

    小时候调皮,有一次一个人偷偷去水库游泳,游了一会儿后我爬上一个竹排

  • 玩法“上新” “暑期档”旅游持续升温_天天微资讯

    六月的夏日充满毕业季独有的青春气息,随着中高考结束,暑期档旅游热潮

  • 当前通讯!2023智能家电行业发展趋势及智能家电行业发展现状分析

    智能家电行业市场到底多大?智能家电就是将微处理器、传感器技术、网络

  • 为公交车“体检”保障市民安全乘车

    6月24日,银川市公交公司维修分公司工人正在进行安全检查。连日来,银

  • 学霸和学渣中间的人叫什么?宝宝出生月份暗示智商?

    学霸和学渣中间的人叫什么?学酥是指外表学霸,内心学渣,但又比学渣

  • 高考志愿填报,必须要知道的15件事! 世界微速讯

    批次分数线、高考分数、全省排位……广大考生翘首以盼的2023年河南普通

  • 环球微速讯:女方重病男方要离婚是否是遗弃?-快看点

    结婚后除了道德上的约束之外,还要承担法律上的责任,夫妻双方的利益是

  • 树德中学文科高分考生裴子蕙:我想去北大中文系|每日聚焦

    您的浏览器不支持此视频格式刘珩川观新闻记者张庭铭钟帆6月23日晚10时1

  • 天天新动态:全球连线|失衡的美国:1%对99%

    统计数据显示,美国45%的新增收入都落入了最富裕的1%人口的腰包。与此

  • 环球热文:最新!厦门端午路况汇总:这些路段车多缓行

    厦门网讯综合“厦门交警”、“厦门高速交警支队”微博,受端午假期出行

  • 消防车属于消防产品吗_消防车属于消防设施还是消防器材 环球热议

    消防车属于消防器材。消防器材指的是用于灭火、防火以及火灾事故的器材

  • 领益智造终止筹划发行全球存托凭证并向不特定对象发行可转债-全球独家

    领益智造公告,结合国内外资本市场变化情况,公司对目前实际经营情况、

  • 全球观点:10时官宣,孙杨退役悬念尘埃落定,去向曝光,他做出最好选择

    21日,知名的体育媒体《体坛周报》发布了2年来孙杨的首个专访,在专访

  • 股价跌停!实控人前妻减持套现,昆仑万维资本市场“泻火”

    华夏时报记者于玉金北京报道  一则实际控制人前妻减持的消息,把风口

  • 1.与“骏网一卡通_数字产品通用充值卡充值网址:WWW.JCARD.CN_怎么充J点是什么

    想必现在有很多小伙伴对于与“骏网一卡通(数字产品通用充值卡)充值网址

  • 旅游
    • 鸡蛋期货交易时间几点到几点?什么是鸡蛋期货?|全球快看点

    • 环球滚动:地铁8号线环线又有新进展!

    • 图片新闻|湖北洪湖:支持起诉助被家暴女性申请人身安全保护令_热文

    • 新一轮地方汽车消费补贴密集出炉 深圳南山最高可领现金补贴3.3万 全球热文