联系销售:400-665-8553
立即咨询
新闻动态 新闻动态
技术博客

分享开云智言科技技术博客

稚晖君智元机器人发布通用具身基座大模型开启机器人学习新纪元

作者:小编
发布时间:2025-03-13 02:05:01
阅读量: 

  港服游戏比美服贵百元?玩家揭秘点卡价格差异线II:专业摄影新标杆,拍摄体验全面飞跃

  苹果iOS 18.4将推Apple Intelligence中文版,中国用户即将享受智能服务

  智元发布Genie Operator-1大模型,新人形机器人亮相在即,具身智能再升级!

  在科技领域迎来新突破之际,智元机器人公司宣布了一项重大创新成果——智元启元大模型(Genie Operator-1),这一消息由知名科技极客“稚晖君”的创业项目正式揭晓。

  智元启元大模型的核心在于其革命性的Vision-Language-Latent-Action(ViLLA)架构,这一架构巧妙融合了VLM(多模态大模型)与MoE(混合专家)技术,使得机器人能够通过观察人类视频进行学习,并在小样本条件下迅速适应新任务。这一技术的实现,不仅大幅降低了具身智能的应用门槛,还成功应用于智元的多款机器人产品中。

  在五种不同复杂度的任务测试中,GO-1大模型展现了其卓越的性能。与现有最优模型相比,GO-1的平均成功率提高了32%,从46%跃升至78%。特别是在“倒水”、“清理桌面”和“补充饮料”等具体任务中,GO-1的表现尤为抢眼。

  智元团队还针对ViLLA架构中的Latent Planner进行了专项验证。实验结果显示,引入Latent Planner后,任务成功率进一步提升了12%,从66%增长到78%。

  GO-1大模型之所以能够实现如此显著的性能提升,Kaiyun官网登录入口 开云网站得益于其强大的学习能力。该模型结合了互联网视频和真实人类示范数据,使得机器人能够更好地理解人类行为,从而提供更加贴心的服务。同时,GO-1还具备出色的泛化能力,Kaiyun官网登录入口 开云网站能够在极少甚至零样本的情况下适应新场景和新任务,极大地降低了具身模型的使用难度和后训练成本。

稚晖君智元机器人发布通用具身基座大模型开启机器人学习新纪元(图1)

  在实际应用中,GO-1大模型展现出了其持续进化的能力。通过智元提供的数据回流系统,GO-1能够从实际执行任务中遇到的问题数据中不断学习和进化,实现越用越聪明的目标。

  智元机器人的创始人之一彭志辉(稚晖君)曾以“华为天才少年计划”最高档年薪201万元加入华为团队,从事AI芯片和算法研究工作。2022年年底,他从华为离职,并于2023年2月联合创立了智元机器人公司。

稚晖君智元机器人发布通用具身基座大模型开启机器人学习新纪元(图2)

  具体来说,VLM作为通用具身基座大模型的主干网络,继承开源多模态大模型5-2B的权重,利用互联网大规模纯文本和图文数据,让智元机器人的Genie Operator-1(GO-1)具备了通用的场景感知和理解能…

  苹果iOS 18.4将推Apple Intelligence中文版,中国用户即将享受智能服务

  具体来说,VLM作为通用具身基座大模型的主干网络,继承开源多模态大模型5-2B的权重,利用互联网大规模纯文本和图文数据,让智元机器人的Genie Operator-1(GO-1)具备了通用的场景感知和理解能…

  具体来说,VLM作为通用具身基座大模型的主干网络,继承开源多模态大模型5-2B的权重,利用互联网大规模纯文本和图文数据,让智元机器人的Genie Operator-1(GO-1)具备了通用的场景感知和理解能…

  具体来说,VLM作为通用具身基座大模型的主干网络,继承开源多模态大模型5-2B的权重,利用互联网大规模纯文本和图文数据,让智元机器人的Genie Operator-1(GO-1)具备了通用的场景感知和理解能…

  智元发布Genie Operator-1大模型,新人形机器人亮相在即,具身智能再升级!

  具体来说,VLM作为通用具身基座大模型的主干网络,继承开源多模态大模型5-2B的权重,利用互联网大规模纯文本和图文数据,让智元机器人的Genie Operator-1(GO-1)具备了通用的场景感知和理解能…

  具体来说,VLM作为通用具身基座大模型的主干网络,继承开源多模态大模型5-2B的权重,利用互联网大规模纯文本和图文数据,让智元机器人的Genie Operator-1(GO-1)具备了通用的场景感知和理解能…

  BOSS直聘2024财报亮点:营收大涨,AI技术DeepSeek-R1正式接入

  具体来说,VLM作为通用具身基座大模型的主干网络,继承开源多模态大模型5-2B的权重,利用互联网大规模纯文本和图文数据,让智元机器人的Genie Operator-1(GO-1)具备了通用的场景感知和理解能…

  具体来说,VLM作为通用具身基座大模型的主干网络,继承开源多模态大模型5-2B的权重,利用互联网大规模纯文本和图文数据,让智元机器人的Genie Operator-1(GO-1)具备了通用的场景感知和理解能…

  浙大发布“浙大先生”,深度融合智能体DeepSeek V3/R1全国高校共享!

  DeepSeek爆火!创始人梁文峰身家飙升,能否超越黄仁勋成亚洲新首富?

  夸克AI搜索升级“深度思考”,阿里自研模型加持,DeepSeek暂缺席

  华为发布DeepSeek超融合一体机,全面适配V3&R1及蒸馏模型,加速AI应用

  苹果iOS 18.4将推Apple Intelligence中文版,中国用户即将享受智能服务

  智元发布Genie Operator-1大模型,新人形机器人亮相在即,具身智能再升级!

  本网站LOGO小熊标志受版权保护,版权登记号:鲁作登字-2015-F-025467,未经ITBEAR官方许可,严禁使用。

开云科技整合自然语言处理与机器学习技术,打造全方位AI开发服务平台

400-665-8553

联系我们:400-665-8553

销售联络:400-665-8553

媒体合作:666666666

展会合作:888888888

北京 | 北京市海淀区中关村科技园区清华科技园创新大厦B座15层(研发中心)

深圳 | 深圳市南山区科技园南区高新南七道数字技术大厦8层(AI实验室)

上海 | 上海市浦东新区张江人工智能岛智能制造大厦A栋12层

成都 | 四川省成都市高新区天府软件园C区云计算中心6层

武汉 | 湖北省武汉市东湖新技术开发区光谷大道光电子信息港B座9层

杭州 | 浙江省杭州市滨江区网新智慧园区创新大厦C座16层

广州 | 广东省广州市黄埔区科学城科技创新基地达实大厦7层

Copyright © 开云智言科技 版权所有

豫ICP备19046769号
在线咨询
电话咨询
400-665-8553
回到顶部