智能文本分析

对话系统平台

机器学习引擎

智能内容生成

虚拟化技术

云计算引擎

分布式存储

自然语言处理

机器学习平台

智能计算引擎

开发者工具

深度语义理解框架

分布式训练系统

智能对话引擎

知识图谱构建

模型压缩技术

多模态融合框架

自适应学习系统

联系销售：400-665-8553

立即咨询

新闻动态

新闻动态

技术博客

分享开云智言科技技术博客

首页 > 技术动态 > 技术文档

稚晖君智元机器人发布通用具身基座大模型开启机器人学习新纪元

作者：小编

发布时间：2025-03-13 02:05:01

阅读量：　

　　港服游戏比美服贵百元？玩家揭秘点卡价格差异线II：专业摄影新标杆，拍摄体验全面飞跃

　　苹果iOS 18.4将推Apple Intelligence中文版，中国用户即将享受智能服务

　　智元发布Genie Operator-1大模型，新人形机器人亮相在即，具身智能再升级！

　　在科技领域迎来新突破之际，智元机器人公司宣布了一项重大创新成果——智元启元大模型（Genie Operator-1），这一消息由知名科技极客“稚晖君”的创业项目正式揭晓。

　　智元启元大模型的核心在于其革命性的Vision-Language-Latent-Action（ViLLA）架构，这一架构巧妙融合了VLM（多模态大模型）与MoE（混合专家）技术，使得机器人能够通过观察人类视频进行学习，并在小样本条件下迅速适应新任务。这一技术的实现，不仅大幅降低了具身智能的应用门槛，还成功应用于智元的多款机器人产品中。

　　在五种不同复杂度的任务测试中，GO-1大模型展现了其卓越的性能。与现有最优模型相比，GO-1的平均成功率提高了32%，从46%跃升至78%。特别是在“倒水”、“清理桌面”和“补充饮料”等具体任务中，GO-1的表现尤为抢眼。

　　智元团队还针对ViLLA架构中的Latent Planner进行了专项验证。实验结果显示，引入Latent Planner后，任务成功率进一步提升了12%，从66%增长到78%。

　　GO-1大模型之所以能够实现如此显著的性能提升，Kaiyun官网登录入口开云网站得益于其强大的学习能力。该模型结合了互联网视频和真实人类示范数据，使得机器人能够更好地理解人类行为，从而提供更加贴心的服务。同时，GO-1还具备出色的泛化能力，Kaiyun官网登录入口开云网站能够在极少甚至零样本的情况下适应新场景和新任务，极大地降低了具身模型的使用难度和后训练成本。

稚晖君智元机器人发布通用具身基座大模型开启机器人学习新纪元(图1)

　　在实际应用中，GO-1大模型展现出了其持续进化的能力。通过智元提供的数据回流系统，GO-1能够从实际执行任务中遇到的问题数据中不断学习和进化，实现越用越聪明的目标。

　　智元机器人的创始人之一彭志辉（稚晖君）曾以“华为天才少年计划”最高档年薪201万元加入华为团队，从事AI芯片和算法研究工作。2022年年底，他从华为离职，并于2023年2月联合创立了智元机器人公司。

稚晖君智元机器人发布通用具身基座大模型开启机器人学习新纪元(图2)

　　具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

　　苹果iOS 18.4将推Apple Intelligence中文版，中国用户即将享受智能服务

　　具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

　　具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

　　具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

　　智元发布Genie Operator-1大模型，新人形机器人亮相在即，具身智能再升级！

　　具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

　　具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

　　BOSS直聘2024财报亮点：营收大涨，AI技术DeepSeek-R1正式接入

　　具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

　　具体来说，VLM作为通用具身基座大模型的主干网络，继承开源多模态大模型5-2B的权重，利用互联网大规模纯文本和图文数据，让智元机器人的Genie Operator-1（GO-1）具备了通用的场景感知和理解能…

　　浙大发布“浙大先生”，深度融合智能体DeepSeek V3/R1全国高校共享！

　　DeepSeek爆火！创始人梁文峰身家飙升，能否超越黄仁勋成亚洲新首富？

　　夸克AI搜索升级“深度思考”，阿里自研模型加持，DeepSeek暂缺席

　　华为发布DeepSeek超融合一体机，全面适配V3&R1及蒸馏模型，加速AI应用

　　苹果iOS 18.4将推Apple Intelligence中文版，中国用户即将享受智能服务

　　智元发布Genie Operator-1大模型，新人形机器人亮相在即，具身智能再升级！

　　本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。

上一篇：人工智能从深度学习到全面赋能（科技前沿）返回列表下一篇：英伟达新模型赋予宇树机器人超强模仿能力C罗与科比也能重现！

热门标签

机器学习模型

开云科技整合自然语言处理与机器学习技术，打造全方位AI开发服务平台

自然语言处理与机器学习服务平台

智能文本分析对话系统平台机器学习引擎智能内容生成

开云智言科技

发展历程企业文化

虚拟化技术云计算引擎分布式存储

自然语言处理机器学习平台智能计算引擎开发者工具

深度语义理解框架分布式训练系统智能对话引擎知识图谱构建模型压缩技术多模态融合框架自适应学习系统

技术前沿技术文档

400-665-8553

联系我们：400-665-8553

销售联络：400-665-8553

媒体合作：666666666

展会合作：888888888

北京 | 北京市海淀区中关村科技园区清华科技园创新大厦B座15层（研发中心）

深圳 | 深圳市南山区科技园南区高新南七道数字技术大厦8层（AI实验室）

上海 | 上海市浦东新区张江人工智能岛智能制造大厦A栋12层

成都 | 四川省成都市高新区天府软件园C区云计算中心6层

武汉 | 湖北省武汉市东湖新技术开发区光谷大道光电子信息港B座9层

杭州 | 浙江省杭州市滨江区网新智慧园区创新大厦C座16层

广州 | 广东省广州市黄埔区科学城科技创新基地达实大厦7层

Copyright © 开云智言科技版权所有

豫ICP备19046769号

在线咨询

电话咨询

回到顶部