- Published on
具身智能的白银时代:深度解析
具身智能的白银时代:深度解析
本文探讨了具身智能的现状,并将其描述为“白银时代”——一个技术从初始萌芽到完全成熟之间,充满探索的时期。讨论围绕火山引擎FORCE大会的一次圆桌会议展开,来自不同领域的专家们探讨了大型模型在加速机器人发展方面的潜力。
背景
大型人工智能模型的快速发展推动了机器人行业的巨大投资。然而,资金的涌入也带来了市场过热的风险。核心挑战在于识别技术及其应用的真正突破。关键问题包括:
- 应该专注于强化学习还是模拟学习?
- 优先考虑模拟还是真实世界测试更重要?
- 重点应该放在视觉引擎还是物理引擎上?
圆桌会议参与者
圆桌会议汇集了来自不同背景的专家:
- 陈阳:星河通用机器人副总裁
- 石凌翔:火山引擎创新孵化负责人(主持人)
- 吴迪:火山引擎智能算法负责人
- 万浩基:经纬创投合伙人
- 王啸:九章资本创始人
- 颜维新:上海知源机器人联合创始人,上海交通大学博士生导师
主要讨论点
机器人投资热潮
- 为何如此兴奋? 人工智能的应用分为两类:软应用(如聊天机器人和视频生成)和硬应用(如机器人)。机器人被视为人工智能最通用的硬应用。
- 投资重点: 投资者正在寻找能够整合软硬件,并展示超出演示的实际应用的公司。
- 商业化挑战: 机器人的商业化速度低于预期,尤其是在家庭和B2B服务等复杂环境中。
- “大脑”(AI)和“小脑”(控制系统)之间的协调需要改进。
- 降低成本对于广泛采用至关重要。
商业化之路
- 共识: 人们普遍认为机器人技术将会成功,但时间表和领先公司仍不确定。
- 多个赢家: 市场不太可能由一家公司主导,类似于电动汽车行业。
- 初步商业化: 大型模型为机器人提供了改进的交互和思考能力。
- 技术障碍: 虽然没有不可逾越的技术障碍,但这个过程将比预期的更长、更具挑战性。
- 风险投资的作用: 风险投资在通过提供资金加速发展方面发挥着至关重要的作用。
通用智能的重要性
- 重点转移: 重点应该放在机器人适应人类和环境,而不是反过来。
- 模拟数据: 使用大量的模拟数据是使机器人具有通用智能的关键。
- 初创公司面临的挑战: 机器人初创公司在技术、产品开发和商业模式方面面临着重大挑战。
- 行业合作: 行业需要跨供应链的合作和投资者的支持。
具身智能的技术路径
- 模仿学习和强化学习: 使用模仿学习来增强强化学习是步态控制的可行方法。
- 下肢模拟: 模拟数据对于下肢步态控制是有效的,但参数调整和产品一致性仍然是挑战。
- 关注上肢: 需要将重点从下肢运动转移到人形机器人的整体任务操作能力。
- 任务操作: 重点应该放在任务操作能力,而不仅仅是移动。
- 数据挑战: 收集和标准化数据,特别是对于复杂的任务,是一个巨大的挑战。
- 真实世界数据: 真实世界数据至关重要,特别是对于难以模拟的复杂物理交互。
模拟数据 vs. 真实世界数据
- 模拟数据: 模拟数据更具成本效益、可扩展性,并且可用于训练通用具身模型。
- 真实世界数据: 真实世界数据对于捕捉物理交互的细微差别至关重要,例如摩擦和弹性。
- 世界模型: 一旦机器人拥有可靠的世界模型,就可以使用大规模模拟来测试和改进它们在各种场景中的性能。
未来应用
近期应用(2-3年)
- 工业制造: 机器人可以在受控环境中执行需要灵巧性的复杂任务。
- 远程操作: 机器人可用于危险环境,例如处理危险材料。
- 受控环境: 机器人将部署在餐厅、酒店和工厂等受控环境中。
- 特定任务: 机器人将用于送餐、制作咖啡和执行轻型维护等任务。
- 工厂、办公室和安保: 这些是最初部署最可能的领域。
长期应用
- 家庭环境: 最复杂但最受期待的应用是在家庭环境中。
- 家务: 机器人最终将能够执行诸如烹饪、叠衣服和清洁之类的任务。
- 成本降低: 随着技术的进步,机器人的成本将降低,使其更容易被消费者接受。
- 通用机器人: 重点将转向可以满足各种需求的通用机器人。
- 市场考虑: 公司需要考虑不同应用的功能、性能、开放性和风险承受能力。
火山引擎VeOmniverse
- 虚拟仿真平台: veOmniverse是一个用于机器人仿真和训练的云平台。
- 逼真的环境: 它创建高度逼真的数字环境,用于训练和测试机器人。
- 成本效益: 它减少了对物理设备的需求,并降低了开发成本。
- 综合培训: 该平台使用视觉引擎、物理引擎、传感器模拟和3D生成来创建全面的培训系统。
- 人工智能支持: 该平台使用人工智能生成高质量的训练数据并加速训练过程。
- 定制化: 该平台是开放且可定制的,允许公司开发个性化的数字孪生应用。
- 加速开发: 它帮助公司快速构建、验证和优化机器人模型。
- 行业转型: veOmniverse是机器人行业智能化和数字化转型的关键工具。