当前位置: 首页 > 全球

中信证券:具身模型是本轮机器人浪潮的真正驱动力

  中信证券研报认为,机器人指数表现显著超越市场宽基指数,然而具身模型是本轮机器人浪潮的真正驱动力,其市场影响力仍然未得到充分反映。机器人使用的具身模型正经历分层架构到端到端的演化,最近几年内模型的感知、规划控制能力以及任务成功率大幅提升,但距离实际工业化和家居应用仍有提升空间。研报认为,模型能力仍然是第一要素,在后续竞争中,研发能力强、占据关键场景、优质数据资源的厂商有望获得竞争优势。具身模型的竞争与此前大模型的竞争会有类似之处,建议关注三类公司:1)软硬件基础设施公司;2)数据供应商与物理AI公司;3)垂直场景机器人应用公司。

  全文如下

  计算机|具身模型:具身智能下半场竞争焦点

  机器人指数表现显著超越市场宽基指数,然而我们认为具身模型是本轮机器人浪潮的真正驱动力,其市场影响力仍然未得到充分反映。机器人使用的具身模型正经历分层架构到端到端的演化,最近几年内模型的感知、规划控制能力以及任务成功率大幅提升,但距离实际工业化和家居应用仍有提升空间。我们认为,模型能力仍然是第一要素,在后续竞争中,研发能力强、占据关键场景、优质数据资源的厂商有望获得竞争优势。我们认为,具身模型的竞争与此前大模型的竞争会有类似之处,建议关注三类公司:1)软硬件基础设施公司;2)数据供应商与物理AI公司;3)垂直场景机器人应用公司。

  具身模型:具身智能的下半场。

  基日(2024年9月23日)以来,Wind人形机器人指数和CIS机器人指数累计收益率大幅领先沪深300,也明显优于中信制造产业指数。但从行业分布上来说,上述市场表现主要由硬件性质的公司贡献,软件算法与模型的影响并未体现。实际上,智能水平是本轮机器人浪潮背后的主要驱动力,AI为机器人提供了最关键的部分——大脑。大脑包含软硬件两方面,其中硬件方面,高算力芯片让大模型的运行成为可能;软件方面,大模型的进步让机器人真正能够完成复杂多样的任务。传统工业机器人与当前新一代机器人的区别主要就在于通用性,或者说泛化能力。

  具身模型关键要素:数据+算法。

  数据方面,当前具身模型使用的数据仍然面临格式标准化、分布多样性及量等问题。具身智能数据集蓬勃发展,呈现出场景数、任务数、技能数、轨迹数增加的态势,带动机器人性能全面提升,例如在算法保持不变的情况下,更丰富的数据让机器人线缆布线任务成功率大幅提升,从RT-1的18%提升到RT-1-X的56%。在采集数据高成本限制下,也可以采用合成数据,大模型在合成数据中作用显著。从GenSim论文中可见,同样是使用合成数据训练机器人,任务成功率从GPT3的10%提升到GPT4的43%。

  算法方面,我们认为,端到端大模型是长期发展趋势,能够更好地整合各方面能力,避免模型信息损失,上限较高。例如VLM模型Flamingo、VLA模型RT-2、GO-1等都显著增强了泛化能力,任务成功率不断刷新业界最佳。但端到端模型需要大规模高质量数据,在目前数据尚未充分供应的情况下,端到端往往也只能在部分困难任务(如柔性物体操作)中保持成功率不降低到60%以下的业界最佳水平,仍需要成熟的分层模型架构甚至人工编写规则代码辅助模型完成任务。

  产业格局:下半场开启,产学研密切联动。

  从研究影响力方面来看,研发核心从早期的学术界过渡到近年的大型科技公司主导,再到最近两年创业公司不断涌现,呈现出了一条学术到产业的路径。我们认为未来几年是具身模型产业化发展的关键期,具身模型的竞争,与此前大模型的竞争会有类似之处。当前阶段模型的智能水平仍然是第一要素,占据场景与优质数据的厂商也有望强化市场地位。

  风险因素:

  机器人技术进步速度低于预期,机器人应用场景的发展潜力低于预期,技术路线变动风险,政策实施力度不及预期,行业竞争加剧风险,法律法规风险。

  投资策略。我们认为,具身模型的竞争,与此前大模型的竞争会有类似之处。

  模型发展依赖软硬件基础设施,包括算力芯片、域控制器、操作系统、音视频基础算法等。

  数据是当前核心竞争要素之一,仍然面临采集成本、数据量、多样性、sim-to-real gap等问题,而物理AI能够通过虚拟环境、合成数据等手段获得高可靠性生成数据,有望在智能驾驶、机器人等领域落地。能够在数据领域发挥作用的厂商,以及物理AI领域核心厂商有望在具身智能领域占据一席之地,建议关注数据供应商或物理AI供应商。

  具备场景的公司也有望获得发展,这类公司能够获取特定场景的高质量数据,从而带动模型性能提升,正如特斯拉辅助驾驶功能依靠大量的用户持续迭代,并场景与模型相结合,有望形成腾讯元宝+DeepSeek一样的竞争优势。建议关注与应用层密切联动的厂商。

相关推荐