作者| 张帆

编辑|丁卯

封面来源|视觉中国

80后们的童年,充斥着补脑回忆。小聪聪母液、生命壹号等,补脑,一直是个热门话题。而这次,同样是80后的王兴兴选择给自己的核心产品,机器人进行补脑。

2026年3月20日,上交所正式受理宇树科技科创板IPO申请,本次发行后社会公众股占发行后总股本的比例不低于10.00%,预计募集资金超42亿,IPO市值预计达420亿元。


宇树与可比公司市值对比,36氪财经制图

值得关注的是,公司此次42亿募资额中的20.2亿将投入到机器人大模型的研发中,这预示着,在商业化取得初步成效后,宇树正通过加强机器人“大脑”“小脑”方面的综合能力,提升机器人性能,进一步向AGI迈进。


在招股书中,公司把机器人与人的结构进行对比,分成了“大脑”“小脑”与“本体”。

其中:

“大脑”指机器人实现理解交互、自主决策、任务规划等能力的认知智能技术,也就是通常所指的具身大模型。

“小脑”是机器人的本体智能,主要职责是机器人运动控制、全身灵巧运动能力平衡。也就是通常所说的具身本体智能模型。这也是宇树机器人当前的优势所在。公司G1等机器人集成了自研的具身本体智能模型,具备了良好的“舞蹈”等能力。

“本体”指机器人的物理载体和执行终端,包括机械结构、驱动器、传感配置、通讯总线等,是对通用机器人整体物理结构的类比。

从资本市场角度,相比于四足机器人,市场空间更为广阔的人形机器人显然更值得关注。据行业研究机构预测,到2030年全球人形机器人市场规模预计将达到150亿美元,销量规模将增长至60.57万台。

正是基于这样的想象空间,近几年宇树为代表的机器人企业大力发展人形机器人业务。根据招股书数据,2023—2025年,宇树人形机器人销量从5台迅速扩张至5500台,带动人形机器人收入从296.71万扩张至5.95亿元(截至25年9月),累计增速接近200%,同期,收入占比也从1.9%上升至52%,目前人形机器人已经成为公司最主要的收入来源。


人形机器人收入占比快速提升,36氪财经制图

与此同时,业务重心的漂移不只带来了收入规模的扩张,更带来了盈利能力的优化。根据招股书数据,2023-2025年前三季度,随着单位价值量更高的人形机器人业务占比提升,公司综合毛利率从44.18%提升至59.45%。


宇树毛利率变化,36氪财经制图


宇树的跳舞质疑

随着宇树人形机器人的走红,部分网友提出“机器人跳舞、拳击无用论”。台积电CEO也表示国产机器人光会跳没用,能干活才算本事。

不可否认,丝滑的舞步与有力的拳击非常具备视觉冲击力,能在短时间内建立起大众对公司人形机器人“高性能”的认知,也让背后的机器人公司可以迅速出圈。

但从本质上看,跳舞这种所谓的“发达”,是高度预设下的结果,背后依靠的是高频的传感器反馈和复杂的动力学算法支撑下的精确运动控制能力,机器人并不需要理解跳舞这个动作背后的任务指令。

因此,这样的机器人实际上并未解决人形机器人所面临的两个根本性难题:

第一,是人形机器人的自我决策能力。无论是春晚的武术表演《武BOT》,还是各种酷炫Demo,底层逻辑普遍依旧停留在预设规则的阶段。这与人的日常生活逻辑截然相反:人在日常生活中,并不能预测未来会发生什么,而是需要基于外部环境的实时感知,进行行为上的反馈。

因此,人形机器人想要深入到物理世界中,首先需要理解语言、环境和任务目标,从任务预设转向语义、环境理解后执行。但从目前的信息来看,一旦涉及外界的反馈,人形机器人普遍表现不佳。甚至,在实际使用中面临稍微不平的道路,其连直立行走都很难。

其次,是日常应用的普适性。从人类进化的视角,人类之所以称为“人”,有两个重要的条件1)一双能用工具的灵巧双手;2)直立行走释放出双手的能力。

在人跟外界的互动中,几乎大部分的动作都依赖于手部完成。然而,审视现在的Demo,跳舞、拳击等,基本只是停留在躯体的大规模协同上,而关键的手部灵巧度依旧处于初期阶段。

如果双手无法实现毫米级的精准作业与多场景的工具适配,那么,再丝滑的舞步也无法让人形机器人深入物理世界工作。


从身体到大脑

此前几年,市场对人形机器人的关注主要集中在硬件和小脑,这也是顺其自然的逻辑:机器人首先要“能动”才能被投资者所认知。从感知层、决策层、执行层三个模块上,主要围绕人形机器人的硬件展开交易。详见。

而步入到2026年,随着多模态模型的快速迭代叠加硬件领域被市场逐渐定价,人形机器人的竞争重心从“肢体发育”转向“大脑进化”。

机器人的大模型虽然有不同的技术方向,但基本上是按照汽车自动驾驶的思路:包括端到端、VLA与世界模型三大核心路径。

事实上,当前涉及人形机器人的企业主要也分为两类:

一类是车企,凭借业务协同,切入到机器人领域。最典型的就是特斯拉的Optimus,小鹏AI机器人IRON,以及背靠现代汽车的波士顿机器人。

另一类就是宇树等人形机器人独立企业。这类企业也采取了类似车企的模型思路,根据招股说明书,宇树通过真机采集训练数据,提升机器人的语言认知、环境理解等,并生成相应的动作决定。

公司目前在世界模型与VLA模型两大技术路线上均有所布局与投入,并先后于2025年9月、2026年1月开源发布了通用WMA模型“UnifoLM-WMA-0”与通用VLA模型“UnifoLM-VLA-0”。

但是对于大模型而言,一个核心的要素就是大量训练数据的累积。比如车企,依赖于大量在存车辆行驶数据,获得模型训练数据,提升模型能力。

类似的人形机器人,也是延续车企自动驾驶的思路。但当前面临的问题是数据的匮乏。

首先从拟人的角度,人的数据要比自动驾驶复杂得多。好比采用纯视觉方案的特斯拉,自动驾驶训练主要依赖于摄像头。但是驾驶场景只是生活场景很小的一部分,人的数据包括听觉、触觉、视觉等。训练人的数据量远远高于训练自动驾驶的单一场景。

其次,就训练数据累积的厚度,2022年至2025年9月报告期内,宇树人形机器人累计销量近4,000台;2025年度,人形机器人出货量超5,500台(纯人形,不含轮式双臂机器人)。增长很快,但是绝对值看,与动不动一个月卖万台的车企显然不在一个体量。

且按照产品和业务结构划分,当前宇树主要的人形机器人产品是以G1为代表的中型人形机器人,客户群则是面向科研教育和商业消费,绝大多数用于企业导览等轻量场景,在日常生活、工业制造等复杂场景应用并不多,且全尺寸人形机器人占比也不高,这也进一步加剧了数据收集的难度和准确性。


类比汽车的自动驾驶,本身是先有汽车的普及,才为自动驾驶提供了发展基础,通过模型训练量不断增加,进行模型持续迭代。

但当前人形机器人面临的矛盾点在于,人形机器人的商业化普及首先需要其能具备“具身大脑”真正能“听懂人话、能干人事”,但反过来“具身大脑”的完善,又需要机器人在复杂场景下普及后,可以搜集到真实物理世界的数据进行训练。于是这就变成了先有鸡还是先有蛋的问题。

事实上,当前人形机器人大部分应用在特定垂类领域,比如教育、医疗等特点单一场景,并不具备泛化的能力。

猎豹CEO傅盛就说过:花200万就能造个机器人,大模型打不了榜,一分钱也融不到。

这也反映了当前人形机器人的普遍问题,在硬件层面,中国产业链具有先天优势,制造门槛的降低为很多企业进军机器人提供了基础。但是相比之下,具身大模型的门槛显然高出不少。在宇树的招股书中,其IPO融资的40亿中,有20亿计划用于具身大模型的研发,或许20亿对于其他行业不是一笔小钱,但对于大模型而言,却可能只是杯水车薪。

值得关注的是,宇树与优必选同在500亿市值的量级,但是从过往研发开支上看,宇树的研发投入却异常低迷。2022—2025年9月,公司研发投入分别为0.3亿、0.5亿、0.7亿和0.9亿,累计投入2.4亿元,作为对比,2025单年优必选的研发投入就高达5.1亿元,其中超2.7亿元都用于具身大模型的研发。

这也预示着,过往宇树的产品研发主要集中在硬件和运动控制的“小脑”投入上,随着具身智能竞争的加剧,公司正试图利用募集资金,通过大规模的饱和式研发来补齐“具身大脑”的短板,以期实现具身智能爆发后,在核心技术上的后发制人。


宇树与优必选研发开支(宇树2025年为1—9月数据),36氪财经制图

*免责声明:

本文内容仅代表作者看法。

市场有风险,投资需谨慎。在任何情况下,本文中的信息或所表述的意见均不构成对任何人的投资建议。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。我们无意为交易各方提供承销服务或任何需持有特定资质或牌照方可从事的服务。

点击图片即可阅读