2023年特斯拉机器人专题报告 特斯拉机器人降本核心途径分析
1、人形机器人远期空间大于汽车,特斯拉强势入局抢占先机
特斯拉于北美时间 2022 年 9 月 30 日推出 Optimus(擎天柱)原型机,目标价 低于 2 万美元。大脑使用全球最强大的超算集群 Dojo 和特斯拉汽车同款的 FSD (完全自主驾驶能力)芯片和算法网络。眼睛基于特斯拉 FSD 的计算机模组和方案, 配备 8 个汽车同款 Autopilot 摄像头,最远监测距离可达 250 米。身体+灵巧手共 40 个自由度,2 大类 6 种类型的执行器,负载设计更灵活;脚掌可以上下翻和调整掌 面。动力系统中 2.3 kWh、52V 电池包,充电管理、传感器和冷却系统都借鉴于特 斯拉汽车。
特斯拉进军人形机器人原因之一是实现人车协同,以更低的生产成本制造出几 乎完全实现自动驾驶的电车。第一,Optimus 人形机器人量产后将发挥使用场景和 视野高度等优势,为特斯拉神经网络算法提供海量长尾场景数据支持,帮助特斯拉 实现 L5 级别的 FSD 算法迭代。第二,由于 Optimus 的部分传动部件以及电池热管 理系统等复用特斯拉汽车,人形机器人量产后将进一步扩大硬件需求规模,从而进 一步降低生产成本。
进军人形机器人更重要的原因是在广阔蓝海市场抢占先机。相比工业机器人, 人形机器人有以下四点优势:(1)仿生步态下运动能力较传统履带/四轮/双轮机器 人大幅提升;(2)灵巧手可实现双手配合和工具替换,较工业机器人技能更广;(3) 依靠算法能力实现复杂环境识别并实施决策。(4)不再有传统“工业机器人”、“服 务机器人”这样明确的功能属性,人形机器人具备通用性,一款成熟的产品即可适 用于广泛的需求场景。 从人形机器人相比传统工业机器人的优势来看,未来人形机器人将拥有比汽车 更大的市场空间,因为人形机器人理论上几乎能完成所有人类进行的非标任务。马 斯克曾称特斯拉汽车是放在轮子上的机器人,那么特斯拉将利用这个天然优势抢占 人形机器人广阔市场的先机。
【资料图】
2、手握FSD系统,AI是Tesla投入人形机器人的最强竞争力
2.1、Optimus问世前:成本高、不智能是人形机器人无法量产的原因
在特斯拉机器人问世以前,以波士顿动力 Atlas 为代表的液压驱动人形机器人 和以日本本田 ASIMO 为代表的的电驱动人形机器人均存在成本高、不智能、控制 能力差的缺陷,没有合适的应用场景,更无法实现量产。 成本高,一是由于使用了很多特殊和高成本零部件,液压驱动的机器人还需要 考虑高昂的维护成本和耗电成本。二是软件端数据采集/数据购买、数据标注和模型 训练带来的高成本。“不智能”指的是人形机器人的核心算法尚未突破,包括“感 知-认知-决策-执行”的算法以及如何让机器人具备人类的逻辑思维能力,同时可以 模拟出人类的情感和情绪,达到与人类共情。
2.2、最强大脑:Optimus复用完全自动驾驶解决方案FSD
马斯克认为,想要解决自动驾驶,就必须解决现实世界中的人工智能,因此特 斯拉一直在向人工智能技术公司转型。特斯拉研发人形机器人的初衷便是最大程度 上利用特斯拉在造车和自动驾驶方面的优势,特别是自动驾驶研发过程中积累的算 法经验、数据驱动能力、AI 芯片能力、模型训练能力等,智能是特斯拉投入机器 人领域最核心的竞争力。
FSD 是特斯拉的自动驾驶解决方案,也是特斯拉机器人的“大脑”。FSD 系统 由数据、算法、硬件构成整体架构,其迭代路径则是通过不断升级算力的硬件来支 撑不断升级的算法从而处理不断增加的海量数据。由图 2 所示,左边的训练基础设 施(Training Infra)和右边的 AI 编译器&推理引擎(AI Compiler& Inference),以及 下方的训练数据(Training Data),共同输入信息进入神经网络(Neutral Networks)中,对占用网络(Occupancy)和一些几何形状(Lanes and Objects)进行分析,最 后整体输出结果,生成自动驾驶车辆/人形机器人的路径规划。
2.2.1、海量数据储备节省开发人形机器人的前期费用
特斯拉 FSD 系统已有海量数据储备,开发人形机器人可节省大量前期费用。 车队传回的数据与场景仿真生成的数据共同构成特斯拉 FSD 系统的数据收集。 2022 年 FSD beta 软件(完全自动驾驶测试版)使用量由 2000 辆车提升到 16 万辆车, 累计拥有 30PB 容量的视频数据。特斯拉计划于 2022 年年底向全部地区推出 FSD beta,收集的数据量进一步提升。 现实世界收集到的数据不足以覆盖所有场景,要完善 FSD 的功能,还需要做 仿真模拟。根据 2022 年特斯拉 AI Day 上 Autopilot 团队成员介绍,目前特斯拉仅用 5 分钟时间,就可以生成与现实世界非常接近的虚拟场景,帮助特斯拉快速覆盖长 尾场景。
Tesla 数据引擎自成闭环,驱动迭代开发。corner case(极端情况)可以帮助由 数据驱动的算法模型进行升级。影子模式是指,人在进行驾驶的同时特斯拉自动驾 驶系统同样也在计算自己会怎么做,然后和人的选择进行对比。在特斯拉的数据引 擎中,车队传回的数据从影子模式中挖掘模型误判(即,自动驾驶选择的操作方式 是错误的)的数据,将之召回并采用自动标注工具进行标签修正,然后加入到训练 和测试集中,可以不断优化云端和车端的网络。这个过程是数据闭环的关键节点,会持续生成 corner case 样本数据。
2.2.2、不断升级的感知、规控算法
由于人形机器人和特斯拉自动驾驶汽车都遵循 “感知-认知-决策-执行”的运行 逻辑,下文将重点分析 FSD 的感知、规划决策算法的迭代是如何让特斯拉机器人更 智能的。 感知:特斯拉 FSD 系统拥有非常强大的纯视觉感知方案。 特斯拉纯视觉感知的重要工作是目标检测,包括对周围车辆、交通灯、限速标 志的识别与检测,车道线预测,判断物体是否移动等各种任务。 在 Tesla FSD 视 觉 感 知 神 经 网 络 架 构 中 , 有 一 个 共 享 的 Backbone (RegNet+ResNe),Neck:是 BiFPN,这三种网络都是目前 SOTA(行业当前最佳) 的网络,以后有更好的网络可以直接更换。Head 是若干个头部,即 Tesla 的软件架 构 Hydar Net。这样的架构符合人类视觉的流程。
视觉感知的整体软件流程是:首先 8 个摄像头的单帧数据经过 image extractors 进行特征提取,这里采用类似 ResNets 的网络。然后将 8 个摄像头获得的不同视频 数据直接进行融合,利用 Transformer 神经网络(一种基于注意力机制的深度学习 模型)进行训练,实现特征从二维图像空间到三维向量空间的变换。由于速度、目 标的遮挡与重现等状态无法在单帧下识别,因此第三步是时间融合,给上一步的每 个图赋予时间信息。最后,将上一步的结果分发到不同的 Heads 中,每个 Heads 负 责特定的功能,后面接着自己的单独网络。
Occupancy Network 是 2022 年特斯拉对 Hydra Nets 的重要改进,也是纯视觉 自动驾驶领域的重要里程碑。此前,纯视觉一直被人诟病的对于未知障碍物的识别 能力。引入 Occupancy Network 后,不再进行目标识别,而是通过得到空间是否被 占用的信息判断是否存在障碍物,解决了目标检测系统失效的问题。 Occupancy Network 在一般障碍物几何感知的基础上还附加了语义和速度、加 速度输出,因此和激光雷达相比,其视觉的语义感知的能力更强,可以更好地将感 知到的 3D 几何信息与语义信息融合。Occupancy Network 的运算效率很高,可以在 10 毫秒中计算完毕,输出可以达到跟相机同样的 36Hz,超过目前绝大多数雷达仅10Hz 的采集频率。因此在高速环境或者对快速移动的物体感知方面,纯视觉的 Occupancy Network 甚至可能做到比雷达更强。
对于成本控制更加严格的人形机器人来讲,类似 Occupancy Network 的方式优 于激光雷达解决方案。在机器人上视觉传感器的成本很低,相对于单线激光雷达来 讲,所包含的信息则极大丰富,单目视觉可以使用很低的成本覆盖机器人周身,获 取机身周围的 Occupancy Network,作为避障与路径规划的依据。而且 Occupancy Network 是个软件方案,后期可以使用订阅软件的方式收费,升级非常的便捷,相 对于硬件的替换优势更大。
规划和控制:Tesla 拥有极强的决策规划控制算法。人体在感知到周围世界的信息后,会基于对这些信息的认知做出相应的判断, 来规划自己的躯体应该作何反应并下发控制指令,人形机器人和自动驾驶汽车也是 一样。 特斯拉的“交互搜索”规划模型进一步增强了 FSD 系统的规控能力。由于车 辆、行人的未来行为都有一定的不确定性,特斯拉采用“交互搜索”(Interaction Search)的规划模型,在线预测自己和其他车辆,行人等的交互,并对每一种交互 带来的风险进行评估,最终决定采取何种策略。FSD 系统还能够通过 Occupancy Network 对可视区域进行建模来处理未知不可见场景。
在 2022AI DAY 上,可以看到 Optimus 已经可以较好地利用起 FSD 中的 Occupancy Network 的语义感知能力,从而与周围环境互动。另外机器人技术设计 中运用了很多强化学习方面的算法,比如让机器人通过人类示教就能学会一类通用 工作的执行方法,需要强大的模仿学习能力。
2.2.3、模型训练的最强算力基础设施:DOJO超级计算机
算力是支撑算法的基础。以 Occupancy Network 为例,这种监督网络需要大量 标注好的数据进行训练。Tesla 使用了 14 亿帧图像对其进行训练,用了 10 万 GPU 时(等效于 10 万个 GPU 运行 1 小时),温度达到 90 度。 Dojo 的研发定位是 AI 训练方面最强的超算系统,目标是提高 Tesla 模型训练 的效率。Dojo 能够处理海量的数据,用于无人监管式的标注和训练,相当于无需人 工对训练数据集进行标注,系统能够自行通过样本间的统计规模对样本集进行分析,进而提高效率。实际上,通过人机合作标注,Dojo 已经在 2022 年一年内持续以每 7 天训练 75000 个神经网络模型的节奏推进研发,相当于每 8 分钟就训练了一个模 型。如果采用人工标注,训练一个神经网络模型需要一两周甚至几个月。
2022 年 AI DAY 上,马斯克宣布将于 2023 年第一季度正式量产 DOJO EXA POD。EXA POD 具有超高算力并且降低 GPU 集群服务成本。EXA POD 可视为 DOJO 超算集群中的一组成员。 一个 EXA POD 将由两层计算托盘和存储系统组成, 每一层托盘包括 6 颗 D1 芯片,提供 1.1 EFLOP 的算力。72 个 GPU 机架(4000 个 GPU)才能运行完的自动标注算法,现在只要 4 台 Dojo Cabinet 机柜就能做到,大 大降低 GPU 集群服务成本。运行神经网络模型 Occupancy Networks 时,相比英伟 达 A100,Dojo 能实现性能的倍增。
2.3、大模型发展超预期,加速提升人形机器人交互、决策、感知能力
Open AI 团队领投人形机器人公司 1X 2350 万美金进军机器人行业,代表着人 工智能的发展在人形机器人领域大有可为。我们认为,大模型的发展将大大提升人 形机器人的交互、决策、感知能力。
第一,机器人和人类的自然语言交互迎来里程碑式进展。 尽管在机器人技术中使用 LLM 具有潜在的优势,但现有的大多数方法都受限 于僵硬的范围和有限的功能集,不允许进行流畅的互动和用户反馈的行为修正。相 比之下, Chat GPT 作为是一个基于上千亿超大语料参数的生成式自然语言大模型,使用人类反馈进行微调,显示出了非常强的交互功能。能够让用户以更自然的方式 与机器人模型互动,并能灵活地进行行为纠正。将 chat gpt 应用于机器人,将有效 提升机器人与人类的交互能力。
意识到 Chat GPT 将为机器人与人类交互带来颠覆性的突破,微软团队专门开 发的一系列机器人 API 和高级函数库,通过 chat gpt 实现用人类语言控制机器人。 其实现路径是:首先,由于机器人是个多元化领域,在微软的操作框架下,不同机 器人,都有自己对应的特定函数库。这些函数库,可以理解为中控,能够连接机器 人控制系统进行底层硬件的管理,以及执行基本运动的代码和功能模块。然后,为 了让 Chat GPT 能遵循函数库的规则,需要清晰的预定义函数命名。清晰的函数名, 能让各 API 之间建立良好的功能连接,最终生成高质量的回答。最终,在设计好库 和 API 后,用户给 ChatGPT 编写了一个文本提示(prompt),描述目标任务,并明 确说明函数库中哪些函数可用,就可以控制机器人去执行任务。
开源的 prompt 平台以及不断迭代的 GPT 模型,均将进一步提升人形机器人的 交互能力,加速人形机器人的落地。由于 AI 生成内容效果和人为提示的质量呈正 相关,微软开发了一个协作开源平台 Prompt Craft,任何人都能在此分享不同类机 器人的 Prompt 策略。2022 年 3 月问世的 GPT-4 模型相比 chat GPT 更是支持图像、 文本输入以及文本输出,同时还最多能够实现 2.5 万字理解,表现出了在多模态、 通用性、理解能力、角色认知、长文本支持等方面的明显进展。
从决策层分析:Chat GPT 使用了人类反馈强化学习(RLHF)这种训练方法, 在训练中可以根据人类反馈,保证对无益、失真或偏见信息的最小化输出。这和特 斯拉 FSD 系统中使用的将同一情境下自动驾驶系统的决策与人的选择进行对比,并 对自动驾驶模型误判的数据进行标注、修正,再加入到训练和测试集中,进行云端 和车端网络优化的模式有相近的逻辑。将 Chat GPT 引入特斯拉 FSD 自动驾驶系统 的训练中,有可能可以加速 FSD 系统的迭代。
感知层分析:Meta 的开源分割万物大模型“segment-anything”问世有望进一 步提升人形机器人的感知能力。图像分割是机器视觉算法领域的核心问题,此前解 决图像分割有交互式分割和自动分割两种方式,但这两种方法都没有提供通用的、 全自动的分割方法。而 SAM 开源大模型已经学会了关于物体的一般概念,并且它 可以为任何图像或视频中的任何物体生成 mask,甚至包括在训练过程中没有遇到 过的物体和图像类型。SAM 足够通用,可以涵盖广泛的用例,并且可以在新的图 像『领域』上即开即用,无需额外的训练。英伟达人工智能科学家 Jim Fan 表示, Meta 的这项研究可以视为计算机视觉领域的 GPT-3 时刻之一。
3、特斯拉机器人降本核心途径:中国企业供应关节模组
特斯拉机器人全身共使用 40 个关节执行器(又称为关节模组)。关节执行器是 模仿人体的关节而诞生,最早由美国科尔摩根公司发明,供应给协作机器人厂商。 特斯拉机器人关节模组使用的数量和目前全球领先的人形机器人基本一致,可以在 机器人运动过程中实现稳态控制。随着特斯拉机器人在形态越来越接近人类,使用 的关节模组数量或将进一步增长,带动核心部件的市场空间持续增长。
特斯拉机器人在设计上也选择了硬成本最低、软成本最大的方式后发制人。特 斯拉机器人硬件成本包括 40 个关节执行器以及其他结构件,目前硬件成本占 BOM 表比例超过 50%,要达到 2 万美金售价还有 84%的降价空间。 特斯拉机器人关节执行器采用的零部件种类和现有的工业机器人基本一致,由 于没有像工业机器人一样对实现高速运动的要求,一定程度上降低了生产难度,因 此只需根据人形机器人的特点对零部件进行调整修改就可以进行标准化的大批量生 产,而且轴承、齿轮箱、滚珠丝杠、电机等部件可复用特斯拉汽车的供应链。国产 硬件供应商具备很强的低成本大规模量产能力,迎来了导入特斯拉机器人硬件供应 链的重要机遇。
3.1、旋转关节
旋转执行器包括无框电机、谐波减速器、双编码器、力矩传感器、角接触轴承 交叉滚子轴承。根据我们测算,无框力矩电机、谐波减速器和力矩传感器是旋转关节中价值量占比最高的零部件。从早期阶段推演到终局状态(特斯拉机器人单机售 价 2 万美金时),降价空间最大的为无框电机(降价 75%)、谐波减速器(降价 75%)、角接触轴承(降价 64%)。
3.1.1、传感器与编码器:全球百亿市场,海外厂商垄断高精度领域
特斯拉机器人的旋转关节采用高低速双编码器和力矩传感器。输出侧和电机侧 各有一个编码器。输出侧编码器用于测量输出位置的变化,电机侧编码器用于计算 得到输出轴的理论位置,与输出侧编码器的数据进行对比,得到外部受力大小,从 而交付驱动器进行后续控制。非接触式力矩传感器是基于编码器或霍尔原理测量材 料形变的力矩传感器。
编码器是提供反馈的传感器,机器人编码器是伺服控制的核心部件,伺服控制 性能提高,必然要求编码器精度的提高。从物理介质的不同来分,分为光编码器和 磁编码器。磁编码器成本相较光编码器可以下降 100 多元,但磁编码器的精度低于 光编码器。整体来看,国产编码器的精度和综合性能和国外差距较大,国内高精度 市场被日本厂商多摩川和尼康垄断。国产厂商汇川技术、埃斯顿、昊志机电、奥普 光电(主要用于军工领域)已经实现编码器的自研,但主要面向中低端市场。
力传感器是感知并度量力的关键部件。根据 global information 测算,全球力传 感器市场预计将从 2021 年的 74.3 亿美元增长到 2027 年的 126.6 亿美元。 按照测量维度,力传感器可以分为一至六维力传感器。六维力传感器是目前维 度最高、力觉信息反馈最为全面、难度最大的力觉传感器,最早应用于航空航天市 场,后逐步应用于打磨、铣削、焊接及装配场景的工业机器人以及对传感性能要求 更高的协作机器人。一台进口的六维传感器价格接近国内一台协作机器人的价格, 考虑成本管控,我们认为特斯拉机器人在量产初期基本不会使用六维传感器,使用 一维传感器可能较大。全球传感器市场的主要厂商有霍尼韦尔、意法半导体、飞思卡尔、博世、飞利 浦等,中国市场上的高端传感器进口占比高达 85%,国产化率低。
3.1.2、谐波减速器:特斯拉机器人带来翻倍空间,70亿供给缺口待国产厂商填补
精密减速器是机器人的核心传动部件,占据工业机器人 30%的零部件成本。其 作用是降低伺服电机的高转速、通过齿轮减速比放大伺服电机的原始扭矩,并提供 高刚性保持、高精度定位。谐波减速器是精密减速器的一种,根据《中国工业机器 人发展白皮书》,2021 年全球工业机器人用谐波减速器市场规模为 108.3 亿元。 需求侧:特斯拉机器人的旋转关节需要更轻量、小型、集成化的传动装置,全 身 16 个旋转关节中各使用 1 个谐波减速器。根据我们测算,当特斯拉机器人实现 100 万产量时,谐波减速器新增市场规模达到 73 亿元。
供给侧:日本哈默纳科是全球谐波减速器龙头,占据 70%的份额。总产能基本 稳定在 200 万台/年,并且几乎全部供应给以四大家族为主的工业机器人厂商。哈默 纳科产线的自动化程度较低,对检测人员需求较大。在美德日三地劳动力成本较高 的情况下,其净利率水平仅保持在 15%左右,远低于国内谐波减速器厂商。为了保 障一定的盈利能力,管理层不会进行激进的扩产政策。 根据我们测算,到 2027 年人形机器人达 100 万台量级时,全球谐波减速器产 能缺口达 1460 万台,其中约 200 万台来自工业机器人,1260 万来自人形机器人。 由于人形机器人的运动速度低于工业机器人,对谐波减速器性能的要求也低于工业 机器人,因此国内谐波减速器厂商可以胜任人形机器人对零部件的要求,在海外龙 头谨慎扩产的背景下,谐波减速器的产能缺口有望由中国厂商填补。
谐波减速器产品的技术迭代基本停滞,当前,我们认为应从扩产能力以及机电 一体化实力两个角度来衡量国内谐波减速器厂商的竞争优势。 第一,国内厂商和海外巨头之间的差异主要在保持产品一致性下的大规模扩产 能力。生产一台谐波减速器,从数理模型设计、材料热处理理解到设备选择、加工 工艺等环环相扣。具体过程是:首先设计柔轮齿型,柔轮的齿形决定加工设备的选 择,而设备的选择又决定钢轮使用哪种制造材料。目前国内外柔轮材料均使用 40CrMoNiA、40CrA 等碳合金钢。国内企业的材料热处理水平相差不大,但总体低 于国外水平。因此,钢轮加工技术路径的差异直接决定国内谐波减速器厂商产能释 放的快慢以及生产成本的高低。
第二,机电一体化能力。“机电一体化”,是指将精密减速器、电机及驱动器、 传感器进行组装形成一个基本传动单元,再通过控制器控制这个高度集成化的传动 关节以实现对本体的运动控制。机电一体化可以进一步缩小零部件体积,实现整体 运动控制,提高工业机器人等自动化设备的灵活性。 机电一体化是未来减速器厂商竞争制高点。全球谐波减速器龙头哈默纳科自 1977 年起生产销售机电一体化产品,陆续研发了伺服电机、驱动、传感器和控制器, 认为提高整体运动控制实力是实现技术进步的核心。哈默纳科作为引领谐波减速器 行业多年的龙头企业,其产业布局方案是判断行业趋势的风向标。同时,人形机器 人对关节小型、轻量的要求也在对机电一体化产品有更高的需求。因此,我们认为 机电一体化实力是谐波减速器厂商未来的竞争焦点。
3.1.3、关节轴承:用量超预期,可复用汽车供应链加速降本
特斯拉机器人关节处使用的轴承是支持旋转轴或其他运动体的机械基础件,可 以复用新能源汽车的轴承供应链,加速降本。 特斯拉机器人旋转关节使用 2 个角接触轴承,用来承受较高的转速的和一定的 轴向力。使用 1 个刚性强的交叉滚子轴承,同时承受较大的径向力和轴向力。线性 关节使用 1 个四点接触轴承,在高转速条件下承受双向较大的轴向力和径向力,以 及 1 个深沟球轴承。根据我们测算,当特斯拉机器人量产达到百万台量级,各类轴 承的单价均可降到百元以内,以 100 万台产量计算,带来的轴承市场空间增量约 37 亿元。 从供应链角度,深沟球轴承国内成熟供货,价格低,附加值低;角接触轴承国 内可供货,价格低,精度低;四点接触轴承国内可供货,价格低,精度低;交叉滚 子轴承国内少数厂家可供货,难度大。
我国轴承产业大而不强,高端轴承市场被以 SKF、NSK 为代表的国际厂商占 据,国内厂商以生产小型、中低端轴承为主。因此,国产轴承厂供应深沟球轴承、 角接触轴承以及四点接触轴承更具备优势。深沟球轴承设计简单,能高速运行并且 工作期间无需保养,价格低,是使用最普遍的轴承,国内已经实现成熟供货。交叉 滚子轴承是和谐波减速器配套使用,制造难度大,全球范围内可大规模量产的企业 少,主要包括日本 THK、日本 IKO、日本 NSK、日企哈默纳科和德国舍弗勒旗下 的 INA。国内谐波减速器龙头绿的谐波自研交叉滚子轴承,截至 2021 年年报已进 入中试阶段。
3.2、线性关节
特斯拉机器人全身使用 12 个线性执行器(亦成为伺服电缸),采用无框电机+ 滚柱丝杠的方案。丝杠的传动精度高,输出力能力强,但反驱透明度差(所以需要 力传感器),响应速度偏慢。这套驱动方案可以实现高刚性,但可能会限制下肢高 动态的运动能力。 线性关节是特斯拉机器人在硬件端优化升级的核心。特斯拉机器人线性关节采 用的通用伺服推重比从 1400N/Kg~4200N/Kg,其中自重较小的一款 0.36 公斤级别 的驱动器可能受限于尺寸及集成化的难度,导致推重比较低为 1400N/Kg,对比国 内先进的自重 0.1Kg 级别的微型伺服电缸推重比已达到 4900N/Kg,仍有较大提升 空间。
根据我们测算,行星滚柱丝杠、倒置滚柱丝杆是线性关节中价值量占比最高的 零部件,行星滚柱丝杠在特斯拉机器人硬件总成本中占比也最高。终局状态下,行 星滚柱丝杠、倒置滚柱丝杠相比早期阶段的降价空间分别达到 93%、95%。
3.2.1、滚柱丝杠:传动新星撬动千亿市场,国内厂商将从0→1打破海外垄断
线性执行器和旋转执行器最大的不同在于使用了滚柱丝杠。 滚柱丝杠是滚珠丝杠的一种细分品类,制造难度比滚珠丝杠难度更大。滚珠丝杆是最常使用的机械传动元件之一。传统滚珠丝杆通过在丝杠和螺母之间引入滚珠, 能耗下降至低于 20%,因而摩擦降低,精度得以保持。而滚柱丝杠滚动体直径和接 触点的数量大大高于滚珠丝杠,因此承载力和寿命大大提升。 行星滚柱丝杠具有高承载、高寿命、高精度、高负载、高稳定性、导程小、响 应速度快、更清洁环保、更容易实现电控化等优势,将成为液压驱动、滚珠丝杠电 动缸的未来技术主力替代方案。在机器人、自动化行业,行星滚柱丝杠替代滚珠丝 杠电动缸和气缸;在机床、医疗器械、光学仪器行业,行星滚柱丝杠替代滚珠丝杠; 在汽车、新能源汽车、智能电车以及工程机械领域替代液压缸。
根据 Value Market Research 数据,2019 年全球滚珠丝杆市场规模为 195.48 亿美 元,预计 2026 年将达到 296.61 亿美元,期间年均复合增长率约为 6.14%。其中, 亚太地区是全球滚珠丝杆的主要市场,2019 年亚太地区市场份额占比为 43.56%,预计 2026 年将增长至 46.64%,亚太地区市场份额的快速增长主要源于中国等发展 中国家在航空、制造和机器人等行业的需求升级。 高精度滚珠丝杠技术壁垒高,海外厂商占据垄断地位。全球主要的滚珠丝杆厂 商有 NSK 日本精工、日本 THK、日本斯凯孚等。CR5 市占率达到约 46%。根据相 关数据,日本和欧洲滚珠丝杆企业占据了全球约 70%的市场份额。国内行星滚柱丝 杠生产商稀缺,仅有少量具备小批量研发制造能力的企业。
3.2.2、机器人关节高功率密度的选择:无框电机
特斯拉机器人线性、旋转关节处使用的无框电机是去掉轴、轴承、外壳、反馈 或端盖的伺服电机,只包含定子和转子。无框力矩电机的核心优势是输出力矩大、 结构紧凑,散热性好。1949 年由美国 Inland 电机公司(1960 年和科尔摩根光学公 司合并为科尔摩根公司)发明,用于早期导弹和空间飞行器的惯性制导系统上的传 动万向节。现在,无框电机的典型应用包括机器人和机器人关节、武器站、传感器 的万向节、瞄准系统、无人机推进与导航、工厂自动化设备等。 海外厂商科尔摩根、Maxon、日本电产、Moog 电机位列全球无框电机市场第 一梯队,国内供应商包括步科股份、昊志机电。
3.3、灵巧手:关注率先实现微型线性执行器量产的企业
特斯拉机器人的灵巧手的技术和现有人形机器人灵巧手一致,单手共 6 个自由 度 11 个关节,可抓起 20 磅重量,既可以完成大口径物体抓取,同时也能满足抓取 精巧物体的需求。从 2022 年特斯拉 AI DAY 上展出的视频可以看到,目前特斯拉机 器人灵巧手的设计优先满足大口径物体的抓取,适用于在总装线上进行物体的搬运。 也验证了特斯拉机器人将率先在汽车总装产线上投入使用。 以因时机器人为代表的厂商在机器人灵巧手方面已拥有全球领先的技术实力。 衡量灵巧手性能强弱的指标是单个手指可施加的力,目前全球领先的水平是单个手 指施加 1kg 左右的力,而因时机器人灵巧手单个手指可以施加的力已经能到达 3kg。
特斯拉机器人灵巧手内部构成是一个微型的线性执行器(伺服电缸)。内部通 过高速运转的空心杯电机(小功率段体积最小、功率密度最高的电机)提供动力, 搭载小模数齿轮的减速箱起到类似于旋转执行器的能力。高性能的螺杆结构使整体 结构更为紧凑。整个微型线性执行器由低压驱动板来控制。国产厂商在除了减速箱以外的其他零部件领域均处于量产的布局期。在特斯拉机器人的拉动下,能够率先 实现微型线性执行器量产的企业将通过规模效应大幅降本。
3.4、国产加工设备取得长足进展,为零部件厂加速扩产保驾护航
磨床和齿轮加工机床属于金属切割机床,是减速器、轴承、滚珠丝杠、电机在 精加工阶段的重要设备。齿轮加工机床主要包括磨齿机和车齿机,磨床包括螺纹磨 床和外圆磨床。磨齿是齿轮精加工的主要工艺,通过可靠有效地加工硬齿面齿轮, 修正热处理产生的变形和粗加工的各项误差,提高加工精度。目前,国产数控磨齿 机已取得了长足发展,各项性能比肩海外品牌,差距在于精度的保持程度,即,设 备是否可以满足每一个生产出的零部件都维持同样的高标准。 国产精加工设备取得长足进展,保障国内机器人核心部件厂商扩产。
国内秦川 机床、宁江机床(未上市)、北平机床(未上市)目前都已具备批量生产高精度齿 轮加工设备的能力。截至 2022 年 H1,秦川机床的磨齿机年产能 300 台,单台磨齿 机每月可加工 1 万件汽车齿轮,可用于其 RV 减速器生产线。中大力德、双环传动 也曾是秦川机床滚磨齿机的客户。宁江机床和华中数控紧密合作,设备已用于航空 航天等高精度领域。
3.5、其他零部件:电池、视觉传感性能优异
特斯拉人形机器人的电池容量 2.3kWh、动力电 52v,金属外壳保护提高安全性。 电池实现小体积大容量,推测复用了汽车动力电池技术。电池与主板、散热风扇置 于胸腔中。 视觉传感器硬件为左右单目相机+鱼眼相机,硬件成本较低,依赖算法。集成 了汽车视觉传感的技术,实现精确的 3D 建模。工厂等部分场景有应用 GPS 传感器。
4、落地场景:先在汽车总装厂落地,后渗透至广阔TO C市场
4.1.1、关键时点:新车型将在墨西哥工厂生产,Optimus或将首次批量应用
人形机器人的最终目标是成为通用型机器人,但在此之前需要先落地在固定场 景进行软硬件的升级迭代。根据特斯拉机器人目前关节模组的特点,我们认为汽车 总装厂有望最先开始使用人形机器人,后续逐步渗透到所有制造业工厂。目前整车 制造分为冲压、焊装、涂装、总装,其中冲压、焊接、涂装自动化率较高,达到80% 以上,以液压机和大功率机械臂为主;总装自动化率较低,因装配部件细、碎、小、 轻,基本全部依赖人工。考虑到人形机器人的小体积、轻负载和视觉传感等特点, 可将其安排在总装线替换人力进行搬运和装配工作。
2023 年 3 月,特斯拉官宣墨西哥超级工厂,下一代入门级车型将在此率先投产。我们认为特斯拉机器人有望在墨西哥工厂有首次投入使用。在算法提升、供应链持 续优化后,应用场景逐渐扩展到社会服务业和家庭服务业,真正发挥出其相对工业 机器人的通用性优势。
4.1.2、按量产规模不同,降本节奏分为3阶段
目前人形机器人成本约为 10-15 万美元左右,未来产量增加及工艺改善将降低 成本。根据优必选预测,根据量产规模不同,人形机器人降本进程大致分为 3 个阶 段:几千台小批量生产,降本 20%-30%至约 10 万美元;1 万-几万台量产,降本 50% 至 5 万美元;几十万至上百万台大规模量产,降本 70%-80%至 2-3 万美元。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
关键词: