中信证券边缘算力有望受益机器人发展 我们看好特斯拉世界模型与机器人的融合及其量产
【keywords start】机器人【keywords end】 本文来自:智通财经网
智通财经APP获悉,中信证券发布研报称,从增量增长来看,传统机器人更多依赖CPU擅长的标量计算,而AI机器人更多依赖AI芯片擅长的向量/矩阵/张量计算。 算力预计将受益于机器人出货量的增长和技术架构的变化,建议重点关注。 参考致远机器人远征A1和FSD计算机的算力配置,以及NVIDIA Jetson系列和高通EB系列的零售价格,该行预测边缘计算模块的价值有望达到6000-12000元。 同时,激光雷达和视觉算法有望受益于机器人行业的发展。 我们也看好特斯拉世界模型与机器人的融合及其量产进展。
中信证券主要观点如下:
算法架构:目前大型机器人模型的能力圈更多在于广义认知。
据珞狮机器人CTO韩凤涛介绍,大模型机器人算法可分为五个层次,分别是任务级、技能级、动作级、原始级、伺服级。 大模型的能力圈更集中在上面两个层次。 ,其底层控制能力仍然依赖于传统的控制算法。 该行认为,当前RT-1、RT-2等机器人模型与传统机器人算法相比,核心优势在于:一是能够接受更长、更复杂的指令; 第二,更加普遍的认知。 正如RT-2论文中介绍的,其控制算法的能力受到训练数据集中技能分布的限制,机器人无法执行完全看不见的动作。 因此,该行认为,大型机器人模型可以在一定程度上分割、安排和组合任务,在认知和任务层面具有与语言大型模型类似的涌现能力,但在动作和任务层面尚不具备。控制水平。 涌现发生,即完成以前从未见过的技能。 大模型对机器人赋能的概括更多的是认知而不是执行。
模型进展:看一下大型机器人模型与RT-1/RT-2的迭代。
谷歌通过两代RT-1/RT-2模型逐步完善了上层认知框架。 RT-1的创新之处在于部署任务的通用性和训练数据的通用性。 有关任务,请参阅 RT-1 论文。 在不存在数据集的任务中准确率达到76%左右; 数据方面,利用不同机器人平台的异构训练数据辅助泛化,实现一半以上的能力提升,这是机器人能力脱离场景限制的方向。 普遍黎明。 RT-2的创新之处在于将原有的认知框架切换到大模型PaLM-E/PaLI-X上,通过改善训练数据和计算能力对模型能力的限制,不断提高泛化能力。 大视频语言模型的加入,赋予机器人类似GPT的认知和推理能力,并表现出更强的涌现能力(55B版本约为RT-1的3倍)和泛化能力(两个版本约为RT的2倍) -1)。 展望未来,目前机器人的上层认知框架已经比较完善。 下一步是教机器人如何通过大量模仿学习、动作捕捉和模拟,或者端到端学习,完成从语言到任务到动作的规划。 该行认为,从指令到控制信号的映射这一步可以通过场景逐步完成,就像自动驾驶从高速NOA到城市NOA一样。 该银行正站在通用机器人算法的技术转型点上。
行业机遇:边缘算力有望升级,激光雷达中期看好。
在计算能力方面,机器人模型能力的增强伴随着推理成本的增加。 参考人类平均反应时间(0.2-0.3s),该行认为3-5HZ的端到端推理频率是机器人达到实用标准的理想范围。 考虑到通信延迟(0.1-0.15s)等因素,该行预计机器人的AI处理器仍将安装在边缘,带动边缘端算力的升级。 考虑到模型参数、架构及其推理时间比自动驾驶更具包容性,该行认为主要应用于专用场景的单臂机器人(工业)将采用15-30TOPS芯片,而那些结合大模型能力的芯片计算人工智能机器人的功率必须达到200-400TOPS。
在感知方面,特斯拉在AI Day上表示,其机器人预计将使用与FSD相同的占用网络,并且机器人目前的计算能力进一步支持高清摄像头和高精度体素,同时支持大模型算法。 困难。 同时,占用网络所需的数据量很大,但机器人的数据量远低于汽车。 因此,该行认为,通过激光雷达、深度相机等传感直接获取深度信息是中期更好的解决方案。
从催化的角度来看,特斯拉有望通过构建自监督学习的世界模型来实现通用的自动驾驶基础模型。 世界模型通过生成未来的视频剪辑并将其与实际视频剪辑进行比较来学习驾驶剪辑中隐含的世界运行规则。 在学术界和工业界的探索中,世行看到了世界模型在机器人领域的优异表现。 该行认为,特斯拉的自动驾驶世界模型技术有望最终与其机器人技术相结合,成为机器人了解世界并与世界互动的有效方式,期待今年特斯拉AI Day公布的最新进展年及其带来的行业机遇。
风险因素:机器人算法实施进度不及预期的风险; 通用大型模型技术发展不及预期的风险; 行业竞争加剧的风险; 颠覆性技术创新导致硬件需求变化的风险; 机器人量产进度不及预期的风险。