在2022年进口芯片金额激增我们是否已经步入了端侧AI新时代安谋科技的周易NPU正开启这一智能无处不
在科技的光芒下,巨大的模型从云端的宫殿飘然而至终端的舞台。这一历史性的跨越,不仅赋予了数据处理以迅捷之翼,更将智能体验推向了前所未有的高度。终端上的大模型以灵动的姿态,即时捕捉并回应着每一个细微的需求,将AI触角延伸至世界的每一个角落。
近日,在EEVIA主办的第12届中国硬科技产业链创新趋势峰会暨百家媒体论坛上,安谋科技产品总监鲍敏祺发表了精彩主题演讲《端侧AI应用芯机遇,NPU加速终端算力升级》。他深入剖析了端侧AI发展广阔前景,并详细介绍了安谋科技自研NPU最新进展。
AIGC大模型带来的算力提升是端侧AI迎来最大机遇。鲍敏祺表示,从近期头部大厂发布中都可以看出,端侧AI应用已经得到了业界的一致认可。
当前国际和国内实际部署主流端侧大模型体量主要集中在100亿参数以下。这一限制主要由于设备内存带宽范围通常在50-100GB/s之间。为了满足用户对应用实时性的需求,10-30亿参数的大模型最适合部署现有带宽条件下。这类模型能够保持高效性能提供快速响应与高质量服务。
头部终端厂商如OPPO、vivo、小米、荣耀及华为等,都积极推动端侧AI发展。不仅自研适合末次部署的大型模块,还将其与具体业务场景紧密结合。芯片厂商达成了共识认为未来消费类电子产品发展重点为神经网络处理单元(NPU)。通过专门优化硬件架构能显著提升设备计算能力同时降低功耗。
尽管开发势头强劲,但鲍敏祺强调这并不意味放弃云顶AI相反,他认为两者应该实现互补才能产生最大收益。此外,他还提到,以多模态场景为趋势,将图像、音频视频等多种输入方式结合,使设备更全面理解用户需求。在观察学习过程中未来的系统将更好预测满足用户期望实现真正智能化。
面对三重挑战:成本、功耗和生态系统,“周易”NPU围绕微架构、能效和并行处理进行三重升级:
· 微架构:针对Transformer进行优化克服实际计算瓶颈。
· 效率:混合精度量化,比如int4和fp16,同时改变稀疏度增加有效带宽。
· 并行处理:采用数据或模式并行减少数据搬运。
最后鲍敏祺强调“周易”NPU支持异构计算,无论从能效还是SoC面积角度看都是最佳选择。他解释道,对不同应用场景异构计算实现灵活裁剪降低不必要功耗。他还指出“周易”已在汽车信息娱乐系统ADAS以及其他关键领域展示性能和灵活性,并且累计40万片成功定点于20余款车型中。