9月10日凌晨1点,苹果新品发布会如期举行,全新iPhone16系列成为苹果生态中真正意义上的第一款原生AI手机,在第二代3nm工艺A18和A18 Pro芯片的加持下,iPhone16系列能够容纳并快速运行以Apple Intelligence为中心的生成式AI功能在手机端侧运行。用库克的话说:“新一代iPhone彻彻底底为Apple Intelligence打造”。
本次发布会的主要亮点除苹果新增的相机控制按钮外,主要集中在苹果对AI生态的全面构建方面。在理解苹果发布会的新功能之前,先带大家回顾一下苹果在生成式AI方面的主要成果。具体来说,苹果开发了两种全新基础语言模型,构成了苹果Apple Intelligence的核心:一个是可以在苹果云服务器中运行的较大参数的大语言模型(LLM),称为AFM-server,专为密集型任务设计,并使用私人云计算(Private Cloud Compute)的系统来保护用户数据;另一个是端侧小语言模型(SLM)AFM-on-device,大约有30亿参数,通过对大语言模型进行剪枝、蒸馏,并通过精选的高质量数据训练和架构调整而来,优化后可以在iPhone和其他终端设备上运行,具备更高效率和响应能力。
▌苹果为何可以称为重新定义了AI手机?
苹果的AI战略通过整合操作系统、软件、模型和数据,强化了对应用场景的理解,训练出了能够深刻洞察用户需求并帮助用户决策的AI Agent。
简单来讲,相较于各类传统的生成式AI应用工具,苹果将AI功能融合到用户使用手机的每一个环节,通过手机端侧运行的小语言模型能力让智能手机真正成为日常生活、办公、娱乐的私人管家,它会收集整理手机端本地的各类信息,在用户使用或有需要时主动提供建议或直接帮助实现。并且因为其端侧模型在本地运行的特性,可以充分保护用户的隐私信息安全、提升信息反馈效率。可以说每一个搭载了AI功能的苹果手机都是一个独立的个体。
▌为何大厂们最终选择了端侧AI赛道?
在大语言模型产品的实际应用中,从业者们逐渐意识到大模型存在产品训练成本高、算力需求高、资源消耗大等难点,以及应用适配性差、网络传输不稳定等缺点。在此背景下,AI模型的发展正在着力摆脱网络、参数的多方限制,努力向更简单、更小体量,为应用场景量身定制和跨应用生态的智能化转变。在端侧AI的实际应用方面,2023年3月谷歌推出参数规模达5620亿的PaLM-E的大模型,并在同年10月发布搭载Google AI基础功能的Pixel 8系列手机。2023年11月,vivo发布1750亿规模的自研蓝心大模型,落地终端侧70亿参数大语言模型;2024年9月6日,荣耀CEO赵明在2024德国柏林消费电子展IFA上面向全球推出行业首个跨应用开放生态AI Agent。
不难看出,端侧小模型将成为未来智能手机乃至各类智能终端的语言模型应用样本。IDC(国际数据公司)预计2024年全球新一代 AI 手机的出货量将超过1.7亿部,约占智能手机整体出货量的15%,Counterpoint预计2027年出货量达到5.22亿部,渗透率达到40%。
从大厂们的选择不难看出,随着端侧算力的提升,端侧AI成为大模型终端落地的最优解,模型语言与应用生态融合发展的AI Agent成为未来的趋势。随着软硬件技术的高速发展,相信除智能手机外,各类IoT终端产品也将逐步落地端侧AI,相关硬件算力和通信交互需求也将持续增长。
▌kaiyun欧洲杯持续加码高算力AI模组研发,与行业伙伴共建端侧AI新生态
洞察到端侧AI的优势和广阔前景,kaiyun欧洲杯围绕高算力、大带宽、低功耗、广链接,打造多款高算力AI模组产品,为端侧小语言模型落地提供12Tops~48Tops算力支持。
在模组强大算力的支持下,不仅能够在模组上成功运行Stable Diffusion、LLaMA-2、通义千问Qwen、百川大模型、RedPajama、ChatGLM2、Vicuna等大模型产品,展现出卓越的边缘端大模型部署能力,同时模组产品丰富的外围接口,能够以AI模组的形式将语音识别、机器视觉、导航、定位、避障和多模态技术通过各种传感器植入到终端侧,帮助终端产品快速收集和整合信息,打造不断学习进步的智能“大脑”,助力客户快速实现端侧AI落地应用,节约开发成本。
同时,面对端侧AI与物联网生态融合发展的新趋势,kaiyun欧洲杯以智能车载为切入打造端云协作的智能物联网解决方案。以kaiyun欧洲杯在2023年即已发布的车规级5G R16/R17 + C-V2X系列模组为例,该模组具备的5G通信能力和高算力成为端侧+云端结合的混合式AI的落地形式之一,可广泛应用于AI Agent智能座舱、高阶辅助驾驶、无人驾驶、车路云一体化相关领域。
在通信方面,相关模组产品符合3GPP Release 16/17标准,支持5G NR 独立组网(SA)和非独立组网(NSA),兼容全球主流国家和地区的频段,支持选配C-V2X功能,使用全球统一的ITS 5.9GHz频段部署V2X应用,可采用PC5 Mode4模式直连通信,内置ECDSA硬件引擎,可实现高达6000次/秒的C-V2X验签性能,具备在高速移动环境中提供远距离传输、大带宽、低延时连接的优越性能;在算力方面,模组内置多核心CPU处理器,最大支持22K的算力,在充足算力的支持下,车辆可基于C-V2X构建网联智能,实现由端侧车载计算、路侧边缘计算和中心云计算构成的分级、网络化智能决策与控制,快速进行如车辆碰撞预警、车速引导、红绿灯信息获取等应用。
端侧AI是大模型技术落地的最优解,而端侧AI与云侧大模型协同的混合式AI被行业从业者称为“大模型时代的终极范式”,充分适配智能座舱、智能机器人、手持终端、AR/VR眼镜等产品,成为人工智能落地应用的新方向。同时混合式AI生态的发展又对终端的无线通信能力和算力提出了新的要求,集成了4G/5G 通信能力和高算力芯片以及众多功能接口的智能模组和高算力AI模组,或将成为智能终端厂商们的首选。
从苹果的选择来看,随着端侧算力的不断增长和大模型技术的持续演进,终端侧AI与混合式AI或许将成为大模型时代的最终选择。kaiyun欧洲杯也将持续不断推出高算力模组和智能模组解决方案,以模组+解决方案双轮驱动,支持更广泛的垂直领域和合作伙伴共同引领生态发展,以先进的无线通信和AI技术加快实现万物智联的美好愿景。