车载全息数字人——AI Agent新场景,全息投影新方向
数字支付安全,保护个人信息隐私 #生活知识# #生活理念# #数字生活智慧#
摘要
栩栩如生的座舱数字人,有望为驾驶者带来“人人交互”的体验。在蔚来汽车上搭载的NOMI机器人一度成为蔚来品牌的当家卖点,NOMI百变的表情和花样繁多的装饰周边让NOMI成功“出圈”。我们认为,具有高度亲和力、智能水平足够高、能帮助驾驶者完成个性化任务,是产品经理定义一个汽车座舱数字人的核心要点,也是AI Agent未来上车的核心能力映射。
当下,座舱数字人因何而被催化?我们认为,生成式AI的爆发给予数字人“灵魂”,全息HUD和高算力智能模组给数字人添加“骨肉”。而座舱智能化时代,用户在驾乘中会有各种个性化需求,数字人被给予更多的施展能力的空间,其终极使命是通过AI Agent实现AGI向汽车座舱渗透,实现三屏互动(手机屏、车载屏和家用屏)。
垂直领域大模型正在向汽车渗透,数字人有了“点睛之笔”。此前OpenAI已经发布ChatGPT API语言模型接口和Whisper API语音识别接口,可以让开发者调用API输出回答并转换为语音,为数字人交互奠定了技术基础。众多车企正在积极布局车载AI:吉利大模型囊括绘画、音乐、语言和自动驾驶,丰富了汽车座舱体验;奇瑞与科大讯飞合作,LION AI大模型专攻语义理解和丰富情感;广汽大模型深度融合云+车两端,剑指AI+V2X。
HUD技术成熟、边缘计算芯片性能充足,数字人获得“骨肉”。HUD抬头显示已被广大用户接受,驾驶者不必低头,从视野前方就可以查看各种车辆和道路信息,成为车载数字人的载体。在生成式AI爆发前,边缘算力已经逐渐渗透进了部分商用场景,如手机云游戏、无人设备驾驶、自动视频识别等。如今随着MLC-LLM,谷歌模型体系等软件基建加速,特斯拉机器人为具身智能完成物理基建,高通10月底发布的异构 AI 引擎性能达75TOPS,支持设备端运行参数量超过130亿的大模型,汽车已逐步具备同物理世界自主交互的硬件条件。
AI Agent面向复杂任务处理,充分适合人车交互场景,是数字人的核心演进方向。LLM在更新信息、多轮对话和复杂任务处理时存在局限,能够独立思考并拥有规划+记忆+工具使用能力的AI Agent充分克服了这些不足,是LLM通向AGI的重要路线。这种“Agent+”能力具体到车载的应用场景中,可以将AI Agent的能力由易至难总结为5个层次:辅助操作——车身数据采集&可视化——汽车服务(导航、保养、保险等)——生活助理——具身智能。
座舱数字人市场潜力已被验证,订阅制打开AI应用盈利新思路。蔚来NOMI机器人人气相当火热,据2022年至简车言统计的蔚来二手车数据,NOMI选装比例达到80%以上,持平增强现实,仅次于NIO Pilot自动驾驶功能包。在汽车这一消费产品中,由于汽车本身价格相对高昂,这类智能助手几千元的选装边际成本较低,因此就可以吸引到更多用户选装。而近年兴起的车辆功能月/季/年度订阅制,也为车载AI应用打开了全新盈利思路。
投资建议:新能源车销量数据亮眼,后续在应用端围绕AI的竞争不可避免,有望推动车载数字人等应用加速渗透,投资侧建议围绕AI应用、边缘算力和光学硬件品种进行布局。
汽车数字人应用:中科金财、百度(BIDU.US)、微美全息(WIMI.US)等AI应用厂商;
边缘算力芯片:瑞芯微、全志科技、晶晨股份、翱捷科技、乐鑫科技等;
边缘算力承载平台与终端:美格智能、中科创达、广和通、移远通信、龙宇股份、网宿科技等;
光学模组:中际旭创、新易盛、天孚通信、腾景科技等。
风险提示:边缘算力发展不及预期,智能座舱渗透率不及预期,市场竞争风险。
AGI的快速进步一直是市场关注的焦点,今年以来维持着较高的市场人气,从算力、游戏、营销到医疗、教育等,市场一直在期待新的应用突破点。我们观察到,随着造车新势力销量逐月走高;高通发布最新骁龙8 Gen 3、骁龙X Elite,边缘侧算力再创新高、数字人+AI优化成熟,车载AI全息数字人有望成为“人—车—家”三屏融合中的重要一环。
一、车载全息数字人:AI Agent新场景、人车交互新体验
栩栩如生的智能座舱数字人,有望为驾驶者带来“人人交互”的体验。早先在蔚来汽车上搭载的NOMI机器人一度成为蔚来品牌的当家卖点,NOMI百变的表情和花样繁多的装饰周边让NOMI机器人成功“出圈”。我们认为,具有高度亲和力、智能水平足够高、能帮助驾驶者完成或简单(如接电话、播放音乐)或复杂(如导航、生活助理、汽车保养)的任务,是定义一个智能座舱数字人的核心要点。
未来的人机交互不会停留于冰冷的屏幕和音响。传统的人车交互使用中控屏幕作为介质,蔚来的NOMI将智能助手具象化成一个机器人像,若再进行更深的具象化展现,数字人无疑是最佳路线。以棱镜全息的数字人交互平台为例,其基于云端及本地动态行为数据库,根据不同场景驱动虚拟人形象,扩展虚拟人的使用场景及价值。同时提供基于数字资产的海量周边素材,支持数字虚拟人个性化形象选择、装扮搭配等,打造用户专属的智能虚拟伴侣。
当下,智能座舱数字人因何而被催化?我们认为,生成式AI的爆发给予智能座舱数字人“灵魂”,全息HUD和高算力智能模组给数字人添加“骨肉”,而座舱智能化时代,数字人被给予更多的施展能力的空间。
1.1 AIGC:数字人的“点睛之笔”
随着近两年AIGC生成算法和自然语言模型的发展,AIGC已被广泛应用在文字、图像、音频、游戏和代码的生成当中,输出的内容完成度较高,已经能被广泛应用于商业化中。目前主流的2D仿真数字人主要通过图片或照片完成皮套后,叠加口型和少量动作后结合情感分析和决策机制来呈现。在这一过程中,AIGC技术对于数字人的生成有以下的帮助:
提高了内容创作的效率和便捷性,降低了成本和门槛。
丰富了内容创作的多样性和个性化,满足了用户的不同需求和喜好。
目前,数字人的各种人设和行为皆是团队编辑好的剧本,用户在台前看到的数字人都只是背后运营团队的产出。例如哔哩哔哩上的许多数字人UP主,“皮套”的背后还是真人在进行配音和互动。去年双十一开始,我们也注意到了有很多淘宝品牌旗舰店用到了数字人主播来进行带货。虽然这些数字人带货主播是AI合成,在动作、嘴型上已无违和感,可以实现7*24小时直播并智能生成播报视频流内容,但互动体验仍较为初级。
2022年11月,ChatGPT一上线就迅速成为了AI界的“当红炸子鸡”,2月内用户突破1亿,成为历史上用户增长第二快的应用。这主要得益于其强大的语言生成能力和多样的应用场景。ChatGPT不仅能回答各种问题,还能写剧本、写小说、写说明书,甚至给代码纠错。并且在这过程中,它表现出了非常高的“情商”,能进行多轮对话,回复丝滑流畅。
2023年3月2日,OpenAI宣布开放ChatGPT和whisper的API接口。ChatGPT API是一个用于开发者的语言模型接口,它可以让开发者使用GPT 3.5 Turbo模型来生成自然的对话和文本。ChatGPT API的优势是它有持续的模型改进,低廉的价格,和可选的专用容量。
Whisper API是一个用于开发者的语音识别接口,它可以让用户将语音转换为文本。它使用了一个深度神经网络模型,训练在大量的语音数据上,以达到高准确度。Whisper API可以识别多种格式的音频文件,包括mp3,mp4,mpeg,mpga,m4a,wav或webm。Whisper API的优势是它有极高的速度,方便的按需访问,和合理的价格。这一举措将使得数字人的交互体验向前推进一大步。
垂直领域大模型正在向汽车渗透。今年7月31日,吉利汽车集团在内部经营工作大会上透露,吉利将于下半年发布“行业首个全栈自研的全场景AI大模型”,首款AI智能电混家轿“吉利银河L6”也于9月上市。银河L6所搭载的AI车外语音交互技术,可支持车外距离1.5米内,通过语音指令控制车窗、空调、后备箱的开启和关闭,以及自定义趣味语音包和词库,构建车内外无障碍沟通的全新社交场景。新车还将首发吉利地图导航,支持红绿灯倒计时读秒,甚至车内的香氛系统,也可以根据不同场景智能识别释放。我们认为,在愈发激烈的市场竞争中,AI将是车厂升级智能化、做出差异化的不二选择,2024年汽车垂类AI应用有望爆发。
1.2 HUD硬件、边缘计算硬件成熟,数字人拥有“骨肉”
汽车驾驶座舱硬件发展史,就是消费电子产品发展的缩影,从硬件驱动到应用驱动,从本地基础娱乐、导航,到人车物的智能互联。我们将汽车座舱分为4个发展阶段。
1)按钮时代。1924年,雪佛兰生产出第一辆配备收音机的汽车,1941年,凯迪拉克推出配置电动车窗的75系列,1960年代,福特和摩托罗拉将磁带机“搬进”汽车;
2)屏幕时代。本世纪初,随着液晶屏幕应用,可显示内容成为座舱发展的重要一步;随后软件应用开始蓬勃发展,支持凯立德导航的中控车机成为一时的热门改装方案;是否支持苹果Carplay、百度Carlife是消费者选购车型时的重要考量因素;
3)屏幕互联时代。车机应用进一步发展,车联网(V2X)概念兴起,自动驾驶与智能座舱开始耦合,依靠车载芯片算力的独立车机系统出现;
4)大屏多屏时代。生成式AI进一步赋能人车交互,点亮了车机的灵魂;屏幕更多、尺寸更大,人车交互密度进一步加大;L2、L3高阶自动驾驶方案日趋成熟,自动驾驶与智能座舱进行深度耦合,“智驾”概念越来越近。
二维的触摸屏幕交互潜力正在被开发殆尽,产品设计者开始考虑三维层面的人车交互,这里必须提到两个重要部件:
1)抬头显示器(HeadUpDisplay,HUD)。HUD原本用在战斗机上,以提升飞行员的驾驶效率,飞行员不必频繁低头看仪表就能获得飞行数据,也便于飞行员进行瞄准操作,这一产品逻辑平移到汽车,便成为了替代传统仪表盘的一种新鲜工具,驾驶者不必低头,从视野前方就可以查看车速及导航信息,极大提升驾驶体验。
全息空中显示(AerialHoloDisplay,AID)通过图像单元生成的信息(数字人、行车信息、导航等)由离轴反射系统经过风挡(也可不经风挡)投射于驾驶员前方。AID利用微结构光场重构技术,把物体离散成高分辨率的空间光斑点阵,通过光的衍射传播、干涉叠加及光场的复振幅调控,将离散的光斑点阵无损地重构在空气中,无需任何介质的散射,即可观测到高保真度的图像,从而实现无介质成像。AID技术的成熟,更是为数字人三维交互提供了优质条件。
2)边缘算力模组。AI飞轮发展滚滚向前,从今年初GPT-3.5惊艳世界,到5月14日OpenAI正式开启插件功能,我们见证了云端大模型的快速迭代与演化。当前时点,AI大模型已经站在了从“玩具”向“工具”快速演化的关键迭代期。如何让大模型渗透进入各类垂直场景,如何更低成本的使用大模型,如何让更多场景与用户接触AI,成为了发展的下一个重点。在AI向实际场景落地时,边缘算力的重要性加速凸显,边缘算力在成本、时延、隐私上具有天然优势,也可以作为桥梁,预处理海量复杂需求,并将其导向大模型。边缘算力作为AI触及万千场景的血管地位加速明晰。之前,边缘侧设备以部署通信能力为主,当下,在以高通为代表的边缘巨头推动下,算力、AI能力等边缘基建正在加速推动,同时三大运营商的算力网络与边缘资源池体系,也为我国算力梯度分布奠定了雏形。展望未来,边缘算力将始于AI带来的需求提升,同时也将赋能应用,连接更多用户,加速AI发展与迭代。
1.3 自动驾驶越高阶,人车交互越重要
自动驾驶等级划分,目前被国内外广为接受的是SAE(国际汽车工程学会)分级,从Level-0~Level-5总计6个级别,Level-0为最低级别,Level-5为最高级别。如下图,从无自动化,到“解放双脚”,“解放双手”,“解放双眼”,“解放大脑”,最终达到完全的“无驾驶员”化。
L3级别的自动驾驶越来越近。今年6月21日,在国务院吹风会上,工信部表示支持L3级及更高级别的自动驾驶功能商业化应用;7月,工信部、国标委发布《国家车联网产业标准体系建设指南》,提出自动驾驶和车联网的两大发展阶段。
我们认为,越是高阶的自动驾驶,就越是需要频繁、稳定、高效的人车交互。在L0-L2时代,由于自动驾驶只能完成一些基本的驾驶任务,如车道保持、自适应巡航,因此驾驶员需要时刻关注交通状况,并无太多精力关注人车交互,智能座舱只需为驾驶员提供基本的导航、车辆监控、娱乐交互即可。在高阶自动驾驶时代,驾驶员无需时刻将注意力放在驾驶本身,自动驾驶就可以完成大部分常规情景下的驾驶工作,而智能座舱此时需要担负一则重任——与驾驶员保持密切联系,以便在自动驾驶无法完成驾驶工作时,驾驶员能够及时介入方向盘,避免发生意外。而拟人、立体、高度智能化的HUD甚至全息数字人,是这种场景下的有效交互方式。相对于屏幕上的人工智能,全息数字人更加亲切、灵动,支持自定义外观,可以吸引年轻用户;相对于从屏幕独立出来的蔚来NOMI,全息数字人更具科技感,有机会在年轻用户群体中打开全新市场空间。
二、AI Agent——赋能下一个时代的人车交互
AI Agent(人工智能体)在大模型快速发展的驱动下进入加速成长期。诸如GPT等LLM应用在更新信息、处理多轮对话和面对复杂任务时依然存在局限,AI Agent通过增加规划、记忆和工具使用三大能力克服了这些局限,极大扩展了大语言模型的应用范围,使其能够胜任更加复杂的任务,这为AI Agent扮演人类日常生活的“助理”提供了可能。
汽车是AI Agent最具潜力的应用场景之一。车主在驾驶时,需要既快又准地对汽车进行操作,在座舱还未智能化的时代,这种操作依靠机械按钮、操作杆进行,而未来的人车交互愈发向中控屏幕集中,传统的操作习惯就需要改变。而AI Agent的能力则贴合了这种需求:快速响应、准确理解命令和无手操作,而AI赋予的智能化可以将Agent的能力进一步外延,这些抽象的能力具象到应用场景中,可以将AI Agent的能力总结为5个层次:辅助操作、车身数据采集&可视化、汽车服务(导航、保养、保险等)、生活助理、具身智能。
智能座舱和HUD渗透率快速提升,智能座舱数字人的市场前景乐观。蔚来NOMI人气相当火热,据2022年至简车言统计的蔚来二手车数据,NOMI选装比例达到80%以上,持平增强现实,仅次于NIOPilot自动驾驶功能包。我们一直强调,唯有应用-算力(也就是收入-成本)的飞轮实现旋转,生成式AI才可以健康发展下去。而在汽车这一消费产品中,由于汽车本身价格相对高昂,这类智能助手几千元的选装边际成本相对较低,因此就可以吸引到更多用户选装。
近年兴起的车辆功能订阅制,为AI产品打开了全新盈利思路,例如华为ADS 1.0一次性购买32000元,订阅包年6400元,订阅包月640元;ADS 2.0一次性购买36000元,订阅包年7200元,订阅包月720元。我们认为,车载功能订阅制有望是未来智能汽车消费的重要商业模式,基于此种付费模式,同时考虑到智能座舱的渗透率,我们可以估算出国内智能座舱数字人的市场空间。
估算逻辑一:乘用车市场增量。据公安部数据,2023年9月中国汽车保有量将超过3.3亿辆,2025年或突破4亿辆;根据观研报告网数据预测,2023-2025年我国乘用车销量为2389/2437/2485万辆。
估算逻辑二:智能座舱渗透率。由于后装HUD比例很小,我们在此仅考虑前装市场。根据IHS Markit数据,2022年国内新车智能座舱渗透率60%,此后随着新能源汽车渗透率提升,带动燃油车向智能化迈进,2023-2025年智能座舱渗透率有望进一步提升至66%/72%/76%。
估算逻辑三:HUD渗透率。根据IHS Markit,HUD渗透率2022年仅10%,此前被海外供应商垄断,今年来市场玩家涌现,叠加CR5下降,HUD渗透率有望快速提升。
估算逻辑四:智能座舱数字人定价。考虑到智能座舱数字人并非驾驶刚需,而是驾乘体验升级的可选消费,同时,考虑到智能座舱数字人背后的研发成本较高,我们认为将月度订阅价定在40-60元/每月或400-600元/年比较合适。
估算逻辑五:智能座舱数字人渗透率。我们可以按悲观/中性/乐观,分别给予20%/50%/80%的渗透率计算。
三、投资建议
对于这类强渗透于垂直领域的AI产品,主要围绕AI应用、边缘算力和光学硬件品种进行布局。
汽车全息AI应用:新兴领域的试水者
中科金财:合作方棱镜科技是国内车载全息数字人的领跑者,是全球率先达车规级量产标准的全息显示Tier1供应商,在该领域具备产品先发优势。
边缘芯片:边缘算力与通信能力的生产者。
瑞芯微:在处理器和数模混合芯片设计、多媒体处理、影像算法、系统软件开发上具有丰富的经验和技术储备。主要产品包括处理器芯片、电源管理芯片、数模混合芯片、光电产品及开发板产品。
全志科技:卓越的智能应用处理器SoC、高性能模拟器件和无线互联芯片设计厂商。产品广泛适用于工业控制、智能家电、消费电子、汽车电子、机器人、虚拟现实、网络机顶盒以及电源模拟器件、无线通信模组、物联网等多个产品领域。
晶晨股份:公司是全球布局、国内领先的无晶圆半导体系统设计厂商。为智能机顶盒、智能电视、音视频系统终端、无线连接及车载信息娱乐系统等多个产品领域提供多媒体SoC芯片和系统级解决方案。
翱捷科技:主要产品包括无线通信、超大规模芯片等,是国内极少数同时拥有全制式蜂窝基带芯片及多协议非蜂窝物联网芯片研发设计实力,且具备提供超大规模高速SoC芯片定制及半导体IP授权服务能力的平台型芯片设计企业。
乐鑫科技:主要产品为Wi-Fi MCU,是智能家居、智能照明、智能支付终端、智能可穿戴设备、传感设备及工业控制等物联网领域的核心通信芯片,具有较强的进口替代实力和国际市场竞争力。
智能模组:边缘算力的最好承载方式
美格智能:公司主营业务为无线通信模组(涵盖智能模组、算力模组、数传模组等)、物联网解决方案产品等。公司产品主要面向中高端市场,以4G制式起步,覆盖了NB-loT、Cat-M、4GLTE、4GLTE-A、5GSub-6G、5G毫米波、Wif6等各类型无线通信制式。
广和通:公司专注于无线通信模块及其应用,主要产品包括2G、3G、4G、NB—IOT技术的无线通信模块,产品应用于移动支付、移动互联网、车联网、智能电网、安防监控等领域。
光学模组:实现HUD和全息显示的必须硬件
中际旭创:孙公司重庆君歌电子主营汽车电子前装市场,与旭创科技共同开拓汽车激光雷达、HUD及汽车光通讯业务;中际旭创在2023年深圳光博会展出了AR-HUD产品。
腾景科技:公司专业从事各类精密光学器件、光纤器件研发生产以及销售,目前已经布局AR眼镜光学模组中的光波导组件。
四、风险提示
1. 边缘算力发展不及预期
边缘算力发展目前仍然处于起步阶段,未来发展路径和投入力度仍然具有较高的不确定性。
2. 智能座舱渗透率不及预期
智能座舱是承载智能座舱数字人的重要形式,如果智能座舱渗透率不及预期,将影响数字人的市场规模。
3. 市场竞争风险
虽然座舱数字人和AIAgent目前处于蓝海市场,相关产业处于成长期,但汽车产业链竞争激烈,对于企业来说未来存在不确定性。
本文节选自国盛证券研究所已于2023年11月21日发布的报告《国盛通信|车载全息数字人——AI Agent新场景,全息投影新方向》,具体内容请详见相关报告。
特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。
本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。
版权所有,未经许可禁止转载或传播。
网址:车载全息数字人——AI Agent新场景,全息投影新方向 https://www.yuejiaxmz.com/news/view/485987
相关内容
AI Agent在11个领域100个应用场景数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
AiBot:AI Agent在11个行业100个常见应用场景汇总 人工智能代理(AI Agent)的发展正在以前所未有的速度改变我们的生活和工作方式。从日常生活的小事到企业级的复杂决策,...
AI Agent(智能体)专题报告:从技术概念到场景落地指南
当AI Agent变成日常:智能助手引领全新生活模式
写在智能体大爆发前夜:全民 Agent时代即将来临
联想Agent个人助理“小乐同学”初成型,AI PC生态新未来正探索
关注AI眼镜、Agent发布,布局AI社交陪伴等应用
AI,一座迈向6G的桥梁
上海全面构建数字交通“新场景”