100Summit
义柏研究院
欢迎AI+硬件领域创业者、投资人与我们联系,投递BP请发送至邮箱:BP@100summit.com,期待与您深入交流!
本文核心观点浓缩
Insight
AI作为新的技术能力,原则上具备部署条件的硬件产品都可搭载AI功能,但在实际的市场中,硬件产品的定义才是重中之重。AI硬件核心竞争维度是硬件产业和品类的竞争,到了具体产品形态,要看AI在产品上价值的比例,以及 AI 的价值增量。
3、Timing
AI大模型端侧能力稍微完善,短期来看,是成熟品类升级的机会,我们认为效率提升、情感陪伴以及某些垂直特殊场景是目前较有前景的市场方向,而AI Native 的应用仍然需要时间,创新硬件品类需要经历市场考验。现阶段选好品类选好赛道,是最关键的决策。
以下,各位enjoy。
01
谁是下一代wearable device
据Ericsson白皮书《Defining AI native》,AI与系统可以分成非原生和原生两类。
对于非AI原生(Non AI-native)系统,核心在于AI为成熟产品的赋能,部署方式或替换已有部件、或增加新部件、或增加AI控制功能。
对于AI原生(AI-native)系统,系统中所有组件均基于AI能力构建,整个AI原生系统拥有内在的AI功能,AI是设计、部署、操作和维护等功能的自然组成成分。
AI+:指的是AI原生系统,但目前大模型的能力无法达到理想中的构建效果,以perplexity为例,作为典型的AI native搜索类应用,市占率仍然远不及Google等传统搜索引擎。“AI+硬件”,即为根据AI能力构建硬件外形的产品形态。
+AI:指的是非原生AI形式,即“硬件+AI”,在成熟的软硬件系统上叠加一定的AI功能,更符合当前模型发展的能力阶段,或成为近期的迭代重点,如Copilot整合入微软成熟的操作系统(2023年末用户数已突破5W)。
影响最深远的技术是那些能融入生活细节的技术,如人类的第一项信息技术——写作,将口语转化成持久储存的信息,现在已经遍布在日常生活的各个细节之中。对于基于芯片的信息技术,他认为笔电就像是一个很重要的纸质本子,只是人类接触信息技术巨大潜力的中间阶段,Wearable Device是个人计算设备必须的一个尺度。
Mark Weiser(普适计算之父)曾在1999年提出,
普适计算:在任何时间、任何地点、以任何方式进行信息的获取与处理。
对于Wearable Device的终极答案,业界存在三种标准:访问设备的难易程度、压缩和传递信息的能力以及重量。在这三种标准和Mark Weiser理念的指引下,或许耳机、眼镜是最具希望的Wearable Device雏形,前者轻量、后者信息密度更大,初代产品有AirPods(1亿套+)、Meta Quest(2000万台+)。
访问设备的难易程度:从台式机、笔电、iPad到手机,访问互联网、调用算力的门槛越来越低,目前Meta的智能眼镜的探索或许是一个方向,离人的主要感受器官更近,侧重于通过传感器接收指令。
Meta glasses
Limitless
压缩和传递信息的能力:在手机这一个人计算设备诞生之时,电话降低了人与人之间沟通信息的门槛,或许新一代的可穿戴设备需要展示高于当前手机的信息传递能力,即对传递的信息进行进一步处理,而这正是生成式AI的长项,如Rewind团队开发的AI硬件Limitless,核心功能正是24h记录和提炼对话内容。
重量:设备基本性能是否符合常人对穿戴设备的要求,如重量、续航等。VR或许不是终极答案,在轻量化方面仍有较长的优化道路。Vision Pro的重量在600到650g之间,相当于脸上挂了一瓶可乐,Meta Quest Pro更是有722g。
当前“硬件+AI”路线主要科技大厂和消费电子巨头为主,目的为在同质化严重的消费电子产品竞争中与竞对形成差异化,优点在于,这些产品本就是成熟品类,销量有保证,风险较小。而对备受希望成为下一代Wearable Device的“AI+硬件”产品仍有理念之争,是锦上添花(如Rabbit R1,简化人与App之间的交互)还是完全颠覆(如AI pin,全新交互方式或将带来的更好的用户体验)仍未有定论。
模型侧:大模型正在越做越“小”
海外大模型发展情况:向着多模态、端侧模型发展
OpenAI:已发布多模态大模型 GPT-4o,向着多模态、端侧应用发展
据《思考:快与慢》,人的大脑有“快”思考和“慢”思考两个系统,前者负责直觉式的固定范式知识,后者则面对复杂、不常见的情况,需要步骤分解、逻辑推理、综合信息。对应到个人计算设备,“快”思考对应的是端侧模型,“慢”思考则对应的是云端模型。而随着大模型不断加大参数,推理所需的计算和存储开销也在快速增长,终端解决方案最终指向端侧模型。
GPT-4o 向着端侧应用发展。据钛媒体报道,在 2024 年 5 月 OpenAI 春季发布 会上,OpenAI 运用了大量的篇幅,去介绍 GPT-4o 在移动端与人类交互的先进程度;据 21 世纪经济报报道,在此次发布会上,OpenAI 发布会呈现的新模型多基于手机端场景,并且 IDC 中国研究总监卢言霞表示,GPT-4o 意味着大模型在端侧的落地更进一步。
Google:多模态大模型进一步拓展,拓展至 200 万 tokens
多模态大模型进一步升级,推出 Gemini 1.5 Pro。Google 于 2023 年发布多模态大模型 Gemini,2024 年 2 月,Google 发布了 Gemini 1.5 Pro,Gemini 1.5 Pro 是一个 多模态模型,可以上传各种文件、图片、视频等文件,并最高支持 100 万 tokens 的 上下文,2024 年 5 月,Google 突破上下文窗口限制,将 Gemini 1.5 Pro 的上下文窗 口拓展至 200 万 tokens。
Meta:发布多模态 AI 模型 Chameleon,引领多模态革命
国内大模型:快速发展,加速追赶海外大模型
芯片侧:端侧AI芯片正在不断迭代加速
高通将模仿神经网络模型的Hexagon处理器融合进SoC中,打造专属的AI引擎并持续进行迭代,搭载最新一代AI引擎的骁龙8Gen2芯片在自然语言处理、目标检测等方面的性能均实现了大幅提升。此外,高通还在SoC中开发了一个称之为“高通传感器中枢(SensingHub)”的芯片子系统,能同时处理多路数据流,实现关键词识别、异常检测、图像分类等AI性能。
英伟达,黄仁勋表示PC将成为非常重要的AI平台。未来的AIPC都能够运行AI、由AI增强的应用程序,现在全球有1亿台基于GeForce RTX的AIPC,有超过200款搭载英伟达芯片的RTX AI PC,包括华硕、微星等PC品牌厂商都是合作伙伴;
AMD,AMD发布了面向下代AI PC/Copilot+ PC的世界一流处理器——锐龙AI 300系列。采用4nm工艺,CPU是全新的Zen5架构,GPU是升级版的RDNA3.5架构,NPU是全新的XDNA2架构,该架构引入了全新的Block FP16浮点精度,减少了转换步骤,提高了执行效率,首发两款型号定位高端市场,NPU算力达到50TOPS(INT8),超过高通和Intel;对比骁龙X Elite,日常办公、生产力创作、多任务、图形等各方面遥遥领先。
走在前沿的冒险者(AI+硬件):对大多数AI硬件产品而言,硬件并非护城河,软件方面受制于技术和尚未出现的创新理念,依旧道阻且长。
2024 年 5 月,Meta 团队发布了“混合模态”AI 大模型 Chameleon,最大特点在于采用统一的 Transformer 架构,将文本、图像和代码等不同模态的信息作为离散标记进行处理,与以往的模型不同,Chameleon 摒弃了针对不同模态的单独编码器或解码器,通过“早期融合” 方法将所有模态从一开始就投影到一个共同的表示空间中,实现了跨模态的无缝推理和生成,并刷新了当前的技术标准(SOTA)。
自 2022 年 11 月 30 日 ChatGPT 发布以来,AI 大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。国内学术和产业界在过去一年也有了实质性的突破,大致可以分为三个阶段:准备期(ChatGPT 发布 后国内产学研迅速形成大模型共识)、成长期(国内大模型数量和质量开始逐渐增长)、 快速发展期(各行各业开源闭源大模型层出不穷,形成百模大战的竞争态势)。
至少在2007年,在发布初代iPhone的时候,苹果内部已有VR的概念雏形,在这数十年间收购AI公司技术、打磨VR产品,但Vision Pro的热度只是昙花一现;
AI Pin由GPT-4驱动,饱受差评,IDC分析师称其对于从用户的角度而言毫无意义,销售遇冷,Humane在年初进行了部分裁员,彭博社爆AI pin正在寻求收购;
Rabbit R1被科技博主曝光称是一个安卓应用程序,问题包括AI模型响应过慢、对网络通畅性要求过高、无法端侧推理、电池发热严重等。
AI Pin的交互逻辑和输出方式
Rabbit R1的基本参数和应用展示
相对保守的探索者(硬件+AI):成熟的PC和手机上已经探索出了硬件+AI的演进道路。各大手机厂商加速推进“手机+大模型”,微软、联想在PC上的AI布局也已然清晰。
02
应用前瞻:多点开花,成长可期
一、市场概况
“AI+硬件”的可应用场景比较多,在个人、家庭等场景中均有涉足。当前“AI+老三件”(PC、Pad、手机)的类别更符合“硬件+AI”的概念,在相对成熟的产品之上进行尝试,而“AI+八大品类”(机器人、智能交通、智能家居、智能穿戴、智能教育、智能娱乐、智能医疗、运动健康)的尝试则更加大胆,或利用AI功能取代一部分与手机的交互,或利用对话功能实现机器和人的陪伴。我们总结了眼镜、耳机、玩具、教育、NAS等前沿“AI+”场景。
二、AI+眼镜
概念界定:VR设备提供完全虚拟体验,如头戴式显示器,AR设备通过叠加虚拟元素在现实世界中提供信息,如智能手机,MR设备结合了二者功能,具有更丰富的交互体验,如智能眼镜。
AR眼镜
VR头盔
MR眼镜
历史上在眼镜上做文章也起起伏伏多次,Google Glass 2014年一波,Magic Leap、Quest收购 2016/2017年一波,2021年元宇宙一波,现在2024年Meta Ray Ban 2代又掀起来一波。不过这一波因为有多模态大模型带来的人机交互创新,前景再一次打开。
2023年全球VR设备或由VR设备硬件形态和内容生态并无明显突破,出货量明显下滑;受益于高通AI专用芯片发布和光波导技术突破,AR设备表现亮眼,影视媒体等消费级AR兴起。
AR需要连接手机,以蓝牙传输音频和图片,手机接收输入来理解或调云端模型推理,收到结果后再蓝牙回传可穿戴设备。因此这个场景走的是OffLoad手机上的传感器,与人的感官更近,走的是AI入口故事,与手机厂商之间的生产关系,天然需要有个合作方案,很难是平行线。
AR/VR/MR产品目前主要有三种路径,逐渐challenge手机的地位:1)专注于屏幕拓展,比如躺着看电影、电脑分屏提高工作效率;2)offload手机的AR功能,如AR导航、实时翻译、利用AI识别物体、第一视角影视创作等;3)逼近理想意义的空间计算,实现手势交互、触觉传感等,偏向消费C端。 芯片技术、显示Micro OLED等硬件条件的突破无疑驱动了AR/VR/MR产品的翻红,但对于实际落地到应用,结合业界对Wearable Device的判断标准,其存在两大使用痛点:1)舒适度,重量是否适合头戴、近距离观看屏幕是否会造成眼睛更加不适,目前Meta和雷鸟作出轻功能重体验的选择,或为未来AR/VR/MR类产品的改进方向;2)交互逻辑的优化,当前产品普遍存在操作不自然的问题,Apple Vision Pro的手势交互或许是一大方向。
对于智能耳机(配备手机语音助手激活功能,大部分未集成AI),据IDC数据,2016-2021年间出货量大幅上升,在2021年出货量达13000万台。据前瞻产业研究院估计,2021-2027年间全球智能手机出货量增长率仍将保持在20%左右,2025年出货量将超过10亿台,2027年有望达15亿台。 中国耳机市场竞争格局分散,CR5<35%,头部企业并无绝对市占率优势, 竞争较为激烈,行业整体仍处扩张阶段。具体到TWS耳机品类(True Wireless Stereo,工作原理是手机通过蓝牙连接主耳机,再由主耳机通过无线方式快速连接副耳机,实现真正的蓝牙左右声道无线分离使用),尚未出现绝对领先厂商,在AI原生时代占据先机对各家厂商的下一步竞争非常关键。
AI耳机可视为在成熟的产品之上进行功能的更新,主要为会议转录、智能摘要、语言同传等,不少厂商已经或将要集成此类功能,其中科大讯飞等具备科技积累的厂商上新速度最快。未来耳机或将打通视觉,为耳机带来更多可能,但考虑到当前遇到的头发挡摄像头、发热、过重等阻碍,或需更长时间的技术和产品迭代。
AI的运用对玩具产生了巨大的影响,AI技术让儿童玩具产生了更多的新玩法,解决了儿童陪护、教育、娱乐上以前不能解决的一些问题。其中智能化互动主要体现在以下几方面: 情感智能:AI 能感受到用户的情感,并且能把自己的反应以合适的声音韵律表达出来,让用户感觉到情感回应。 回应非内容的声音:AI 能够敏锐地捕捉一些生物信号,比如笑声、咳嗽声、呼吸声、哈欠声,而当前的生成式 TTS 模型,可以模仿出人的声音。 低延时:大模型可以在 300 毫秒之内给出回复,人几乎感受不到机器的处理过程,提升了交流体验。 目前,越来越多的科技公司也开始向儿童玩具方向发力,OpenAI投资了儿童游戏生成器公司Heeyo,国内涌现出如跃然创新、美奇互动、亿家亿伴、柯南智能、三耳猫科技、奇点灵智、零动未来等一批创业公司。 市场测算:根据 imarcgroup 数据显示,2023 年全球玩具市场规模达到 1830 亿美元,且还在不断增长。根据市场研究公司Transparency Market Research的报告,截至2026年,全球智能玩具市场规模预计将增长到700亿美元。
海外(如美国、日本等)仍处于产品雏形阶段,NICOBO选择试售320件,Moflin甚至一年未更新消息,但从Lovot和NICOBO的销售热度可推断,在社会原子化、个体情感距离疏远的趋势之下,具备多种应用场景(如虚拟伴侣、老年陪伴、儿童玩伴等)的情感陪伴玩具的未来市场可观。
前者指在技术加持下,专用于教育用途的产品具备了智能化的功能属性,带来更好的产品体验,如听力机、词典笔、智慧黑板等; 后者指家具智能、可穿戴设备等根据教学群体进行定制化,以满足教育场景应用的需求,如学习平板、学习手机等。
产品应用分类:针对学校和家庭的不同场景诉求,形成针对性功能,如学校侧的洞悉学情、教学资源获取、AI批改、课堂质量检测等;家庭侧的学练结合、智能教辅、沟通陪伴、安全管控等。
市场竞争格局:头部厂商竞争加剧,场景细化,参与者多元化。
市场现状及规模预测:供需两旺,产品向高端靠拢,预期2024年规模破千亿,未来市场空间可观。
i. 在行业标准难以统一的大背景下,产品只能聚焦于单一场景,同质化现象较为普遍,因此生态系统的支持非常重要,未来产品内部,内容占比越来越高,优质、科学、交互性更好的内容会逐渐超越产品成本,利好:1)百度、科大讯飞、网易有道等新型科技公司,利用高效产品反馈更新速度,快速迎合消费者需求;2)猿辅导、作业帮等拥有海量题库的教育资源的传统教辅企业,凭借数据上的优势培育出更专业的教育大模型。
ii. 在随竞争加剧,或许将寻求创新来区分产品市场,如开发具有特定教育场景应用功能的智能硬件。市场现状及规模预测:供需两旺,产品向高端靠拢,预期2024年规模破千亿,未来市场空间可观。
i. 洛图科技(RUNTO)的数据显示,2023年中国个人消费类电子教育智能硬件的市场规模为469亿元,同比增长11.4%,其预测未来三年复合增长率将达10.5%。
ii. 学习平板和智能手表将仍是智慧教育的核心产品。中国学习平板4000-5000元中高端产品市场占比从2022年一季度的5.9%增长到2023年二季度的28.1%,5000元以上高端产品从5.8%增长到12.8%,2000元以下低端产品从74%下降到41%。
• 总结
当前智慧教育的降本增效非常自然有两条思路:1)面向老师,辅助解决其大量批改、备课、复盘的时间精力耗费;2)面向学生,大模型帮助解题相对遥远,但在训练口语、针对性练习等方面功用较大。 针对面向老师的批阅机,K12学习的最终目的是面向考试,对利用大模型替代老师的方式需要保持谨慎乐观:1)将误判概率控制在可接受范围内;2)训练批阅机以准确反映改卷老师的评判标准。 针对面向学生的学习机,主要聚焦于K9以内的学习,而小学阶段的竞争最为激烈。或由于高中阶段学习深度提高、corner cases增多,当前涉足企业较少。
进一步区分,在教育领域下,或许硬件的门槛并非高不可及,内容才是各家构筑的壁垒所在,从关注度和销量可见,猿辅导、作业帮和网易有道在K12教育领域的积累也为其拓展产品线带来的动量更大。
市场规模:近年来,NAS品类在全球呈增长趋势。依据Fortune Business Insights的报告,2023年,全球NAS市场规模约363亿美元,2021-2028期间年复合增长率约为19.6%。目前,企业级用户的需求占到NAS整个市场规模的约60%,另外40%的市场主要由C端消费者和中小型工作室贡献。 竞争格局:To B市场中,中国台湾地区的生产厂商的市场地位比较稳固,以群晖、威联通QNAP、NETGEAR为代表的头部品牌,占领了大部分市场份额。To C市场相对分散,群晖等企业级玩家占有一定份额,一些硬盘厂商如西部数据也有一定市场占有率,市面上其他厂商还包括极空间、鲁大师、冰鲸科技等。
满足当前消费者需求能在C端破圈的NAS产品需要具备以下两方面能力: 1)相较于传统NAS产品,需要具备对用户友好且易用的操作系统以及集成更好的硬件配置; 2)私域运营及流量转化能力,需要和用户保持持续沟通洞察市场,从而打造更符合用户个性化需求的产品。
概念界定:最接近AI native概念的产品,围绕AI功能搭建相应的硬件。 发展现状:目前仍处于前沿的探索之中,产品不具备统一形态,功能设置不一。 近期产品
在“AI+配饰”是尝试最激进的领域。也许正像前阵子个人知识管理工具软件的爆火,Notion、Obsidian、Flowus、石墨文档、语雀、飞书、Flomo等软件,夹杂着人们对未来AI native的美好想象,利用大模型提高个人产出效率、甚至成为生产力一部分的热情,而生发的一系列产品。 开发一款成功的硬件产品需要长时间的研发和大量资金投入。从设计、原型制作、测试到量产,每个阶段都可能面临技术难题和延误,对搭载在硬件设备上的AI应用,其可替代性很强,如果没能形成用户规模和差异化,很难在当下如火如荼的“AI+硬件”的浪潮中立足。
03
启示录
参考业界标准和Mark Weiser的理念,我们认为产品技术创新,用户体验,品牌和市场是“AI+硬件”竞争维度中的三个关键因素,分别要求企业不断推出具有独特性能的产品、给予更好的产品使用体验、打造品牌以及打开销售渠道。 产品功能方面:通过高性能计算资源和深度学习算法,提升智能硬件产品的计算能力和处理速度。例如,家用巡逻机器人能够在本地进行实时视频分析和异常检测,提高安全监控的效率和准确性。 用户体验方面:根据用户的行为和偏好,提供个性化的服务和交互体验,在不同的使用环境和场景中提供高效的解决方案。例如,智能宠物门通过分析宠物的行为,提供个性化的健康建议和提醒;根据不同的游戏类型和场景,AI游戏灯光系统可以自动调整灯光效果,提供最佳的视觉体验和氛围。 品牌和市场方面:对于AI+硬件的冒险者而言,当前技术无法实现我们所想的智能助手的效果,找准产品的目标市场,或为现在前景最明晰、成功概率最大的一条道路,1)选择一个行业集中度低的大市场,占据先发优势;2)或选择超小市场,尝试成为头部玩家;3)或冒产品创新的风险,开创品类,类似AI PIN、Rabbit R1和Friend,风险与收益并存。
按照市场大小和集中度,可以从四个维度分析目前AI硬件产品的市场机会。 在集中度高的大市场中,如PC、手机、AR/VR等,核心在于产品升级,市场属于头部大厂之间的竞争; 在较为分散的大市场中,如耳机、眼镜等,核心在于运营管理,通过营销手段快速占据一定的市场份额,价格战必不可少,考验公司的资源整合以及成本控制能力; 在集中度高的小市场中,如NAS,核心在于功能创新及增强,深度洞察用户需求,提供更符合用户偏好的解决方案; 在较为分散的小市场中,如玩具、情感陪伴等,核心在于产品品类的定义,找到可能成为市场爆品的产品机会。 1、陪伴类,个性化和情境感知方向(情感陪伴类的需求容错率更高),需要很强的AI能力 2023年中国青年报对2001名18-35岁青少年进行的一项调查显示,64.2%的受访青年感觉自己存在心理或行动上的社交卡顿、甚至产生社交孤独感,在社会个体原子化、分工精细化的形势之下,陪伴类场景的需求有望进一步扩大。 此类AI需要具备更强的EQ,目前仅有Claude V2的EQ跑赢了人类男性。主流情感陪伴类AI的底层模型为GPT-3或自研模型,模型要求能力更偏软性技能,专注于跨语言能力、逻辑连贯性、记忆力、生成速度等方面,允许幻觉出现,但大模型的“幽默”当前仍然难以实现。现阶段要提高大模型的情商(EQ),Fine-tuning是公认有效的技术路径,在实践中用的最多。 2、办公or学习效率提升方向(比较明确的需求,亟需更好的产品),需要很强的AI能力 在办公场所智能助手,高效管理会议设施,自动化安排文件整理和会议日程,极大提高工作效率;针对学习,智能分析学习路径、洞察知识漏洞、进行针对训练。AI在这两类场景具备较强的降低时间成本、增加工作和学习效率的效用。AI工具为我们提供了前所未有的效率和创造力。 目前在音频方面的AI硬件产品也层出不穷,诸如讯飞耳机&笔记本、Plaud note等,已经逐渐进入大家的工作和学习中。但想真正成为日常工作学习中必不可少的小助手,还需要针对AI集成方案、AI能力进行进一步优化和升级。 3、针对特定人群的共性需求,不需要很强的AI能力 在市场调研中,我们发现,针对特定人群的硬件产品,如主打中东市场的Zikr Ring、针对盲人阅读需求的智能点显器等,因其目标用户具有共性需求,此类“AI+硬件”产品对应足够小市场,有望直接成为市场头部。
Human AI Pin Review: not even close
参考文献
人工智能:潞晨科技|硅心科技aiXcoder|循环智能|Zilliz|西湖心辰|埃睿迪|Infinity|共达地|卡方科技|零犀科技|鼎茂科技|易航智能
新能源/新材料:Polymaker|芯视界科技|博雅聚力|美氟科技|莒纳科技|凌动科技|贻如生物|青能科技|昇科能源|远信储能|埃克森新能源|慕帆动力|弘润清源
企业服务/产业科技:丰图科技|牛客网|红圈CRM|店匠科技|弘玑Cyclone|易路|伙伴云|派拉软件|EMQ|富数科技|嘉为蓝鲸|支流科技