明泽观察|AI应用落地的投资机会需持续加强重视

文摘   财经   2024-12-16 08:10   安徽  
前言:
技术是应用的起点!AI大模型的突破性发展,超强算力(量子计算)的突破,必然加速AIGC时代的进程,一系列商业应用的逐步落地也进一步推动了AI应用的持续发展,伴随催化AI应用的实质性推进,真正开启密集化落地阶段
岁末年尾,各家头部大模型厂商的AI“诸神之战”再度开启:(1)OpenAI:12月5日正式开启连续12个工作日的新产品发布与功能更新,颇为吸睛。发布季首日,OpenAI就推出两个重磅更新,o1模型满血正式版和ChatGPT Pro订阅计划;12月9日,OpenAI的AI视频生成模型Sora正式推出。(2)Google:12月11日在官网博客发布了其新一代AI模型Gemini 2.0系列的首款模型——Gemini 2.0 Flash,并计划使其成为Google相关产品规模化应用的核心引擎,开启“智能代理时代”。(3)Meta:12月6日宣布推出一款新的Llama系列生成式AI模型,并且预计在2025年推出新一款的AI眼镜应用。整体上,AI应用有望继续沿着结合摄像头等硬件设备获取外部信息的道路,形成一套真实时空的感知系统,从互联网上主动获取内容,继续提升交流的真实感体验,对此建议关注有望受益的营销/视频生成、情感交互、教育等领域。具体内容详见正文
自2017年起,《明泽观察》开始对AI领域进行重点且深入的跟踪研究,积极保持对外观点输出,已发表的相关主题观察10余篇(详见下表),研究深度以及研究成果均受到业内认可





一、AI大模型掀起时代浪潮
AI通过具备与人类相似的广泛智能的系统,能够执行复杂任务,如学习、推理、抽象思维等任务,能够模拟、扩展和增强人类的智能行为,并利用AI技术自动生成各种形式的内容(AIGC),如文本、图像、音乐、视频等
OpenAI发布季重磅不断,AI行业迎来新纪元。太平洋时间12月5日,OpenAI正式开启为期12天的新品发布季。(1)发布季首日,OpenAI正式发布o1完整体,相较o1-preview版本,其增加了对图像上传的支持,且响应时间和性能均有显著提升。其中,o1 Pro在数学、科学和编码等ML基准测试中表现更佳,在实测中,以36分16秒的速度完成了普特南数学竞赛,体现出其在思维链和解释复杂问题中的强大潜力。(2)12月9日,Sora正式上线,支持生成1080p、20s的视频,且在文、图生视频的基础上,加入了故事板、用文本调整原视频、不同场景视频的融合等新功能,使得用户可以精准指定每一帧的输入,在视频时长方面也有望进一步提升。

图表1:Sora的故事板功能

资料来源:OpenAI,华福证券研究所

Google:12月5日,Google DeepMind于凌晨重磅推出大型基础世界模型Genie 2,可生成较为逼真的3D世界,较Genie 1的2D世界进一步升级。12月11日,Google在官网博客发布了其新一代AI模型Gemini 2.0系列的首款模型——Gemini 2.0 Flash,并计划使其成为Google相关产品规模化应用的核心引擎,开启“智能代理时代”!Gemini 2.0 Flash 的正式版本将于明年 1 月份推出,在此期间谷歌还发布了一个 API —— Multimodal Live API(多模态实时 API ),帮助开发者构建具有实时音频和视频流功能的应用程序

图表2
Genie 2模型在对话中自然地生成图像

资料来源:公开资料

Meta:12月6日宣布推出一款新的Llama系列生成式AI模型(Llama3.3 70B),并且预计在2025年推出新一款的AI眼镜应用——市场对此期望较为积极,因为早些时期的雷朋Meta智能眼镜广受好评。在今年9月底,国外科技数码媒体Laptop Mag近日评测了雷朋Meta智能眼镜,总结其出奇地好用,并具有出色的音频(麦克风阵列和语音识别)、稳定的视频和照片质量。总体来看,雷朋Meta 智能眼镜并不是第一个进入市场的,但它却是第一个跨过门槛后真正蓬勃发展的眼镜

图表3雷朋Meta智能眼镜

资料来源:民生证券研究所

AI大模型应用也在逐步变革着国内的互联网环境。一方面,在头部App中包括淘宝、支付宝、高德地图、抖音等多类型的应用均已内嵌AI大模型功能。另一方面,以 Kimi、豆包为代表的AI大模型应用流量高速提升,成为移动互联网流量的重要增长点。在主流应用领域,通过模型分析总结、多模态答案组织等能力,让搜索结果的答案更高效、更多元,让AI回答更智能、更专业,还有具有多模态搜索 AI功能应用于图片创作、创意文案等细分领域。

图表4
AI大模型智能回答的代表kimi

资料来源:kimi

二、AI大模型的终端应用:智能硬件
近期,AI眼镜受到产业界和资本市场的关注,对应有多家公司进行了产品发布,如百度的小度AI眼镜、Rokid与BOLON合作的Rokid Glasses,这些产品集成了拍照、音频和AI对话等功能,提升了用户体验。wellsenn XR预测,2025年AI智能眼镜将在传统眼镜销量保持稳定增长的大背景下快速向传统眼镜渗透

图表5AI眼镜产品形态不断完善

资料来源:民生证券研究所

其中,最为成功的产品是2023年9月雷朋联合Meta推出Ray-Ban智能眼镜,并在2024年升级了Meta AI功能,目前全球销售已经超过100万副。Ray-Ban眼镜的成功为行业提供了一条AI落地硬件的全新思路,也验证了市场需求。由于Ray-Ban的AI功能无法进入中国,国内AI眼镜行业有一定市场空缺,因此近期国内各软硬件大厂纷纷开始布局和评估AI眼镜项目。
另外在AI耳机应用领域,Ola豆包耳机使用表现则不及预期。业内人士表示消费者实际购机后的体验较为平淡,可能是因为耳机的AI功能只能实现基础对话、无法调用系统功能,如定闹铃,更无法支持第三方APP。可见,最终的产品销量取决于用户的实际体验,AI终端能否深耕应用场景,解决用户的刚需
整体从趋势上看,AI多模态+硬件的人机交互方式,有望开启拥有海量IoT终端的AIoT时代,并且持续降低 AI 应用门槛,引领新一轮生产力革命。通过AI应用结合摄像头等硬件设备获取外部信息的道路,形成一套真实时空的感知系统,从互联网上主动获取内容,提升交流的真实感体验,同时降低内容生成的成本,为AI应用的人机交互带来新起点!例如,当前OpenAI GPT-4o 通过视觉理解能力对图像中物体和复杂情景进行精准识别与理解,对人脸表情进行识别与情绪检测,可以解决手写的方程式、识别人面部表情、识别桌上摆放的音箱等问题

图表6内容生产变迁

资料来源:华金证券研究所

三、AI大模型的终端应用:AIGC

具体而言,人工智能生成内容(AIGC)是指利用AI技术自动生成各种形式的内容,如文本、图像、音乐、视频等。这一技术可以广泛应用于媒体、娱乐等领域。目前,AI大模型的相关应用中也普遍围绕文本与图片生成两项功能与产品应用场景进行适配。对此,结合各类型的使用场景可主要归纳为以下几种形态:

(1)信息生成或内容总结:围绕工作场景,用户可借助AI生成所需的文本、图片等内容信息,也可生成办公文档,或者辅助计算,缩短工作时长,提高效率。借助AI总结文字、视频等内容,提升阅读效率,聚焦核心信息。

(2)图片生成:GAN、Transformer和扩散模型等技术和开源的不断升级,降低了绘制的技术门槛和二次编辑开发成本,使得用于艺术创作、美术设计、营销创意、视觉插画、泛娱乐内容的应用逐渐增加

(3)视频生成:迈向加速阶段,2024年实现可根据文本提示生成初版短视频,之后有望逐步完善根据文本生成初版本长视频的功能。展望未来,视频生成正在由“检索生成”、“局部生成”走向依靠自然语言提示词的全量生成,生成内容更加灵活丰富,应用空间广阔

(一)具体应用场景:营销/视频生成

AI正在重塑广告业的生态系统。具体路径:用户端内容精准度提高,带动用户数提升,进而带动广告曝光量和触达量提升、广告收入提升。这其中带来的优化空间包括:(1)广告学习周期明显加快:产品在投放广告时,寻找匹配用户的试错周期缩短至一两周,甚至两三天,就能找到更精准的用户。(2)对素材的匹配更加精准:以前是少数素材跑得较好,现在能将不同素材匹配到不同渠道,有更多广告素材可在平台上获得流量。(3)更好的竞价接入流程

案例视角来看,例如程序化营销公司APPLOVIN。该公司以游戏及广告营销为主业,公司的归母净利润逐步稳定转正并逐季度稳定提升,统计从2023年开始的6个季度:归母净利润从2023Q2的8004万美元增长到4.35亿美元,增幅达443%。其中,软件平台业务成为营收增长重要动力,销售收入在2024Q3达到8.35亿美元,最主要的收入来源是AppDiscovery——由公司的AI赋能广告引擎AXON驱动,帮助广告主找到合适的用户,同时向用户展示他们可能更感兴趣的内容,从而提升公司广告解决方案的有效性,带来更多的广告需求

图表7APPLOVIN的软件平台业务收入
自23Q1开始快速增长

资料来源:APPLOVIN

国内公司的应用案例:2023年11月,蓝色光标为宁德时代打造由AI生成、用户主演的互动式广告——登录小程序,选择性别、脸型、旅行起止地点,智能剪辑,用户获得主驾视频,形象生动;2024年4月,公司发布致投资人的公开信中提到“一年来,蓝标创造了近300个真正的AI营销案例,AI驱动的收入达到1.08亿”,并且据公司统计,使用AI原生使其总体业务生产效率提升50%左右,部分创造新业务场景则可以达到600%-800%的提效;同时,公司的BlueAI下半年将重点发力视频智能理解及创作、智能体工作流等方向,通过AI全面赋能创意内容制作,并将海外公司作为全球化战略的重要支点。(注:以上信息来自于公开资料,不构成投资建议)

进一步,比较传统视频制作执行流程,基于AI工具的广告制作通过交互式视频生成的制作流程,带来了三方面的重塑:(1)压缩制作过程,(2)提升创意和剪辑自由度,(3)节省制作成本和时间

从操作细节上来看,现存的挑战包括:由于视频是图像模态的进一步扩展,所以对技术的要求更高,对于算力、数据等资源要求也较高(样本质量提升,需要训练计算资源的增加),成熟程度相对文本、图像较慢。以麦当劳在日本的广告翻车为例,一段由AI生成的11位美女在不同场景下展示麦当劳薯条的视频,作者是知名AI艺术家Kaku Drop,但是评论指出存在色彩光感油腻、比例失调、人物六指等AI生成的固有问题。同时,AI生成技术广泛应用于各种创意领域,尤其是广告和宣传片,也引发了关于版权和道德的激烈讨论。(注:以上信息来自于公开资料,不构成投资建议)


图表8
视频生成中计算量对结果的影响

资料来源:新智元,华金证券研究所

总的来说,广告营销领域的工作流程与环节设计很多繁琐工作,需要耗费大量的时间,其中有较多的工作都可以期望用AI代替人工的方式实现效率的提升


(二)具体应用场景:情感交互

在当前的 AI 社交领域,包括Talkie AI在内的头部产品其核心提供的是类似“角色扮演”的游戏体验。与常规的ChatBot不同,情感陪伴类AI应用更强调角色设定、图像形象,以及通过图片或语音等多模态形式的交互,从而达到接近真人交互的代入感和较好的娱乐体验。在这一领域,结合AI硬件,AI玩具或“游戏化AI产品”如何获得更为有趣的游戏体验也是主要注点

例如,Genie 2模型搭载Imagen 3、SIMA智能体,具备对象交互、多类型角色动画制作、物理效果模拟等功能,不仅能够根据单个图像生成可交互的3D场景,还能智能响应用户的键盘操作,实现精准操控角色、生成反设事实、1分钟长视频生成等功能,打造新一代沉浸式互动3D游戏体验。为了将Gemini 2.0的覆盖范围扩展到虚拟环境,Google DeepMind 也在与 Supercell 等游戏合作伙伴合作,开发智能游戏代理——通过实验性AI伴侣实时解读游戏操作、建议策略,甚至可以通过Google搜索访问更广泛的知识


图表9Genie 2模型能帮助画好下一步棋的位置

资料来源:公开资料

(三)具体应用场景:政策促进人工智能在教育板块的全场景落地

此类AI还可以应用在教育的场景下。目前比较常见的应用领域是写作辅助类和学习辅助类。前者例如:腾讯文档AI,后者例如:星火语伴、AI口语陪练。从更广泛的场景上来说,在PC端用户还可以实现通过AI应用翻译实时字幕,消除语言障碍的功能。根据亿欧智库的统计信息,全球AI+教育公司主要集中在中国和美国,且均以语言学习类和自适应学习类为主

12月2日,教育部办公厅发布《关于加强中小学人工智能教育的通知》,通知明确了人工智能教育的总体要求,强调要以人工智能引领构建以人为本的创新教育生态,为促进学生全面发展服务引导学生正确处理人与技术、社会的关系,促进思维发展,培养创新精神,提高解决实际问题的能力。

图表10教育部部署加强中小学生人工智能
教育相关要求

资料来源:教育部

展望AI赋能教育的方式:(1)个性化学习路径定制,精准教学提升效率;(2)智能评估反馈即时,助力学生自我成长;虚拟现实技术沉浸体验,抽象知识直观展现;(3)大数据分析学情趋势,科学决策优化教育生态。这些路径,令AI不仅仅是工具,更是创新教育的催化剂,让学习更有趣、更高效

(四)具体应用场景:超强算力(量子计算)

量子计算是一种遵循量子力学规律调控量子信息单元进行计算的新型计算模式。量子计算机作为执行量子计算任务的设备,以量子比特(qubit)为基本运算单元。在量子计算中,基于量子叠加原理,量子比特的不同状态可被同时存储和处理。量子计算为解决某些经典计算机难以处理的复杂问题提供了新的可能性,有望在密码破译、材料设计以及人工智能等方面得到广泛应用。国内方面,2024年8月以来,华为多条量子计算相关专利申请公开


图表11
华为量子计算专利申请情况

资料来源:天眼查

近期,量子计算行业迎来进展性事件,有望对AI及算力的发展起到一定程度的助推作用:11月19日,NVIDIA宣布与谷歌量子AI团队“Google Quantum AI合作,帮助后者加速设计下一代量子计算设备。12月9日,谷歌公司宣布研发出一款运算能力超强、适用量子计算机的芯片,宣称这种芯片只用5分钟即可完成现有运行速度最快的计算机要10尧(10的25次方)年才能完成的任务,相关研究成果发表于9日出版的英国《自然》杂志。这款芯片名为“威洛”,虽然量子比特多,但错误率却减少了一半,而且还具备适时纠错的能力,谷歌宣称其为研制“实用的大规模量子计算机铺平了道路”

展望未来,量子计算有望通过其高效的处理能力,加速AI的发展进程。“AI+量子计算”的交汇,也有望塑造科技未来的新引擎,比如在复杂系统模拟、解决能源危机、精准医疗、新材料设计等领域催生出一系列创新应用。

(五)具体应用场景:军工

随着AI被政府决策层普遍认定为具有革命性影响和重要地缘政治意义的技术,许多科技公司对军事合作的态度也正转向开放

11月,Meta正式将Llama模型开放给美国国家安全机构和国防承包商使用。同月,Anthropic也宣布,将通过与Palantir Technologies的合作向美国军方提供其AI使用权限。

12月4日,美国国防科技公司安杜里尔工业公司(Anduril Industry)宣布与人工智能公司OpenAI建立战略合作伙伴关系。双方将通过OpenAI的先进模型与安杜里尔的高性能防御系统(主要为反无人机系统)以及“晶格”(Lattice)软件平台相结合,开发用于国家安全任务的人工智能解决方案。这是OpenAI与美国军工企业的首次合作。在今年年初,OpenAI放弃了禁止将技术用于军事和战争的服务条款,这意味着OpenAI所开发的高性能、前沿人工智能模型将可以用于提升安杜里尔工业公司相关军事系统的性能

安杜里尔工业公司目前主要的防御系统产品为“走鹃”(Roadrunner)无人机以及“脉冲星”(Pulsar)便携式电子战系统。“走鹃”垂直起降无人机可以携带多种载荷,并用于拦截敌方无人机。“脉冲星”多用途干扰机可以灵活部署,执行电子对抗、反无人机、电子支援等任务。OpenAI的人工智能技术预计可以大幅度优化这两种系统对海量多源、复杂异构且快速增长的战场情报数据进行深度挖掘和融合分析的能力,进而进一步优化精确感知、缩短决策周期、自主任务规划与协同等关键技术。(注:以上信息来自于公开资料,不构成投资建议)

图表12“走鹃”(Roadrunner)无人机

资料来源:开资料

四、投资建议
AI应用热度仍在上升!近期,OpenAI启动“12天发布计划”,发布o1正式版、Pro版订阅与强化微调(RFT)技术,提升模型推理与应用潜力,Sora引发市场对AI+视频生成的关注,同时还有腾讯开源混元模型、谷歌Genie 2世界模型和World Lab的世界模型,强化3D场景与动态交互能力。作为全球社媒头部的Meta,在业绩陈述中表示由于对AI驱动的信息流和视频推荐的改进,仅今年就使用户在Facebook上花费的时间增加了8%、Instagram上增加了6%,使得使用图像生成业务的企业转化率提高了7%,近期还发布了高效模型LLaMA 3.3 70B,同时也在带动资本市场对AI智能硬件(AI眼镜)的预期
趋势层面来看,在数字化时代,AI是驱动一切变革的核心力量。现如今,AI的意义已经不仅是解放人类双手大脑于重复性任务了,而是已经进入了创意开发领域,并在分析、运营等领域发挥了更大的作用。从节省时间和成本到增强客户体验、提高个性化和更全面的洞察趋势等方式,AI已经逐渐开启深度赋能的方方面面。
随着AI应用和嵌入到 App内的AI功能日渐成熟,我们判断三个商业模式或将逐渐明晰:1)付费,包括AI应用付费和具体AI功能付费;2)广告,新的应用场景将带来新的广告渠道;3)AI促成的消费,尤其是购物类App内的AI功能、广告营销
更长期来看,AI带来的效率提升将伴随着商业模式的精进,我们认为互联网广告营销/视频生成、教育、情感应用(含游戏)等以线上为主的业务部分最有望受益。尤其是在营销领域,随着技术与算力的快速发展,AI有望更好的赋能用户行为分析、精准推送,进一步降本增效;同时,AI技术的有效落地和应用,多维度地优化并提升了运营效率与用户体验,推动广告营销业务流程重塑和产品价值创新

结论:2024年可定义为:AI应用发展元年

自2023年GPT突破以来,AI大模型技术和应用逐渐从文本扩展至更多模态,这一变革的出现使得AI可以更加广泛应用于媒体、娱乐等领域,代表了内容生产方式的革新。纵观2024年全年,AIGC 行业月活用户持续攀升,AI应用落地效果积极!
展望未来,随着AI大模型应用的加速落地,对各个产业的发展方向、企业的经营,将产生重大影响!对于企业来说,AI正在从新颖技术转变为必备的生产力工具,成为推动企业转型的核心力量,具体例如:巧用AI系统,实现客户精准分类;精进业务内容和商业模式,创造新兴需求。对于产业投资而言,在AI大模型应用已有显著成效的背景下,对应建议除军工应用以外,持续关注文娱、营销、教育、情感领域载体承接的投资标的,下一个节点就是人形机器人普及化的阶段会呈现新的应用奇点!



文章观点仅供参考,不构成投资建议

明泽资本

研究发掘价值  专业创造财富
长按识别二维码,加关注

明泽资本
明泽资本订阅号。 “金牛奖”三连冠私募基金公司。
 最新文章