科大讯飞:大模型商业化应用元年的下一步

学术   科技   2024-12-05 19:00   北京  

当前,AI的核心挑战不在于技术或数据壁垒,而是如何在商业和应用上实现真正的价值。科大讯飞秉持“顶天立地”策略,推动大模型在G、B、C端市场的规模化落地,正在为AI的商业化应用开辟新路径。

2024年上半年,科大讯飞在大模型技术的探索中迎来了新的里程碑。在半年度业绩说明会上,董事长刘庆峰自信地表示:“在过去半年把大模型的脾气摸透以后,是我们今天最有底气的地方。”此番发言不仅传递了科大讯飞在技术进步上的信心,也引发了外界对其核心竞争力的关注:科大讯飞的“底气”究竟源自何处?

作为人工智能领域的先行者,科大讯飞多年来专注于技术创新与自主研发,不断突破大模型的技术壁垒。通过算法优化、数据精炼和应用场景的深入探索,公司逐步构建起以大模型为核心的技术生态体系。如今,大模型不仅是推动技术发展的引擎,更是科大讯飞加速产业智能化升级的关键利器。

在这背后,是科大讯飞持续投入资源进行技术创新与实际应用的结合。从语音识别到计算机视觉、自然语言处理,再到多模态智能,公司在多个领域实现了技术积累与创新,推动大模型在各行各业的规模化落地。科大讯飞的“底气”,正是来源于这些深厚的技术沉淀和面向未来的战略布局。

1


AI老兵抢跑大模型

在大模型的风口浪尖,科大讯飞选择了一条扎实前行的技术之路。多年来,公司不断积累技术优势,逐步打造了全面领先的通用底座大模型。这一过程为科大讯飞在大模型商业化应用的元年抢占市场先机提供了坚实的技术保障。同时,公司坚持“顶天立地”的策略,强调技术创新与应用落地并重,使每一次技术迭代都能为产业带来实质性的价值,从而在激烈的竞争中脱颖而出,引领行业发展。

技术先行,快速迭代

25年前,科大讯飞带着智能语音技术走出象牙塔,以其卓越的语音识别、合成和转写等技术,奠定了其在行业中的基础地位。随着技术的不断迭代和市场需求的更新,公司的技术能力从语音拓展至更多领域,涵盖了语音、图像、认知智能等领域,早早就开始布局人工智能技术的全方位发展,构建了扎实的AI技术底座。

自2022年ChatGPT问世后,全球掀起了生成式大模型的研发热潮。各大互联网巨头、新兴AI企业和传统科技公司纷纷加入竞争,科大讯飞也不例外。凭借多年的技术积累,科大讯飞在底座大模型技术的发展上进展迅速,通过一系列具有特色的迭代版本来不断提升大模型的能力。

纵观科大讯飞星火大模型的发展历程,在短短一年的时间内,讯飞星火就从V1.0的“基础启航”升级到2024年6月星火V4.0的“突破提升”,展现了公司在大模型技术上的不断探索与进步。早期版本侧重于基础的七大核心功能,先期聚焦文本方向,确保技术能够满足广泛的应用场景需求;近期版本不仅保证了核心能力的持续迭代,在多模态方向也有了长足的进步和成果,例如图文识别大模型、语音大模型的推出,同时在垂直领域精细化提升,进一步探索大模型的技术边界。


讯飞星火大模型发展历程


这些不断迭代的过程,构建起了科大讯飞在大模型技术上的领先优势,使其在商业化应用元年中抢占了先机。

顶天立地,布局体系

多年来,科大讯飞在推动人工智能技术的自主研发与产业化应用方面积累了深厚的技术基础,公司始终专注于将技术前沿的进展与产业需求相结合。随着大模型技术逐渐成为AI发展的关键之一,公司意识到,要在这一领域保持技术领先地位并实现广泛的市场应用,必须采取更加系统化的策略。

科大讯飞一直坚持“顶天立地”的发展策略。董事长刘庆峰表示,这一策略强调技术创新和应用落地的双重推进,旨在平衡前沿技术研发与实际产业需求的结合。所谓“顶天”,指的是公司始终保持在核心技术上的研发投入,以确保其在人工智能领域的持续领先地位;而“立地”则是指将这些技术应用到产业场景中形成规模化推广。

在这一策略的指引下,科大讯飞不仅致力于技术研发,还注重将解决方案精准落地,以应对各行业的实际需求。为实现广泛的产业覆盖,在大模型方面,公司采用了“1+N”的布局,即以一个通用底座大模型为基础,在教育、医疗、金融、汽车等领域应用落地。这样“1+N”的模式能够更精准地满足各行业的特定需求,并将细分领域的数据反馈到通用底座大模型中,推动其持续优化和迭代。

这种双向互动机制确保了技术与应用的相互促进,不仅使科大讯飞能够迅速响应市场需求,还在政府(G端)、企业(B端)和消费者(C端)市场中全面推广大模型应用。

2


助力G端数字化转型

在数字化转型的浪潮中,科大讯飞凭借其深厚的技术积累与创新精神,成为了推动G端数字化转型的重要力量。不同于单纯的技术堆砌或产品堆砌,科大讯飞始终围绕G端用户的实际需求,以人工智能技术为核心,不断深耕细作,打造了一系列高效、智能的解决方案。

天然G端基因

《中国大模型中标项目监测报告(2024年8月)》数据显示,公开渠道统计到的大模型相关中标项目127个。其中,科大讯飞中标金额破亿,一举超过百度、阿里云、华为等公司,成为行业第一。

国产大模型头部玩家角逐激烈,为何各大国企和政府机构频频选择科大讯飞来赋能自身业务?首先,在OpenAI停止向中国开发API等政策下,不被“卡脖子”的中国技术底座是国家战略所需。讯飞星火作为国内唯一基于全国产算力平台训练的大模型,完全自主可控,能够极大程度保障国家教育的安全性与独立性。其次,具备国有投资背景的科大讯飞天然地拥有G端基因,在之前长期的合作中也深刻地理解了这些企业的需求,尤其是对于大模型在具体实践中的应用保障能力。

智慧教育的“排头兵”

近年来,随着国家“双减”政策的深入贯彻,教育行业对于减轻学生学业压力、提升教学质量的需求愈发强烈。学校和教师正面临着一个双重挑战:既要确保教学效果不打折扣,又要有效削减重复性劳动。这一现状极大地加速了教育领域对智能化解决方案的渴求。

科大讯飞作为智慧教育领域的“排头兵”,其领先地位并非偶然所得,更非仅仅是对政策风向的盲目追随。实际上,早在“双减”政策实施之前,科大讯飞就已经在G端教育场景中深耕多年,积累了丰富的实践经验。早在2019年,公司就大力推进智慧教育的区域化应用,先后在安徽蚌埠、山东青岛、湖北武汉等近70个地市、区(县)实现因材施教综合解决方案的落地,形成了规模化的应用成果。


科大讯飞AI+教育的深耕历史


凭借这种先发优势,科大讯飞迅速响应市场需求,利用讯飞星火大模型提供了一系列覆盖广泛、深入教育各个环节的智能教育解决方案,推动行业的数字化转型。

教学、学习、管理齐头并进

科大讯飞的智能教育策略不仅局限于单一产品或功能的推出,而是围绕教学效率提升、个性化学习支持和教育管理优化等关键场景,构建了一整套多层次的解决方案。

在教学效率提升方面,科大讯飞致力于为教师减负,智能批改和自动评分等功能显著降低了教师的重复性劳动负担,让教师可以将更多精力投入到个性化教学和学生辅导上。同时,通过大数据分析将高水平教师的经验固化为智能评价模型,辅助教师更好地进行课堂管理和教学决策,从而提升整体教学效果。

在个性化学习方面,科大讯飞依托人工智能、大数据等技术采集并分析学生的学习情况和历史数据,在多个场景提供支持。课前,系统可以为学生生成个性化的预习建议;课后,AI会自动批改作业并生成知识图谱,为学生推荐个性化的学习资源。这种全流程支持不仅优化了学生的学习体验,还帮助学生更高效地掌握知识,实现真正的全面发展。

除了教学和学习的智能化,科大讯飞的解决方案还在教育管理领域展现出重要价值。通过对教学数据的多维度分析,科大讯飞的系统为教育管理者提供了数据驱动的决策支持,帮助学校和教育管理部门优化资源配置、提升管理效率。例如,已经有多个地区采用科大讯飞的智慧教育平台来分配教学资源、提升教学质量和简化学校管理流程。

初见成效

如今,科大讯飞的智能教育方案已经在全国38000多所学校中深度应用,覆盖了从基础教育到高等教育的多个场景。2024年上半年,公司在教育业务上取得了30.12亿元的收入,同比增长24.41%。这些成绩不仅反映了市场对智能教育解决方案的高度认可,也显示出科大讯飞在推动G端数字化转型中的显著成效。

随着市场竞争日益加剧,科大讯飞如何继续保持技术和市场优势将是关键考验。同时,如何在技术辅助教学中找到平衡,使AI真正减轻教师负担而非增加复杂性,也将是未来需要持续关注的问题。

3


B端突围,寻找增长机会

科大讯飞在保持G、B、C端协同发展的基础上,B端市场逐渐成为公司未来增长的关键领域。借助大模型技术的创新应用,公司在B端业务中不断拓展新场景与新需求,为行业客户提供更具竞争力的智能解决方案,进一步巩固其市场地位,并为业务持续增长注入新的动力。

洞察机会,发挥语音优势

B端市场蕴含的巨大商业潜力和产业升级的需求使得大模型的B端业务已经成为企业争相布局的重要战场。以“内卷”著名的汽车行业为例,百度和阿里凭借用户数据的积累和算法优化,在推动大模型落地智能驾驶方面占据优势;腾讯和字节跳动则依托内容生态和数据处理能力,为车载系统提供更加全面的服务和解决方案。科大讯飞则依托其在语音识别和自然语言处理领域的深厚技术积累,使其在车内智能语音助手和多模态交互中具备独特优势。科大讯飞通过“语音”这一核心技术线索,挖掘汽车领域中与语音相关需求,将大模型赋能的优势渗透到了智能座舱、音效系统和辅助驾驶等关键场景。

语音驱动,重新定义智能座舱

科大讯飞董事长刘庆峰在谈到科大讯飞的车内交互策略时表示,科大讯飞始终注重语音技术在复杂场景中的深层次应用,并将语音理解与多模态交互相结合,以提升人机交互的自然度和智能化水平。这一策略不仅是简单的技术堆叠,而是基于对车内交互场景的深入理解,将语音作为核心驱动,推动智能座舱从“工具型功能”向“体验型服务”转变。

传统语音车控高度依赖车载系统的预设指令,即车主只有正确说出指定的指令,才能开启对应的功能。这种机械式的人机交互,常常以进入车机的“知识盲区”而告终。星火大模型的上车破解了这一困局:无须依赖特定指令,大模型的自然语言理解能力能够解析用户的表达,理解用户的意图;结合其复杂任务处理能力,调取相应功能应用来实现用户需求。比如,“车里有点闷”“放点儿摇滚乐”“讲个小红帽与大灰狼的故事”……车主想到什么就说什么,车机不仅能听懂,还能做得好。

智能座舱作为一个高度自动化和信息化的环境,存在大量可挖掘利用的数据信息和服务场景。大模型的深度多模态交互能力能够充分利用这座“富矿”:除了“听懂”语音,大模型还能够通过车载摄像头“看到”用户的动作行为与周遭环境,通过传感器“感受”到车速或是天气温度,甚至还能“触摸”到用户的身体坐姿。再结合大模型联系上下文、打通内外部信源的理解处理能力,就像是随车配置了一位“双商在线”的智能助手:倾听了解驾乘人员的需求,回答解决各类复杂问题,极大地提升了驾驶的沉浸式体验。尤其是在“内卷”加剧的背景下,市场上的车企都在追求个性化和差异化的智能体验。

科大讯飞通过开放的系统架构,不仅为车企提供了灵活定制座舱的可能性,也借此构建起了一个能够持续迭代的开放生态。这种生态使得科大讯飞在B端竞争中更具弹性和应变能力,能够迅速适应客户需求的变化,帮助车企打造差异化的品牌特色。


星火汽车智能舱座升级


声音体验的智能化进阶

随着汽车的新能源化与智能化发展,车载音响也迎来了技术的全面突破。传统音响专注于材质工艺与人工调教,近乎发展成为了“品牌玄学”。而以科大讯飞为代表的全新一代智能车载音效系统,基于高性能算力平台,配合大模型与全栈自研音效算法,突破车内空间限制,重建宏大声场;全音域优化覆盖,使得高音悠远、中音清晰、低音有力,还原器乐人声本真,让声音充满生命力;结合AI自适应频段补偿,在各种环境下,保持三频听感始终如一,带来更适应人耳特性的车内声音体验。以高性价比产品创造媲美过去百万豪车级别的听感体验,实现“好声音”的普惠平权。

更值得关注的是,科大讯飞的智能音效系统,不仅仅是围绕听感优化,而是将声音作为用户体验的核心触点,将其嵌入到更广泛的车内交互体系中。这意味着音效系统不仅仅是娱乐功能的一部分,而是与智能座舱、辅助驾驶等多个系统无缝集成。通过多模态数据的融合,声音可以与视觉、触觉等感知途径联动,实现更高层次的情境感知。例如,在全家出行途中,音响可以为前排用户播放导航与音乐,同时为后排儿童老人通过降噪创造静谧的休憩空间。也能够在辅助驾驶或泊车过程中,通过实时方向声音渲染,模拟周边声音轨迹,帮助用户“听见”四周环境。在闲暇之余,还能随时化身KTV,无须麦克风就能畅享百万调音欢唱体验。

4


C端:个性化体验的全面进化

虽然科大讯飞一直以来在G、B端主阵地发力,但C端市场的广阔前景促使公司将目光转向这一领域。随着消费者对智能硬件和个性化AI服务的需求快速增长,C端业务在公司收入中的占比显著提升,增速甚至超过了B端。通过发力C端,科大讯飞希望快速积累用户基础,提升品牌影响力,并构建一个多场景、多维度的智能生态系统,为未来的市场布局奠定更坚实的基础。

升级生成式AI,向智能体转型

在生成式AI爆发浪潮下,科大讯飞也推出了讯飞星火App/客户端,形成一批稳定的忠诚用户。然而,市场上充斥着大量成熟的公司和应用,从文字创作到图像生成,各类生成式AI工具层出不穷。无论是国际巨头ChatGPT,还是国内的文心一言、豆包、Kimi等应用,都在各自的细分领域取得了显著的市场份额,使得科大讯飞面临严峻挑战。行业内的产品同质化现象也日益严重,各家公司都在加速迭代和拓展应用场景,争取用户流量和市场份额。


星火智能体应用合集


对此,科大讯飞在生成式AI领域的差异化路径可以归结为其“智能体”战略。这不仅是其技术的迭代升级,更是一种突破同质化竞争的新思路。与传统生成式AI应用(如文本生成、图像生成等)相比,智能体的优势在于深入各种场景,提供多样化的解决方案。科大讯飞的智能体战略体现了其对行业需求的深刻洞察,即各行各业在数字化转型过程中需要的不仅仅是单一的生成能力,而是整合AI能力的复杂任务执行和智能决策支持。

科大讯飞将“场景化智能”作为智能体的核心特色,以更好地服务特定领域的用户需求。例如,在医疗领域的“讯飞晓医”应用,能够为个人用户提供疾病咨询、用药建议和健康管理等功能。这些服务不仅仅是简单的AI生成内容,而是结合用户的个性化健康数据,实现更加深入和有针对性的智能辅助。

软硬结合,赋能智能化生活

科大讯飞通过搭载大模型的硬件设备,正在进一步推动生成式AI的个性化体验进入一个新的发展阶段。科大讯飞不仅仅将大模型应用于软件服务,还将其能力延伸至硬件设备,使其成为日常学习和办公的智能助手。软硬件一体化的战略使得讯飞星火平台不再仅仅依赖传统的应用程序,而是通过各种智能设备,深入用户的生活和工作场景,实现更全面的C端个性化体验。


讯飞智能硬件全家桶


在教育领域,AI学习机为学生提供精准的学情分析和个性化辅导,有效提升学习效率和体验,做到因材施教;办公方面,讯飞星火办公本整合了语音识别、自动化任务处理等功能,帮助用户在复杂场景中快速生成个性化的文档和报告。

据统计,2023年科大讯飞智能硬件业务营收达到16.18亿元,同比增长22.35%,其中智能办公本、学习机等设备的销售额在多个电商平台表现突出。这些可观的数据再次印证了科大讯飞在C端市场的增长潜力和用户需求的旺盛。未来,面对快速变化的C端市场,科大讯飞仍需保持敏锐的洞察力,不断优化产品与服务。

5


结语

在过去的一年里,科大讯飞在大模型的快速迭代和多场景应用中取得了显著成果,引发了行业的广泛关注。尽管行业发展速度有所放缓,但公司始终聚焦于技术与实际应用的双轮驱动,持续推动技术创新和功能演进,在G、B、C端全面展现大模型的应用潜力。随着模型能力的不断提升,科大讯飞正通过探索多元产业的智能化应用,为未来的商业化发展开拓更广阔的空间。

在AI商业化应用的赛道上,没有平坦的捷径可言,唯有持续创新与深度布局,才能引领市场的未来。但面对不同领域复杂的应用需求、市场竞争加剧以及技术落地等挑战,科大讯飞仍需迎难而上,稳步前行。星火大模型的下一步探索注定充满未知,但也蕴藏着无限的可能。


更多深度好文


点击下方文章标题,立即阅读最新行业热点、业界趋势

视点 | 大模型之三观

视点 | 中国式大模型,产业实用主义

案例 | 华为云盘古大模型:走难而正确的道路

案例 | 百度生成式AI:头雁早飞鸣秋丰



购买最新杂志


长按下方卡片识别二维码,购买最新杂志



关于我们


本文编辑:王佳梁

本微信号由中国传媒大学广告学院《媒介》杂志独家运营

版权所有,违者必究


点击下方卡片,关注公众号,第一时间获得最新深度资讯

媒介杂志
整合传播传统及新媒介资讯,分析行业热点事件,探索业界趋势
 最新文章