2023,大模型从想象力进阶到生产力。
作者 | 蜜桃君 编辑 | 杨 武
出品 | 互联网那些事
投稿微信 | ttsuper008
评选2023最热的行业词,“大模型”一定榜上有名。
ChatGPT带来的裂变式效果,让AI行业再次迎来春天。现在关于国外大模型热度虽稍有下滑,但国内大厂却没有停下前进的步伐,“千模大战”已不再是一种修辞手法,而是客观现实。
但现在
风向变了
。
ChatGPT成为互联网史上最快突破1亿用户的产品后,用户只减不增负增长,于是有人开始担忧AI就像去年的“元宇宙”,如烟花般绚烂的绽放,但只有一瞬。
担心并不多余,因为很多大模型的概念并不接地气,声情并茂的描绘完激动人心的效果图后,却并不回答解决方案,尽管诗词歌赋、聊天作画信手拈来,但具体到“有什么用”问题上,大多是避而不谈。
大模型需要务实,技术的想象力如何转为生产力?大模型的下半场该怎么走?科大讯飞1024开发者节重磅发布讯飞星火认知大模型V3.0,似乎给出了答案。
讯飞星火又双叒迭代
不得不说,大模型行业太卷。
今年5月6日讯飞星火首次发布的时候,科大讯飞董事长刘庆峰就定了“小目标”,10月24 日,星火认知大模型的能力要全面对标 ChatGPT。
那现在目标实现了吗?
发布至今,讯飞星火已经完成三次升级,特别是8月15日第二次升级后,来自于新华社以及麻省理工科技商业评论的评测,讯飞星火评测总分排名第一,被冠以
“中国最聪明的大模型”
的超高评价。
但讯飞星火的进阶似乎没有止尽,这一次更是继续从
文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力
以及
多模态能力
7个方面继续迭代。
“数学能力”上自动提炼规律能力的提高3%。
其实,数学能力是星火的“看家本领”,早在第一次发布时就已领先ChatGPT。这一次星火V3.0的进阶,再一次在“长板”取得进步,难能可贵。
这考验的是AI能自己发现规律,然后来解决出现的新的问题。AI对于数字、符号和空间信息方面的能力提升,能更广泛的应用于解决现实世界的任何问题。
“数学能力的一小步,AI产业的一大步”。
“代码能力”提升9%成功超越ChatGPT。
数字经济下,各行各业的发展都离不开代码能力的支持,大模型赋能代码的意义比我们想象的还要大。
星火大模型在Python、Java、JS、C++等编程语言,以及代码补全、代码解释、测试检错、编程问答等方面,已成功超越ChatGPT,还将这一能力集成为智能编程助手iFlyCode。
升级版的iFlyCode2.0在编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%,提升了软件从业人员效率。
当你跟它提出“画一个五颜六色的心形”的无理要求后,大模型会通过代码迅速的给你描绘一个“大心套小心”的图形。
人类需要做的仅仅是选择“接受”还是“再来一次”。
“多模态能力”提升7%,细节表达越来越好。
多模态能力的背后是图、文、音全场景的AI应用,我们要实现AI版的视频配音、语音播报、标题摘要、海报创作等更多元场景的应用,就需要大模型的多模态能力。
这次讯飞星火的多模态能力升级后,在指令跟随上我们有了明显的提升。
比如我们要求它画一个武侠风小猫,可能原本就画一只猫,但它现在理解了武侠风,对指令的理解和跟随更强,就画出了一只“事了拂衣去,深藏功与名”的大侠猫。
不仅是这些,讯飞星火这次在文本生成、语言理解、知识问答、逻辑推理等方面分别提升了7%、6%、7%、8%。
1024发布会上刘庆峰也正式宣告:
星火 V3.0 已实现全方位超越 ChatGPT,在中文上实现全面超越,在英文上实现对标。
作为国内目前最好的大模型,讯飞星火的“小目标”实现了!
AI大模型是昙花一现的短暂繁华?还是会“代代”相传的生活方式?取决于它的落地应用。
纸上谈兵总觉浅,绝知此事要躬行,AI大模型的未来落地会怎么样呢?
10月17日,Gartner发布2024年企业机构需要探索的十大战略技术趋势,其中有7个跟AI有关,特别提出2026年将有超过80%的企业使用生成式AI,而现在这个数字只有5%。
生成式AI应用可以让企业用户访问并使用大量内部和外部信息源,这意味着生成式AI的快速采用,将极大地促进企业知识和技能的全民化,也会有更多的基于大模型的应用落地而生。
大模型在提升效率上早就“小露身手”了。
我们把一个在原来Windows平台上的20万行的C++代码移植到 LINUX平台上,原本要
3个月的工作量
,
在iFlyCode代码平台只要1个月就完成了。
普通人对大模型的时代感知会越来越明显。
1024开发者节上讯飞星火医疗大模型首次发布,同时发布的还有大模型加持下的
“讯飞晓医”
APP及小程序。
健康问题每个人都会遇到,但并非每个人都有医学常识。
“身体不舒服不知道具体问题是什么?”“去药店买药不知道有什么禁忌?”“拿到检查报告哪些指标需要关注?”
这些很普遍,但一直没有很好的解决方案,现在“讯飞晓医”成了每个人的私人医生。
可以把检查报告给它分析。
也可以针对日常“小毛病”随时提问。
星火医疗大模型的六大核心能力全面超越GPT-4,AI医疗的普惠之光开始照进每个家庭。
心理健康也同样被AI 关注。
世卫组织调查数据显示:我国约有2亿到3亿人存在心理健康问题,但大多数人并没有正确的途径去处理自己的心理问题。这个问题,在青少年阶段更加值得重视。
基于星火大模型的
AI心理伙伴,
通过多模态情感识别、共情表达、寻因式提问、个性化心理指导,实现心理问题的从筛查到干预,降低心理问题发生率。
关注心理问题,也关注虚拟陪伴。
AI已经向人设进化,拥有虚拟人格的
“星火友伴”
已上线。大模型有了自己的“灵魂”,不再是千篇一律的统一人设。
它可以是有帝王之才的“秦始皇”,分析起行驶来纵横捭阖。
也可以是诗仙李白,字里行间都是信手拈来的诗意。
它可以根据性格模拟、情绪理解、表达风格来形成一个初始人设,再结合特定知识学习、对话记忆学习,形成一个更个性化的AI人设,无论是才情并重的林黛玉、热血直率的樱木花道,还是活泼开朗的居委会马大姐……只要定义“人格”就能和他们对话。
这不只是聊天,还可以释放灵感!
这项功能的应用价值何在?事实上,只有具备人设和记忆功能,大模型才能成为每个人的AI助手。
AI给予我们的远不止这些。
2022年初,科大讯飞推出
“讯飞超脑2030计划”,
要让懂知识、善学习、能进化的软硬一体机器人走进千家万户。
去年1024全球开发者节上,机器人超脑平台AIBOT发布,为工业、教育、服务等行业赋能。今年,机器人更聪明了,人形机器人在复杂任务的拆解、开放场景的物体寻找、强化学习泛化抓取、仿人行走的复杂地形运动能力上都有了明显提升。
为了加速大模型行业落地,科大讯飞还联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律等行业,加速产业升级。
IDC预测,全球生成式AI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元。细分到中国市场,IDC预计中国AI市场规模在2023年将超过147亿美元,到2026年这一规模将超过264亿美元。
作为强β行业,AI产业每一轮技术周期,都会有创业者蜂拥而上,但为什么是科大讯飞成为首屈一指的佼佼者?
首先,科大讯飞的布局更早。
作为国内人工智能领军企业、人工智能第一股,科大讯飞1999年创业起就主要围绕智能语音与人工智能技术进行商业化探索, 2010 年发布以智能语音和人机交互为核心的人工智能开放平台“讯飞开放平台”,将自身 AI 能力向外开放输出。
第二,科大讯飞的布局更纵深。
2015-2018 年期间科大讯飞持续推出覆盖多个行业的智能产品及服务,在智慧教育、智慧医疗、智慧城市、智慧司法、金融科技、智能汽车、运营商、消费者等领域的深度应用,最终升级为 G-B-C 结构的商业模式。
而后开始聚焦智慧办公、个性化学习、智慧政法等核心赛道,推动业务逐渐由项目化向产品化以及运营化转型。
第三,科大讯飞的投入更多。
仅仅在2021年,科大讯飞研发人员就达到8300人。2022年科大讯飞研发投入高达33.6亿元。
科大讯飞在研发方面的投入不仅规模大,而且持续度高。财报显示,2021、2022年科大讯飞研发投入占营业收入比例分别为16.03%和17.83%。
二十年如一日对源头技术创新的热爱与坚守,才使得科大讯飞在大模型领域的技术积累和应用落地方面,取得了显著的成果。
2010年是手机行业巨变的一年,iPhone 4改变了人们对智能手机的一切想象。但它的火爆不是因为45nm制程的A4处理器,而是它可以玩植物大战僵尸和愤怒的小鸟。
同样的,OpenAI和ChatGPT的横空出世,带来了一场AI革命,但随着同质化竞争加剧,以及市面上的开源模型越来越多,大模型到底是泡沫还是未来的生产力,也并不取决于喂了多少数据,升级了多少硬件,而是在于,我们普通人能用大模型做什么。
讯飞星火的接地气,似乎给了我们答案。