大超越GPT-4,讯飞星火4.0 Turbo发布,首发11项技术及应用

科技   2024-10-24 23:03   江苏  

10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕,科大讯飞董事长刘庆峰发布讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中实现了9项第一。与此同时,国产超大规模智算平台“飞星二号”正式启动。



1024期间,科大讯飞还首发了10项基于讯飞星火底座能力的产品与创新应用:定义多模AIUI标准,发布超拟人数字人;发布星火多语言大模型、讯飞星火医学影像大模型、汽车端侧星火大模型;发布首个基于“问题链”的高中数学智能教师系统、星火智慧黑板2.0、AI作业过滤器;发布星火智办一体机、智能座舱人机交互效果评测机器人VIAS以及科大讯飞多语种AI翻译透明屏。



讯飞星火4.0 Turbo:
国际14项主流测试集9项第一,提效50%

讯飞星火大模型4.0 Turbo正式发布,在数学能力、代码能力上超过了GPT-4o。由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0 Turbo在其中9项测试集中实现超越,效率相对提升50%。



发布会上,刘庆峰特别提到了“硬碰硬”的数学能力和代码能力。

根据实用数学任务构建测试集CAppliedMath-1.0,讯飞星火4.0 Turbo在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类OpenAI o1的高难度数学能力显著提升。

根据代码生成HumanEval测试集上的效果对比,讯飞星火4.0 Turbo在Python、Java、JavaScript等任务上和GPT-4o差距微弱,在C++能力上超过GPT-4o。在真实应用场景中,基于认知智能全国重点实验室构建的iFLYCode-Eval-2.0代码实用场景测试集,讯飞星火4.0 Turbo在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。

定义多模AIUI标准
首发语音视觉虚拟人交互“三合一”

发布会上,科大讯飞重新定义万物智联时代的多模AIUI交互标准,在原有的远场高噪、全双工、多语种多方言能力基础上,升级了多模态能力,新增了超拟人和个性化能力。



超拟人数字人首次亮相,多模态的交互从语音交互拓展到音视频流的实时多模交互。



科大讯飞研究院院长刘聪现场和超拟人数字人玩了个“角色扮演”游戏,无论是扮演孙悟空还是小猪佩奇,超拟人数字人都游刃有余,回答得惟妙惟肖。

多模态视觉能力加持下的人机交互有多惊喜?刘聪现场给超拟人数字人打了个“视频电话”,他不断调整道具“孙悟空”“奥特曼”“怪兽”的摆放位置,超拟人虚拟人就能“看图说话”,根据道具不同的摆设动作声情并茂讲述丰富的故事情节,和刘聪进行生动有趣的多轮畅聊。



刘聪还演示了更实用的旅游购物场景,当摄像头转向印有外文的化妆品及酒类产品时,超拟人数字人能基于画面中产品的品牌、功能等信息“秒回”各种需求,瞬间变身成“跨语言”购物的好帮手。

“目前,讯飞星火支持用户创建自己的个性化数字人,打造每个人的数字分身。”刘聪现场演示了一个自己的“数字分身”,只需在后台进行简单编辑、定义,就可以快速生成自己的卡通形象,更能一句话复刻自己的声音作为发音人,随时随地与自己对话。目前,该功能已支持1300+种人设打造,已正式开通内测。



硬件产品端,内嵌了星火多模AIUI能力的讯飞AI学习机阅读伙伴即将上线,孩子们“指哪读哪”,书中的文字可以马上“变身”成个性化数字人,跃然纸上,启发孩子思考和提问。

首发星火多语言大模型
为世界提供第二种选择

在语音识别领域,科大讯飞的远场高噪场景语音识别领先优势进一步扩大。2024年9月,科大讯飞在CHiME-8上夺冠,对于这个高噪复杂场景下最难的语音识别任务,科大讯飞已连续五年夺冠。

在多语言能力上,首次实现全国地级市方言全覆盖,含全国288个地市、202种方言,讯飞输入法14.0即将支持202种方言免切换自由说。

在多语种能力上,首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法、西、葡、德等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业任务场景应用效果超过了GPT-4o。

“讯飞作为中国唯一的认知智能全国重点实验室承建单位,我们有使命有责任要做多语言大模型”,刘庆峰表示,讯飞星火底座能力要不断提升,对标全球最好水平,同时还要针对真实应用场景做到全球最好,不断扩大多语种范围,“我们一定要代表中国给世界第二种选择。”

多模态多语言能力升级,将全面赋能汽车产业。发布会上,科大讯飞首发了汽车端侧星火大模型。今年第四季度起,奇瑞、广汽、长城等多款搭载端侧大模型的车型将上市开售。



大模型赋能民生刚需:
发布教育、医疗、司法、政务等领域AI助手

一直以来,科大讯飞致力于用人工智能技术解决社会刚需。本次大会期间,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。 

在教育行业,首次发布基于“问题链”的高中数学智能教师系统。



今年1月份,中国教育科学研究院与科大讯飞、华为开展深度合作,在讯飞星火教育大模型的基础上开展“基于生成式人工智能的中小学智能教师示范研究”。本次发布的高中数学智能教师系统,融合了众多优秀高中数学教师的集体智慧与AI大模型的机器智能,实现“人机共育”。它可以智能生成教学问题链,以循序渐进的方式辅助教师启发学生思考并逐步解决问题。该系统是由中国教科院牵头,北京、上海、重庆、深圳、合肥、成都、大连、广州、哈尔滨等12个区域50多位数学教研员、400多位优秀教师与讯飞星火大模型人机共创的智慧成果。

刘庆峰介绍,搭载了高中数学智能教师系统的星火智慧黑板2.0将于10月25日在第84届教育装备展上正式发布,从AI均衡视听更公平、AI教学工具更高效、AI教师助手更智慧、全国产化算力更安全四个方面,推动黑板从板书工具跃迁为教学AI助手。

此外,讯飞AI学习机中首发AI作业过滤器。学习机通过OCR能力对纸质练习题进行识别,根据学生历史学习情况和本地化考情,将题目分出“必做题”“选做题”“建议不做题”三个等级,为学生做习题时提供“优先级”选项,以实现“练得更少、学得更好”的目标。 



在医疗行业,讯飞星火医疗大模型2.0发布,医疗海量知识问答、医疗复杂语言理解、医疗专业文书生成、医疗诊断治疗推荐、医疗多轮交互、医疗多模态交互等六大医疗核心场景能力重大升级并持续领先。



基于讯飞星火医学影像大模型打造的智能医学影像助手也正式发布。在智能质控环节,智能医学影像助手可帮助影像技师快速评估图像质量,及时纠正检查问题;在智能诊断环节,可以帮助影像医师快速生成诊断报告,解释溯源并多期对比;在智能读片环节,可接入医学影像大模型,通过相关问答,帮助临床医师制定诊疗方案。

会上,讯飞医疗还联合安徽省卫生健康委员会、认知智能全国重点实验室,共同发布了全谱系全模态医学影像大模型开放合作计划,旨在汇聚全球最顶尖的影像AI科研团队,共同推进医学影像大模型的发展。

在司法场景,法律大模型赋能庭审笔录制作、裁判文书编写、法条类案检索等司法场景,和星火通用大模型相比,效率提升从61.7%升到87.9%。

在政务服务场景,政务大模型持续迭代,全面覆盖4500多种标准化事项和60多种材料,老百姓和政务大模型“聊天”就能实现边聊边确认办事意图,审核时间缩短80%,登记效率提升5倍。此外,发布会上首发了搭载政务大模型的“星火智办一体机”,方便群众从“问着办”到“领着办”。



AI赋能企业:
讯飞星火正成为央国企的第一选择

“讯飞星火已成为央国企大模型的第一选择。”刘庆峰晒出了大模型应用成绩单。(中标数据来自智能超参数,根据公开招标信息整理统计。)



截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景。

为了帮助各行各业更好地落地大模型,科大讯飞构建了从“建算力、理数据、训模型”,到“落场景、保安全、精运营”的全套解决方案。“科大讯飞有领先的工具链,可大幅提升‘理数据、训模型’的效率;有覆盖300+行业场景的实际应用案例,已形成相互借鉴和复用的规模化效应;还有全国产化的算力平台”。刘庆峰说。

值得一提的是,越来越多的企业依托讯飞智能体平台,孵化出员工自己的AI助手。比如国能集团举办的“国家能源杯”大赛,共有126个队伍参赛,最终创新孵化了54个场景智能体,打造员工自己的AI助手。会上,科大讯飞也正式邀请全国开发者们参与共创。

AI for Science成为科技发展新引擎
赋能科研是讯飞星火的重要使命

今年的诺贝尔物理学奖、化学奖、经济学奖都颁发给了AI领域的科学家。刘庆峰表示,AI for Science带来科研范式的根本变革,正在成为科技发展的新引擎。

讯飞星火持续为高校提供基础科研提效服务。刘庆峰介绍,星火科研助手自去年底发布以来,已在中科院下属116个院所使用。北京邮电大学EZCoding雏雁/大创团队基于讯飞星火大模型打造的编程教学应用平台“码上”,目前已在全国332所院校开通使用,学生主动提问率增加1倍,教师辅导工作减少80%。

刘庆峰提到,人工智能赋能科研工作的三个台阶:依托科研文献助手和代码助手提升基础工作效率,基于深度神经网络对科学任务进行精准建模,以及借助认知大模型学习领域知识并辅助设计科研实验方案。据悉,科大讯飞已在大模型+科研领域做了许多探索,如联合中国科学技术大学刘海燕教授团队,成功设计了48个自然界不存在的全新蛋白质;联合中科院动物研究所李鑫团队,研究单细胞基因表达课题;联合中科院等离子体物理研究所李建刚院士团队,研究托卡马克等离子体控制。此外,科大讯飞还联合中国科技大学研发“化学大模型”,联合中科院大连化学物理研究所研发“化工大模型”。



“AI for Science决定了中国科技发展的速度,赋能科研是讯飞星火的重要使命”,刘庆峰说。


“飞星二号”平台上线
星火大模型持续引领全国产算力平台发展

2024科大讯飞AI开发者大赛共有来自14个国家、348座城市的35268支团队参赛,其中9372支是大模型团队。2024科大讯飞AI开发者大赛中,科大讯飞联合30所科研院校、44家企业与机构顶尖共创赛题,最终评选出十佳团队。

只有生态的繁荣,才有人工智能的大未来。发布会上,科大讯飞将开放全场景资源,从技术能力到应用落地,用最短路径实现产品成功,线上线下渠道和资源共享,加速开发者迈向市场成功。科大讯飞将牵头成立AI基金,用5亿创业基金推动开发者创业,加速前沿技术产业化进程,并与地方政府联合为AI创业团队提供产业落地支撑。

发布会上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。



去年10月24日,首个国产万卡算力集群“飞星一号”平台上线,星火大模型持续引领全国产算力平台发展,刘庆峰表示,最近一年以来攻克了很多大模型集群训练的“疑难杂症”,解决了500多次基础软硬件问题,模型训练适配优化平台耗时从90天缩减到15天,新增30多项框架和平台特性,优化了150多个基础、通信和融合算子。

“飞星二号”将带来新模型新算法的持续适配和智算集群规模的再次跃迁,持续探索无人区、引领国产大模型底座的发展、给世界提供第二种选择。“只有在真正自主可控的平台上,才有真正的中国人工智能大未来。” 

今天,人工智能应用日益进入到场景化的深水区,面向未来,刘庆峰认为人工智能产业发展的关键是五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。



刘庆峰说:“坚持这五个关键点,我们的人工智能就有大未来,就能真正地解放生产力、释放想象力,改变产业格局和竞争格局,带来科研范式的变化,带来各行各业的变化,最重要的是满足老百姓对美好生活的期望!这就是我们未来的发展方向。”


AI科技之窗
全网最懂AI的科技博主!200万科技爱好者都关注的公众号。全面解读全球AI新闻。未来是人工智能提升生产效率的时代,2024年AI­GC,智能驾驶,量子计算机,万物互联,虚拟现实等等应用爆发的一年,当下正在经历第四次科技革命。
 最新文章