讯飞星火4.0Turbo升级,做“最懂行业的大模型”

时事   2025-01-22 13:41   北京  


1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。
本次讯飞星火4.0 Turbo的升级结合了来自不同行业龙头企业的落地诉求、C端2亿多用户的真实反馈,致力让大模型能够支撑更长的文本、理解更复杂的图文、减少幻觉,同时让大模型在行业的理解能力上有更大的提升。


七大核心能力全面提升

底层模型的能力高度决定了应用层的发展上限,这一过程离不开充足算力的有力支撑。然而,当前算力不足已成为多数公司在大模型领域发展的主要瓶颈之一。

在大模型领域,为实现完全的国产化,科大讯飞与华为决定携手自研算力底座,并于2023年10月24日,联合发布了国内首个全国产算力平台“飞星一号”,常态化支持万亿参数的大模型训练,为后续技术迭代筑牢根基。
2024年10月24日,基于“飞星一号”平台,经过数次迭代升级,讯飞星火大模型升级为4.0 Turbo版本。根据真实数据背靠背的测试,其七项核心能力在中文领域全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o。与此同时,科大讯飞与华为、合肥市大数据资产运营有限公司联合打造的国产超大规模智算平台“飞星二号”,将实现新模型新算法的持续适配和智算集群规模的再次跃迁。
在由艾伦人工智能研究所、OpenAI等国内外权威机构发布的14项主流测试集中,涵盖了理解与推理、综合考试、数学与科学、代码编程等多种任务类型。讯飞星火4.0 Turbo在其中9项测试集中超越了美国三大主流模型(GPT-4o、Claude 3.5 Sonnet、Gemini 1.5pro),整体效率提升了50%。

在2024年6月讯飞星火的升级发布会上,科大讯飞董事长刘庆峰就曾强调:“中国通用人工智能的发展,离不开强大的大模型底座能力。国家必须拥有自主可控的通用大模型底座,这是决定我国在本轮通用人工智能竞赛中能走多远的关键因素。”
此次发布会,讯飞星火4.0 Turbo底座能力实现了全新升级,七大核心能力全面提升,全面对标OpenAI最新版的GPT-4o。本次升级的一大突出亮点在于,针对行业与企业在实际应用中面临的痛点问题,在数学能力、行业知识、图文识别、长文本能力等能力上实现了提升。
大模型的不断进阶催生出一系列精细化、场景化的小应用。数学能力一直是讯飞星火的强项,此次基于讯飞星火X1的高质量合成数据,讯飞星火4.0 Turbo可以在数学教学、金融分析和科研推演等工作中更好的帮助用户。
图文识别能力直接关乎着企业能否高效地采编和利用行业、私域数据,是大模型“学习”的基础。在各行各业的实际工作中,经常面临图文识别的“疑难杂症”:如医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况,讯飞星火4.0 Turbo图文识别能力升级,使得通用文档版面分析、文字识别的准确率相对提升了40%,复杂表格结构、潦草手写文字等方面的错误率下降了40%,可以解决上述难题、大幅提升高价值数据的获取能力。
此次升级还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉,同时发布了扫描文档解析的极速版本,文档理解速度提升了10倍以上。对于一份500页的项目文件,从扫描、识别到解析的全过程,仅需2分钟即可全部完成。
值得注意的是,本次发布会上,讯飞星火行业首发了混域知识搜索技术。该技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,单次提问即可获得综合搜索后的结果,大大提升信息搜索效率。


“通专结合”合力打造央国企解决方案

大模型底座能力正以前所未有的深度和广度,全方位推动各行业的变革与发展。

2024年11月28日,由中国石油、中国移动、华为、科大讯飞共建的昆仑大模型又有突破:700亿参数昆仑大模型建设成果发布会在北京举办。继2024年5月28日启动建设、8月28日发布330亿参数大模型阶段性成果后,昆仑大模型本次升级发布除尺寸参数大增外,还带来了43个石油行业的专业应用和通用应用创新场景。据悉,昆仑大模型已于2024年8月23日通过了国家生成式人工智能服务备案,是中国能源化工行业首个通过备案的大模型。
2024年10月,中国海油携手科大讯飞、中国电信打造的“海能”人工智能模型正式发布,同时推出具有海油特色的5个专业场景模型和6个通用场景模型。在讯飞星火大模型底座和一系列“AI助手”应用的加持下,一个个人工智能模型应运而生,化身“AI行业专家”和“AI专属助理”。
2024年9月22日,中国绿发和科大讯飞共同发布更懂绿色产业的泰山大模型。基于泰山大模型,致力于打造在央国企具有引领意义的首个央企AI总部。在泰山大模型的赋能下,面向绿发的统一知识门户,为每位绿发员工配备一位专属AI助手,“即插即用”的智能体平台可以让员工根据实际需求创建属于自己的专属智能体,覆盖的办公场景更加广泛。
2024年8月,科大讯飞中标了华润大模型服务框架和华润数科私域大模型合作伙伴项目。在华润数科与科大讯飞的全力合作下,2024年8月30日,华润数科私域大模型及其平台正式上线,形成“云+大模型”的智能底座,讯飞星火大模型未来将深度赋能华润集团的数智化转型。
根据第三方数据显示,在2024年,无论是大模型招投标的全年总盘还是在央国企领域,科大讯飞的中标数量和中标金额均居第一,成为2024年度大模型中标项目的“标王”。具体而言,在科大讯飞的中标项目中,涵盖了通信、金融、能源、教科、政务、医疗等多个行业,主要以央国企客户为主。
科大讯飞方面表示,大模型商业化落地这场仗,不仅考验算力,还有对算法的透彻理解、算力和数据的平衡等要素,在许多专业领域中,高质量的数据可能比算力更重要。
在“通用大模型+专业大模型”合力打造央国企解决方案的探索上,科大讯飞如今已摸索出一条成本低、效率高的商业化落地路径。相较于单纯依赖一个超大规模的万亿级大模型,“通专结合”模式能够充分融合1个通用大模型的强大语义理解能力,同时灵活调用几亿、几十亿乃至几百亿参数规模的大模型,组合完成复杂任务,为央国企及各行业提供高性价比的定制化解决方案。
科大讯飞方面表示,预计未来几年,科大讯飞将持续探索AGI(通用人工智能)过程中各个阶段的大模型成果,并通过蒸馏、裁剪等各种技术手段沿途产出,落地到讯飞星火各个尺寸的大模型中,助力讯飞星火在商业化竞争的过程中不断提升市场竞争力。

综合能力提升率超过10%

赛迪顾问研究数据显示,截至2024年11月30日,中国数字经济核心产业企业总量已达到457.41万家,与2023年底相比实现了17.99%的显著增长。随着数实融合深入推进,企业数字化转型成为推动数字经济发展的重要力量。
日前召开的全国数据工作会议将“着力推动数字经济和数字社会高质量发展”列入2025年数据九大工作之一,并表示要深入实施数字化转型工程,推动构建数字产业集群梯次布局体系,推动数实深度融合。
如何更高效助力企业实现数字化升级?科大讯飞方面表示,企业可以选择“建算力、理数据、训模型、落场景、保安全、精运营”的全套解决方案私有化部署;也可以应用星火智能体平台、星火飞码iFlyCode、星火智算平台等多项工具,以零代码、低代码的方式完成场景应用开发,定制专属大模型助理。
截至2024年12月,科大讯飞已经与中石油、中海油、国家能源、华润、绿发等央国企及20多个行业的头部企业一起发布行业大模型,覆盖300多个应用场景。
在发布会上,科大讯飞相关负责人指出,基于“技术+应用”的不断正向循环,讯飞星火4.0 Turbo的行业能力全面提升,金融、油气、能源、电力、钢铁、航空等领域综合能力提升超过10%,成为“最懂行业的大模型”。
杜壮

END



来源:中国发展改革报社

责编/制作:张晶

审核:袁琳

政审:蔡若愚

终审:李杨


中国发展改革
中国发展改革报社官方公众号,宣传报道国家发展改革重大工作部署,及时、全面发布经济社会发展动向和重大改革创新举措。
 最新文章