今年的1024,一些有趣的AI观察

学术   2024-10-26 23:09   浙江  
 Datawhale报道 
洞察:Datawhale in 1024

今年的 1024,上午 10 时。

科大讯飞带着星火的全新升级登场了。

这次星火的升级主要分为基础能力应用落地
讯飞星火大模型升级到了 4.0 Turbo,同时还首发了 10 项基于讯飞星火底座能力的产品与创新应用。
我们挑几个最惊艳的点来说。

亮点一:AI 变得更具情感,数字人有了更进一步的应用

数字人方向,讯飞提出了新的解决方案,「小星畅聊」

小星畅聊把 AI 视频通话+虚拟人交互+多模态交互融为一体,让 AI 变得更具人类情感了。

在科大讯飞研究院院长刘聪的演示中,它具备根据语音节奏以及语义自动生成表情与动作的能力,同时支持音视频输入,成功实现了文本、语音和表情的跨模态语义一致性。

不管是科普面霜,推荐酒水礼物,亦或者是看图讲故事,都很顺利的完成了,甚至带起了货。

当摄像头转向印有外文的化妆品及酒类产品时,小星还能整合画面中跨语言的产品品牌、功能等信息进行精准回复。

亮点二:AI 搜索,提供更加全面且个性化的答案

说完了数字人,就不得不提到第二个亮点功能是「星火 AI 搜索」

数字人的基座能力就建立在星火的 AI 搜索功能之上,从文本交互到语音交互再拓展到音视频流所完成的实时多模交互。

先来体验一下深度搜索,让星火给我答疑解惑。

可以看到,讯飞的 AI 搜索整合了 45 个在线资料,会先针对性的回复我的关键疑问,后续在进行衍生拓展,连最新的「停播和复播」事件都有提到。

还提供了泉哥的涨粉数据是我没有想到的。

星火 AI 搜索已全面上线 APP、Web 以及 PC 端。首页还有热点新闻版块,能够帮助用户时刻掌握最新信息、资讯。
总结来说,星火的 AI 搜索,能对更多网页进行搜索,提供更加全面且个性化的答案。

亮点三:讯飞星火 4.0 Turbo 上线

最后我们来聊聊新模型升级版「讯飞星火 4.0 Turbo」

在数学能力以及代码能力方面,讯飞星火 4.0 Turbo 已然超越了 GPT - 4o。
这一结论是由艾伦人工智能研究所、OpenAI 等国内外极具权威性的单位发布的。
在涵盖了理解和推理、综合考试、数学和科学、代码等多种不同任务类型的 14 项主流测试集中,讯飞星火 4.0 Turbo 表现出色,在其中 9 项测试集中成功实现超越,其效率相对提升了 50%

今年的发布会上,科大讯飞董事长刘庆峰着重强调了数学能力与代码能力。就数学能力而言,依据实用数学任务构建的测试集 CAppliedMath - 1.0 进行测试,讯飞星火 4.0 Turbo 在计算、财务、金融、度量等多个维度的任务表现中,均超越了 GPT - 4o 的水平。

同时,刘庆峰也透露,4.0 Turbo 版本已成功完成超长思维链、树搜索以及自我反思评价等算法的验证。预计在今年年底能够实现类 OpenAI o1 的高难度数学能力。

而在代码能力方面,通过代码生成 HumanEval 测试集上的效果对比发现,讯飞星火 4.0 Turbo 在 Python、Java、JavaScript 等任务上与 GPT - 4o 的差距甚微,在 C++ 能力方面更是超过了 GPT - 4o。与此同时,他们还推出代码 7B 版本,支持代码生成、代码补全等任务。

亮点四:首次发布多语言大模型,覆盖多国语言和 202 个方言

「语言能力」直是讯飞的强项。
本次发布会还首发了多语言认知大模型,覆盖包括英语、俄语、日语、汉语、法语、西语、葡语、德语等多种语言。
在汽车、家电、办公、翻译等行业的任务场景中,多语言大模型效果超过了 GPT-4o。

语音识别首次实现全国地级市方言全覆盖,覆盖了 288 个地市的 202 种方言。

亮点五:API 再降价,使用大模型的成本大大降低

面向开发者,讯飞星火 API 矩阵进一步扩大,让使用大模型的成本进一步降低,主力版本每 1M Tokens 低至 5 元。

同时将新上线70B新版本(V4.5)、评语大模型、日语大模型、可定制API、知识增强API等产品。

写在最后:今天 AI 应用正进入到场景化的深水区

今年的科大讯飞格外重视大模型应用的落地。
星火杯作为唯一团中央点名支持的大模型应用大赛,有来自全球 533 所高校的 1656 支大学生开发者团队共同参赛。其中,Top 20 里有 8 支队伍来自 Datawhale。

整场发布会,让我们看到了讯飞的思考。

今天,AI 应用正进入到场景化的深水区。

诚然,国内先好好追追多模态和 Dalle 3 比较务实。

但是不可否认的是,大模型也正迎来规模化应用的时代

教育、医疗,讯飞无不在这些民生之本上下功夫,确实是看到了中国人工智能国家队的社会责任感。

今年讯飞的关键词,也是想给大家传递的:顶天立地、自主可控、通专结合、端云联动、软硬一体。

深深看出科大讯飞成立25年来的初心、匠心、开放和创新。

解放生产力、释放想象力,不再是梦。

一起“三连

Datawhale
一个专注于AI领域的开源组织,汇聚了众多优秀学习者,使命-for the learner,和学习者一起成长。
 最新文章