今年的 1024,上午 10 时。
科大讯飞带着星火的全新升级登场了。
亮点一:AI 变得更具情感,数字人有了更进一步的应用
数字人方向,讯飞提出了新的解决方案,「小星畅聊」。
小星畅聊把 AI 视频通话+虚拟人交互+多模态交互融为一体,让 AI 变得更具人类情感了。
在科大讯飞研究院院长刘聪的演示中,它具备根据语音节奏以及语义自动生成表情与动作的能力,同时支持音视频输入,成功实现了文本、语音和表情的跨模态语义一致性。
不管是科普面霜,推荐酒水礼物,亦或者是看图讲故事,都很顺利的完成了,甚至带起了货。
亮点二:AI 搜索,提供更加全面且个性化的答案
数字人的基座能力就建立在星火的 AI 搜索功能之上,从文本交互到语音交互再拓展到音视频流所完成的实时多模交互。
先来体验一下深度搜索,让星火给我答疑解惑。
可以看到,讯飞的 AI 搜索整合了 45 个在线资料,会先针对性的回复我的关键疑问,后续在进行衍生拓展,连最新的「停播和复播」事件都有提到。
亮点三:讯飞星火 4.0 Turbo 上线
最后我们来聊聊新模型升级版「讯飞星火 4.0 Turbo」。
今年的发布会上,科大讯飞董事长刘庆峰着重强调了数学能力与代码能力。就数学能力而言,依据实用数学任务构建的测试集 CAppliedMath - 1.0 进行测试,讯飞星火 4.0 Turbo 在计算、财务、金融、度量等多个维度的任务表现中,均超越了 GPT - 4o 的水平。
同时,刘庆峰也透露,4.0 Turbo 版本已成功完成超长思维链、树搜索以及自我反思评价等算法的验证。预计在今年年底能够实现类 OpenAI o1 的高难度数学能力。
而在代码能力方面,通过代码生成 HumanEval 测试集上的效果对比发现,讯飞星火 4.0 Turbo 在 Python、Java、JavaScript 等任务上与 GPT - 4o 的差距甚微,在 C++ 能力方面更是超过了 GPT - 4o。与此同时,他们还推出代码 7B 版本,支持代码生成、代码补全等任务。
亮点四:首次发布多语言大模型,覆盖多国语言和 202 个方言
语音识别首次实现全国地级市方言全覆盖,覆盖了 288 个地市的 202 种方言。
亮点五:API 再降价,使用大模型的成本大大降低
面向开发者,讯飞星火 API 矩阵进一步扩大,让使用大模型的成本进一步降低,主力版本每 1M Tokens 低至 5 元。
同时将新上线70B新版本(V4.5)、评语大模型、日语大模型、可定制API、知识增强API等产品。
写在最后:今天 AI 应用正进入到场景化的深水区
整场发布会,让我们看到了讯飞的思考。
今天,AI 应用正进入到场景化的深水区。
诚然,国内先好好追追多模态和 Dalle 3 比较务实。
但是不可否认的是,大模型也正迎来规模化应用的时代。
教育、医疗,讯飞无不在这些民生之本上下功夫,确实是看到了中国人工智能国家队的社会责任感。
今年讯飞的关键词,也是想给大家传递的:顶天立地、自主可控、通专结合、端云联动、软硬一体。
深深看出科大讯飞成立25年来的初心、匠心、开放和创新。
解放生产力、释放想象力,不再是梦。