今年的1024，一些有趣的AI观察

学术 2024-10-26 23:09 浙江

Datawhale报道

洞察：Datawhale in 1024

今年的 1024，上午 10 时。

科大讯飞带着星火的全新升级登场了。

这次星火的升级主要分为基础能力和应用落地。

讯飞星火大模型升级到了 4.0 Turbo，同时还首发了 10 项基于讯飞星火底座能力的产品与创新应用。

我们挑几个最惊艳的点来说。

亮点一：AI 变得更具情感，数字人有了更进一步的应用

数字人方向，讯飞提出了新的解决方案，「小星畅聊」。

小星畅聊把 AI 视频通话+虚拟人交互+多模态交互融为一体，让 AI 变得更具人类情感了。

在科大讯飞研究院院长刘聪的演示中，它具备根据语音节奏以及语义自动生成表情与动作的能力，同时支持音视频输入，成功实现了文本、语音和表情的跨模态语义一致性。

不管是科普面霜，推荐酒水礼物，亦或者是看图讲故事，都很顺利的完成了，甚至带起了货。

当摄像头转向印有外文的化妆品及酒类产品时，小星还能整合画面中跨语言的产品品牌、功能等信息进行精准回复。

亮点二：AI 搜索，提供更加全面且个性化的答案

说完了数字人，就不得不提到第二个亮点功能是「星火 AI 搜索」。

数字人的基座能力就建立在星火的 AI 搜索功能之上，从文本交互到语音交互再拓展到音视频流所完成的实时多模交互。

先来体验一下深度搜索，让星火给我答疑解惑。

可以看到，讯飞的 AI 搜索整合了 45 个在线资料，会先针对性的回复我的关键疑问，后续在进行衍生拓展，连最新的「停播和复播」事件都有提到。

还提供了泉哥的涨粉数据是我没有想到的。

星火 AI 搜索已全面上线 APP、Web 以及 PC 端。首页还有热点新闻版块，能够帮助用户时刻掌握最新信息、资讯。

总结来说，星火的 AI 搜索，能对更多网页进行搜索，提供更加全面且个性化的答案。

亮点三：讯飞星火 4.0 Turbo 上线

最后我们来聊聊新模型升级版「讯飞星火 4.0 Turbo」。

在数学能力以及代码能力方面，讯飞星火 4.0 Turbo 已然超越了 GPT - 4o。

这一结论是由艾伦人工智能研究所、OpenAI 等国内外极具权威性的单位发布的。

在涵盖了理解和推理、综合考试、数学和科学、代码等多种不同任务类型的 14 项主流测试集中，讯飞星火 4.0 Turbo 表现出色，在其中 9 项测试集中成功实现超越，其效率相对提升了 50%。

今年的发布会上，科大讯飞董事长刘庆峰着重强调了数学能力与代码能力。就数学能力而言，依据实用数学任务构建的测试集 CAppliedMath - 1.0 进行测试，讯飞星火 4.0 Turbo 在计算、财务、金融、度量等多个维度的任务表现中，均超越了 GPT - 4o 的水平。

同时，刘庆峰也透露，4.0 Turbo 版本已成功完成超长思维链、树搜索以及自我反思评价等算法的验证。预计在今年年底能够实现类 OpenAI o1 的高难度数学能力。

而在代码能力方面，通过代码生成 HumanEval 测试集上的效果对比发现，讯飞星火 4.0 Turbo 在 Python、Java、JavaScript 等任务上与 GPT - 4o 的差距甚微，在 C++ 能力方面更是超过了 GPT - 4o。与此同时，他们还推出代码 7B 版本，支持代码生成、代码补全等任务。

亮点四：首次发布多语言大模型，覆盖多国语言和 202 个方言

「语言能力」一直是讯飞的强项。

本次发布会还首发了多语言认知大模型，覆盖包括英语、俄语、日语、汉语、法语、西语、葡语、德语等多种语言。

在汽车、家电、办公、翻译等行业的任务场景中，多语言大模型效果超过了 GPT-4o。

语音识别首次实现全国地级市方言全覆盖，覆盖了 288 个地市的 202 种方言。

亮点五：API 再降价，使用大模型的成本大大降低

面向开发者，讯飞星火 API 矩阵进一步扩大，让使用大模型的成本进一步降低，主力版本每 1M Tokens 低至 5 元。

同时将新上线70B新版本(V4.5)、评语大模型、日语大模型、可定制API、知识增强API等产品。

写在最后：今天 AI 应用正进入到场景化的深水区

今年的科大讯飞格外重视大模型应用的落地。

星火杯作为唯一团中央点名支持的大模型应用大赛，有来自全球 533 所高校的 1656 支大学生开发者团队共同参赛。其中，Top 20 里有 8 支队伍来自 Datawhale。

整场发布会，让我们看到了讯飞的思考。

今天，AI 应用正进入到场景化的深水区。

诚然，国内先好好追追多模态和 Dalle 3 比较务实。

但是不可否认的是，大模型也正迎来规模化应用的时代。

教育、医疗，讯飞无不在这些民生之本上下功夫，确实是看到了中国人工智能国家队的社会责任感。

今年讯飞的关键词，也是想给大家传递的：顶天立地、自主可控、通专结合、端云联动、软硬一体。

深深看出科大讯飞成立25年来的初心、匠心、开放和创新。

解放生产力、释放想象力，不再是梦。

一起“点赞”三连↓

http://mp.weixin.qq.com/s?__biz=MzIyNjM2MzQyNg==&mid=2247686483&idx=1&sn=eb3e398560f9fa58d6078406097b709b

Datawhale

一个专注于AI领域的开源组织，汇聚了众多优秀学习者，使命-for the learner，和学习者一起成长。

最新文章

上海交大教授建议：Datawhale给开源AI通识课新命名

火了！一份AI领域的经典论文清单！

2025 QS 亚洲大学排名公布！197所中国高校上榜！

谷歌2024博士奖学金名单公布

微软 AI CEO 清华演讲全文（建议收藏）

AI数学神话破灭！FrontierMath让LLM集体几乎“交白卷”：正确率不超过2%

线下百校联动，AI线下共学活动开放报名

2025冬季科创营报名启动

导师：自己每天科研工作近10小时，都觉得不够。研究生们：每天工作不够5小时，拿什么去竞争？

李飞飞团队新作：空间智能版ImageNet来了！

大模型2.0读书会来了！融合学习与推理的大模型新范式

教授何恺明在MIT的第二门课！

知名开源项目阿里官宣停更，太痛了

ACL 2024亮点：RAG技术进展与论文解析

组队学习首次开放许愿啦！下个月想学什么，听你的

报名开启 | 11月8日 Google活动来华师大了

实测讯飞智作，一张照片定制属于自己的数字人

十一月组队学习来了！

Datawhale公益组，帮孩子找到兴趣和热爱

《OPEN AI通识课》重磅发布！Datawhale 联合浙江大学智海 Mo 平台

刚刚，阿里全球数学竞赛决赛结果公布！姜萍违反预选赛规则未获奖

沈向洋在青年科学家50²论坛的演讲全文：关于大模型的10个思考

时代变了！英伟达纳入道琼斯指数，英特尔被取代

库克：我从乔布斯那里学到的

阿里、京东、鹅厂、小米不同职级薪资待遇一览表

Runway CEO喊话：我们不是一家 AI 公司

马斯克正在用他的方法「拯救世界」

神秘模型“小熊猫”一夜霸榜，疑似中国制造

本周六，北京中关村见！

Claude喜提清华物理特奖得主，学物理的都去搞大模型了？

薅优惠GPU算力机会来了！

一篇具身智能的最新全面综述！（下）

一篇具身智能的最新全面综述！（上）

开源一夜崩塌：Linux无理由除名俄罗斯开发者。我们该醒了？

今年的1024，一些有趣的AI观察

稚晖君玩了个大的：开源人形机器人全套图纸+代码！

论文发表难！OpenAI又有高管走了，还发了长篇离职信

10月29日，上海阿里见！

Datawhale AI+X高校行于复旦大学圆满举行！

值得去的20家IT公司及薪资（杭州篇）

实验室一块GPU都没有怎么做深度学习？

卷疯了！美国AI博士生「人手10篇顶会」

华为不同职级薪资待遇一览表

李飞飞最新访谈：AI十年，她所看见的世界

本周五，合肥见！

CCF 大模型安全挑战赛获奖队伍公示！

陶神回应：AI还无法达到他12岁时的水平

又一外企巨头在中国裁员了

4所高校、1000+师生受益，9月AI+X高校行圆满举行！

Yann LeCun最新万字演讲：致力于下一代AI系统，我们基本上不做LLM了

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉