“科”到了⑦:这些AI大模型正在加快迭代升级

科技   2024-11-25 17:44   安徽  


AI大模型
从百花齐放到场景落地
商业应用和融资方面如火如荼
本期【“科”到了】带你一起
看看有哪些最新成果


01 昆仑万维推出“天工大模型 4.0”4o版及实时语音助手Skyo


2024年11月20日,昆仑万维推出'天工大模型4.0’40版及实时语音助手Skyo。Skyo能克服大模型幻觉,具备快速响应、多语言对话、情感化反应等功能。'天工大模型 4.0’40版有高效响应速度、支持实时打断等特征。Skyo 将于12月份上线昆仑万维旗下天工 App。



02 推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAl 01-preview

2024年11月20日,DeepSeek推出推理模型 DeepSeek-R1-Lite 预览版。该模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。在数学、代码等复杂逻辑推理任务上媲美 OpenAI 01-preview,在AIME 和codeforces 评测中超越 GPT-40 等模型。目前处于迭代阶段,仅支持网页使用,暂不支持API调用。正式版将完全开源并公开技术报告和部署 API服务。


03 英伟达发布新 AI 硬件:H200 NVL PCIe GPU 和 GB200 NVL4 超级芯片


11月19日,英伟达在SC24超算大会推出两款新AI硬件。H200NVL PCIe GPU是相对低功耗风冷计算卡,最高TDP功耗600W,INT8 Tensor Core算力下滑约15.6%,内存容量141GB、带宽4.8TB/s,支持双路或四路NVLink桥接器互联。GB200 NVL4超级芯片将于2025年下半年上市,聚合2个Grace CPU和4个Blackwell GPU,内存池容量达1.3TB,拥有更高的性能。


04 Mistral 发布 Pixtral Large 多模态 AI 模型:图表/文档推理超过 GPT-4o

2024年11月18日,Mistral AI公司发布多模态 AI模型 Pixtral Large,拥有1240亿参数。该模型在MathVista、DocVQA 和 VQAV2等多模态基准测试中表现出色,在 MathVista 中准确率达 69.4%,超越对手。在ChartQA 和 DocVQA 测试中也超越GPT-40 和 Gemini-1.5 Pro。配备 123B多模态解码器和1B视觉编码器,支持128K上下文窗口,能处理至少30张高分辦率图像,在视觉数据、复杂推理和图表理解方面能力强大。


05 阿里通义千问发布 Qwen2.5-Turbo AI 模型,处理时间缩短至68秒



11月18日,阿里通义千问发布 Qwen2.5-Turbo 开源 AI 模型。该模型支持100万tokens上下文,相当于约100 万英语单词或 150万汉字,处理时间缩短至 68 秒,速度提升 4.3倍。在 1M-token 的 Passkey 检索任务中实现100%准确率,RULER长文本评估得分93.1,超越GPT-4和GLM4-9B-1M。处理成本为每百万个tokens 0.3元,具备较强竞争力。但团队也意识到在真实场景中长序列任务表现可能不够稳定,承诺继续优化。



来源:招商投资部
供稿:韩创
编辑:偶世君
审核:许拂晓


安徽人工智能公司
“中国声谷”是国家工信部和安徽省政府合作项目,由安徽省人工智能产业投资发展有限公司负责运营。
 最新文章