政策早知道
工业和信息化部组织开展人工智能赋能新型工业化典型应用案例征集工作
大平台动作
谷歌发布智能语音助手Gemini Live,对标GPT-4o
xAI发布Grok-2 Beta版,性能超越GPT-4 Turbo
昆仑万维发布全球首个AI流媒体音乐平台Melodio
阿里通义开源音频语言模型Qwen2-Audio 7B
新力量崛起
面壁智能小钢炮模型MiniCPM-V2.6登顶GitHub
AI初创公司Cosine宣布推出全新自主AI工程师Genie,性能超越Devin
投融资风向
AMD收购欧洲最大私人AI实验室SiloAI,交易价值约6.65亿美元
整数智能完成数千万元A轮融资,业务拓展至全球范围
01
工业和信息化部组织开展人工智能赋能新型工业化典型应用案例征集工作
政策早知道
工业和信息化部近日印发通知,组织开展人工智能赋能新型工业化典型应用案例征集工作。本次典型应用案例征集将以人工智能赋能新型工业化为主线,围绕“技术底座、行业应用、装备产品、支撑保障”4大领域开展。
工业和信息化部将组织专家对各地报送项目进行评审,遴选出典型应用案例。加大典型应用案例的宣传力度,组织开展经验交流会、案例分享会、供需对接会等活动,为人工智能领域供需双方提供交流合作平台,促进案例的应用推广,切实发挥案例的引导示范作用。
申报起始时间为2024年8月1日,截止时间为2024年8月31日。
新闻拓展:
https://www.miit.gov.cn/zwgk/zcwj/wjfb/tz/art/2024/art_eb70e19c3b75499ea7b7e67b7114354c.html
02
谷歌发布智能语音助手Gemini Live,对标GPT-4o
大平台动作
8月14日凌晨举办的“Made by Google 2024”大会上,谷歌正式发布智能语音助手Gemini Live,功能与OpenAI在5月推出的GPT-4o语音模式类似。
Gemini Live是一个多模态智能助手,支持自然语言提问,能识别图像、视频和语音。Gemini Live的使用方法非常简单,长按电源按钮或对着手机直接说“Hey Google”就能开始使用。Gemini Live除了能理解语音、图片、视频之外,还能生成图片。目前,安卓手机Gemini Advanced英文版订阅用户已经可以使用Gemini Live,提供了10种语音选择和45种语言,未来几周谷歌将扩展至iOS系统和更多语言。
新闻拓展:
03
xAI发布Grok-2 Beta版,性能超越GPT-4 Turbo
大平台动作
8月14日,马斯克成立的xAI宣布推出Grok-2和Grok-2 mini,目前这两个模型已都在X平台上向Grok用户发布。
根据xAI公布的信息,sus-column-r(Grok 2 早期版本)在多个基准测试中性能优于Claude 3.5 Sonnet和GPT-4-Turbo。Grok-2和Grok-2 mini目前均在X上开启了测试,xAI还将在本月晚些时候通过企业API提供这两种型号。
新闻拓展:
04
昆仑万维发布全球首个AI流媒体音乐平台Melodio
大平台动作
8月14日,昆仑万维正式发布全球首个AI流媒体音乐平台Melodio,并同步推出AI音乐商用创作平台Mureka。两款产品均搭载昆仑万维新款自研DiT(Diffusion Transformer)架构音乐大模型Skymusic 2.0,这是业内首个能够持续稳定生成特定风格歌曲的AI音乐大模型。
Melodio上的所有音乐都由AI生成,用户只需根据此刻的场景或心情输入Prompt,如“早晨的第一杯咖啡”,Melodio便会持续生成相应风格的定制化音乐。用户在进行音乐生成时,不仅能够持续输出曲风、曲调、速度、和弦、配器相似的特定风格歌曲,还能选择特定音色进行演唱。根据Statista数据,2023年全球纯流媒体音乐订阅收入为193亿美元。相较于传统音乐平台,AI流媒体音乐能够为每个不同的场景及心情配上专属音乐,重新定义音乐形态,让用户随时随地享受定制化音乐陪伴。
新闻拓展:
05
阿里通义开源音频语言模型Qwen2-Audio 7B
大平台动作
8月13日,阿里通义千问开源Qwen2-Audio系列的两个模型Qwen2-Audio-7B和Qwen2-Audio-7B-Instruct。
作为一个大规模音频语言模型,Qwen2-Audio能够接受各种音频信号输入,并根据语音指令执行音频分析或直接响应文本。该模型支持超过8种语言和方言,例如中文、英语、粤语、法语、意大利语、西班牙语、德语和日语。较之前一代模型Qwen-Audio,新版模型有了更强的声音理解能力和更好的指令跟随能力。Qwen2-Audio颠覆了传统依赖文本输入的交互方式,用户现在可以直接通过语音与模型进行自由对话,无需任何文本中介,极大地提升了交互的便捷性和自然度。
新闻拓展:
06
面壁智能小钢炮模型MiniCPM-V2.6登顶GitHub
新力量崛起
近日,面壁小钢炮MiniCPM-V2.6在GitHub和HuggingFace趋势榜上迅速上升至Top3,其GitHub星标数量已破万。自今年2月1日首次亮相至今,MiniCPM系列的累计下载量已超过百万次。
据悉,MiniCPM-V2.6以其8B参数实现了单图、多图、视频理解的全面性能提升,超越了GPT-4V。这款端侧多模态模型首次集成了实时视频理解、多图联合理解、多图ICL等高端功能。它在量化后端侧内存仅占6GB,端侧推理速度高达18tokens/s,比上代模型快33%,并且支持llama.cpp、ollama、vllm推理,同时支持多种语言。
新闻拓展:
07
AI初创公司Cosine宣布推出全新自主AI工程师Genie,性能超越Devin
新力量崛起
近日,AI初创公司Cosine宣布推出自己的全新自主AI工程师Genie。该公司表示,Genie的表现轻松超越了Devin(AI初创公司Cognition发布的首个AI程序员),在第三方基准测试SWE-Bench上的得分为30%,而Devin的得分仅为13.8%,甚至超过了亚马逊的Q和Factory的Code Droid的19%,现在是全球性能最好的AI程序员。
作为一种先进的AI软件工程模型,Genie可以按照人类工程师的指示自主处理各种编码任务,包括bug修复、功能构建、代码重构、代码测试等。
Genie可以完全自主运行,也可以与用户协作完成任务。它支持多种编程语言,在技术报告中显示,其中包括JavaScript、Python、TypeScript、TSX、Java、C#、C++、C、Rust、Scala、Kotlin、Swift、Golang、PHP、Ruby。
新闻拓展:
08
AMD收购欧洲最大私人AI实验室SiloAI,交易价值约6.65亿美元
投融资风向
近日,AMD宣布已正式完成对SiloAI的收购,后者是欧洲最大的私人AI实验室之一。此次交易价值约为6.65亿美元,折合人民币约47.7亿元。
AMD强调,收购SiloAI是公司致力于提供基于开放标准的端到端AI解决方案,以及与全球AI生态系统建立良好合作关系的重要体现。
AMD在公告中表示,SiloAI为AMD带来了一支由全球人工智能科学家和工程师组成的团队,该团队在为安联、飞利浦、劳斯莱斯和联合利华等大型企业客户开发尖端人工智能模型、平台和解决方案方面经验丰富。
新闻拓展:
09
整数智能完成数千万元A轮融资,业务拓展至全球范围
投融资风向
近日AI数据公司“整数智能”宣布完成了数千万元人民币A轮融资。本轮投资由峰瑞资本领投,老股东藕舫天使跟投。此前整数智能还获得唐氏(中国)投资、尖晶资本等机构的投资。
整数智能致力于为人工智能提供数据服务支持,去年初推出了4D标注工具,随着工具链优化,不仅能做到百倍效率提升,自动化标注准确率还能最高达98%,获得了国内诸多头部公司的订单。
据悉,本轮融资资金将用于数据集构建服务和智能数据工程平台的强化建设,招募全球顶级的人才团队,加速公司对全球市场的产品和业务布局。
新闻拓展:
信息来源:WAIC综合整理