NEWS REMIND
阿里巴巴元境大裁员,许多员工上月底 last day,未来业务重点将转向元宇宙应用
据多家媒体报道,阿里巴巴旗下的元宇宙服务品牌“元境”近日进行了大规模裁员,10 月 31 日是许多员工的最后工作日,裁员涉及了杭州和上海的团队。元境相关负责人解释称,“随着元境在元宇宙基础设施层面的建设基本完成,业务重点已转向元宇宙应用,因此进行了组织调整。”元境作为阿里继 YunOS 之后的又一操作系统项目,原本被定位为元宇宙操作系统。
字节跳动推出 AI 社区产品 Lumi,赋能内容创作者的新平台
11 月 1 日,字节跳动正式推出其全新 AI 社区产品“炉米 Lumi ”,这款工具旨在为 AI 模型的分享、管理和训练提供一个全面的平台。目前,Lumi 仍处于内测阶段,仅支持抖音以及手机号码登录。
华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型
在 11 月 2 日的 2024 四川大学华西医院管理大会上,华西医院联合华为数据存储发布“华西黉医”医学大模型。
支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级
近期,中国电信人工智能研究院(TeleAI)星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别。与传统的有标注训练方法相比,TeleAI 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。
夸克发布“灵知”学习大模型,号称考研数学题正确率、得分率比肩 OpenAI o1
11 月 1 日消息,夸克宣布全面升级“ AI 搜题”产品,用户可通过手机、平板、电脑等设备搜到各类新题和难题,AI 还会分步骤进行题目讲解,并支持用户随时提问。据介绍,夸克 AI 还可围绕题目中的知识点与考点进行深度讲解,精准定位关键步骤,能够以“启发式”学习的体验让用户不仅学会这一道难题,还能举一反三学会一类题。
周鸿祎警告:AI 将首先淘汰不会利用 AI 的人
11 月 1 日消息,周鸿祎发文警示:AI 将首先淘汰不会利用 AI 的人,随后淘汰那些缺乏思考力的人。他指出,随着 AI 工具的普及,写作变得前所未有的简单,但这背后潜藏着深远的影响。周鸿祎强调,AI 公司推广辅助乃至自动写作功能,看似便捷,实则加剧了社会分化:一端是精通写作与独立思考的精英,另一端则是完全丧失书写技能与批判性思维的人群。这种分化远比表面现象更为严峻,它实质上反映了有思想深度与无独立见解者之间的鸿沟。他表示未来能够持续思考、主动求知的人将成为智者,而依赖 AI 自动写作、放弃自主思考的大多数人,则可能逐步退化其思考能力。
"驯鹿 AI "完成 6000 万战略融资,布局 AI 智能客服与销售
近日,北京驯鹿智能科技有限公司"驯鹿 AI "(以下简称“驯鹿 AI ”)宣布完成了 6000 万元人民币的战略融资,由 IDG 和盛大资本领投,万世资本和源合资本担任专业顾问。该公司以 AI 客服和销售为核心业务,这笔资金将主要用于技术研发和团队扩充,尤其是高端人才的引进。
多图场景用 DPO 对齐,上海 AI 实验室等提出新方法,无需人工标注
由上海交大、上海 AI 实验室和香港中文大学联合提出的最新研究成果 MIA-DPO,为大型视觉语言模型(LVLM)提供了一种全新的多图像偏好对齐方法。该方法通过将单图像数据扩展为多图像数据,同时设计了序列、网格拼贴和图中图三种数据格式,显著降低了数据收集和标注成本,具备高度的可扩展性。
豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍
近期,字节跳动与香港大学合作,推出了一款名为 HybridFlow 的高效强化学习和强化学习人类反馈框架。这一框架旨在解决大模型训练中的复杂性和效率问题,显著提升了训练吞吐量。
医疗机器人企业“奥达智声”获数千万元 A 轮融资,前海方舟大健康基金出手
11 月 1 日消息,智能医疗机器人系统、器械及智能医疗综合解决方案提供商——北京奥达智声医疗科技有限公司(简称“奥达智声”),宣布完成由前海方舟大健康基金独家投资的数千万元 A 轮融资,黄蜂资本担任本轮融资财务顾问。
情感大模型品牌“中聚源”发布全周期心理健康数字化解决方案
近日,情感大模型品牌中聚源智能科技表示,自主研发智能心理监护系统、智能心身测评一体机、智慧交互式干预座舱等多款产品,形成以“预防-预警-干预为核心的全周期心理健康数字化解决方案。目前,已应用于国防、教育、司法、公安、交通、医疗等领域。
微软计划斥资近 100 亿美元租用 CoreWeave AI 服务器
11 月 2 日消息,CoreWeave 表示,微软计划在 2023~2030 年间花费近 100 亿美元(当前约 712.77 亿元人民币)从该公司这里租用服务器,以运行 AI 模型。CoreWeave 对投资者表示,这一金额比以前所知的要大,占 CoreWeave 与客户签署的 170 亿美元(当前约 1211.71 亿元人民币)合同总额的一半以上。CoreWeave 和微软没有立即回应置评请求。
科技巨头联手:微软与 a16z 罕见携手呼吁放松 AI 监管
微软 AI 主管谈 AI 趋势:大小模型将“齐头并进”,“规模法则”远没有到极限
在近日的一次访谈中,微软 AI 主管 Mustafa Suleyman 深入探讨了人工智能领域的最新趋势。他认为,未来几年 AI 模型将呈现大小模型“齐头并进”的趋势。一方面,大型模型的规模化竞赛仍将持续,并融入更多模态的数据,例如视频、图像等。另一方面,利用大型模型训练小型模型的技术(如蒸馏)兴起,高效的小型模型将在特定场景中发挥巨大作用。Suleyman 补充称,未来,知识将被浓缩到更小、更便宜的模型中,嵌入各种设备,实现真正的环境感知革命。
谷歌 Agent 首次发现真实世界代码漏洞!抢救全球数亿设备,或挽回数十亿美元损失?
谷歌的 Big Sleep 项目最近取得了一项突破性成果,其 AI Agent 在 SQLite 数据库中发现了一个真实世界的安全漏洞。这是 AI 首次在广泛使用的现实软件中识别出未知的、可利用的内存安全问题。SQLite 是一款广泛使用的开源数据库引擎,其漏洞可能被攻击者用于数据泄露、系统入侵或破坏,潜在损失可能高达数十亿美元。AI 在官方发布版本之前发现了这一漏洞,避免了对用户的影响。
迪士尼成立新 AI 部门,探索人工智能、混合现实等新型技术的潜力
据报道,华特迪士尼正在组建一个新的小组,以协调公司对人工智能和混合现实等新兴技术的使用,以此来积极探索 AI 等技术在电影、电视和主题公园等业务中的潜力。新成立的“技术赋能办公室”(Office of Technology Enablement)将由杰米・沃里斯(Jamie Voris)领导,他是迪士尼电影制片厂的首席技术官,此前主导了迪士尼为苹果 Vision Pro 混合现实设备开发应用的工作。
雷诺宣布将生成式 AI 引入下一代车载语音助手 Reno,支持 ChatGPT 闲聊
11 月 1 日,赛轮思软件技术公司宣布与雷诺公司深化合作,将生成式 AI 驱动的功能和类人交互引入雷诺下一代多模态虚拟车载伴侣 Reno。
领英发布首款 AI 招聘助手,全面开启智能化招聘时代
近日,全球职场平台领英(LinkedIn)在美国凤凰城举办了第 13 届 Talent Connect 。在活动现场,领英发布了多项全新 AI 产品和功能,从人才招聘、组织发展等关键维度赋能全球化企业组织和团队,助力企业管理者在 AI 时代持续打造创新动能。领英中国区总经理王茜指出:“我们看到越来越多的全球企业组织明确表明将在 2025 年专注于投资 AI 技术,并将其应用于人才、品牌和运营等各个业务领域。因为他们意识到拥抱 AI 不仅是为了保持竞争力,更是为了赋能团队,激活人才潜能,从而打造一个更具韧性和创新动力的全球化组织。”
远程 “闻” 香来了!数字嗅觉公司 Osmo 用 AI 技术实现气味“传送”
最近,一家名为 Osmo 的数字嗅觉公司宣布在“嗅觉传送”技术上取得了重大突破。这项技术的核心是使用气相色谱质谱联用仪(GC/MS)来收集和分析香气数据。
Suno 新增 AI 歌手克隆功能,一键复刻专属音乐风格
Suno 近期推出的 Personas 功能让用户可以复制自己钟爱的音乐风格,一键生成带有个人特色的 AI 音乐,打造专属音乐 IP。这项突破性功能允许用户将某首歌曲中的核心元素——包括人声特点、音乐风格和情感氛围等进行提取保存,并在后续创作中反复使用。简单来说,如果你特别喜欢某首歌的演唱风格,现在可以将这种风格变成你的"专属标签",让所有新创作都保持一致的个人特色。
值得一提的是,Suno 还为这项功能设计了社交属性。用户可以选择将自己的 Persona 设为公开或私密。选择公开后,这个音乐风格模板将拥有独立页面,其他用户也能借鉴使用,同时会在创作者的资料库和个人主页中展示,让音乐创作变得更有社交价值。(AIbase基地)
ElevenLabs 推开源小项目 X-to-Voice:一键将 Twitter 账号转化为个性化虚拟形象
人工智能公司 ElevenLabs 最近发布了一个开源项目" X-to-Voice ",这款工具能够智能分析 Twitter 用户资料,自动生成与用户个性相匹配的数字声音和动态头像。这个创新项目整合了多个尖端技术:ElevenLabs 自主研发的声音设计 API 负责声音生成,Taedra 工具则掌管动态头像的制作。在技术支持方面,项目采用了 Apify 进行个人资料和图片数据采集,Hedra 负责动态头像的生成,而整个应用则部署在 Vercel 平台上。
全球首款 AI 游戏诞生!无需游戏引擎,视频模型直出“我的世界”
11 月 3 日,初创公司 Decart 和 Etched 宣布共同打造了一款世界上首个实时、可玩、可交互的世界模型——Oasis 。Oasis 经过了数百万小时游戏视频的训练,仅接收用户的键盘输入即可实时生成开放世界游戏。游戏允许玩家进行移动、跳跃、拾取物品、打破砖块等操作,生成的视频内容中不仅包含图形学的渲染,也能体现出对物理原则和游戏规则的理解。在没有任何延迟的情况下,Oasis 在 H100 上运行时能以 360p 的分辨率实现每秒 20 帧的渲染,并实时生成视频交互内容。
又一 AI 生图模型新宠!Recraft v3 横扫基准测试, 击败 Flux 和 Ideogram 位列第一
近日,图像 AI 初创公司 Recraft 发布了其最新的文本生成图像模型 Recraft v3,最大突破在于能够在一次生成中准确呈现长段文本,而许多其他模型在处理超过几个字时常常力不从心。
3D 视觉派:斯坦福具身智能人物关系图
7年的AI芯片销售,决定去开网约车
具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?