WEEKLY REPORT
11/10
2024
AIGC本周资讯
互联网行业一周新闻速览
01
WEEKLY NEWS
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
文章链接:https://arxiv.org/abs/2408.15205
代码链接:https://github.com/lwpyh/ProMaC_code
项目网址:https://lwpyh.github.io/ProMaC/
这项研究由来自伦敦大学玛丽女王学院和上海交通大学的研究团队进行的,他们开发了名为 ProMaC 的框架,该框架创新性地利用了大模型在预训练过程中产生的幻觉。不仅能够准确识别图像中的目标对象,还能判断这些对象的具体位置和形状,这在伪装动物检测或医学图像分割等复杂任务中表现尤为出色。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-03-3
02
WEEKLY NEWS
理所当然也能错,数学界震动:「上下铺猜想」被证伪
论文链接:https://arxiv.org/abs/2410.02545
数学的很大一部分是由直觉驱动的,但有时想当然会让人误入歧途。早期的证据可能并不代表大局,一个陈述可能看起来很明显,但一些隐藏的微妙之处会自行显露出来。
三位数学家现在已经证明,概率论中一个著名的假设,即双层床猜想(bunkbed conjecture)就属于这一类。这个猜想 —— 关于当数学迷宫(称为图、graphs)像双层床一样堆叠在一起时,你可以用不同的方式导航 —— 这似乎是自然的,甚至是不言而喻的。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-02-5
03
WEEKLY NEWS
大模型玩你画我猜:Claude6局3胜,GPT-4o表现迷惑
最近爆火的一种新的测试基准(doge)。
游戏结果一定程度上能反映出大模型能力,比如这组测试
一共进行了6局游戏
表现最好的是Claude:它赢了3次!
GPT-4o表现有点抽象。
在很多轮游戏中,其他模型都在认认真真地答题,而它的第一个回答经常是Circle??有点子抽象。
原文链接:
http://www.qbitai.com/2024/11/214931.html
04
WEEKLY NEWS
OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
翁荔(Lilian Weng)领导的 OpenAI 安全团队发布了一项新的研究成果,发现基于规则的奖励可用于提升语言模型的安全性。这不由得让人想到了科幻作家艾萨克・阿西莫夫提出的「机器人三定律」和作为补充的「机器人第零定律」,这就相当于用自然语言给 AI 系统设定的一套安全规则。看起来,OpenAI 已经在向着这个方向努力了。
论文标题:Rule Based Rewards for Language Model Safety
论文地址:https://arxiv.org/pdf/2411.01111
代码与数据:https://github.com/openai/safety-rbr-code-and-data
原文链接:
https://www.jiqizhixin.com/articles/2024-11-06
05
WEEKLY NEWS
腾讯发最大开源MoE模型,3890亿参数免费可商用,跑分超Llama3.1
腾讯拿出看家本领,来挤开源赛道,突然发布了市面上最大的开源MoE模型。
Hunyuan-Large,3890亿总参数,520亿激活参数。
跑分超过Llama 3.1 405B等开源旗舰,上下文长度支持也高出一档来到256k。
虽然Hunyuan-Large还不算腾讯内部的旗舰模型,但腾讯介绍底层技术与混元大模型“同宗同源”:
很多细节都是内部业务打磨好再开源出来的,比如用到了腾讯元宝App的AI长文阅读等功能里。
现在这样的一个模型彻底开源,免费可商用,算是很有诚意了。
原文链接:
https://www.qbitai.com/2024/11/215895.html
06
WEEKLY NEWS
达摩院发布八观气象大模型:精度达1小时1公里,率先落地新能源场景
11月6日,阿里巴巴达摩院(湖畔实验室)在北京举行决策智能产品发布会,正式发布八观气象大模型,在全球气象模型基础上引入区域多源数据,时空精度最高可达1公里*1公里*1小时。通过大幅提升对温度、辐照、风速等关键气象指标的预测性能,八观气象大模型率先落地新能源占比高的新型电力系统,助力国网山东电力调控中心成功预测了多次极端天气,新能源发电功率、电力负荷预测准确率分别提升至96%和98%以上。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-06-9
07
WEEKLY NEWS
史上第一次,英特尔在数据中心市场输给了AMD
在消费级芯片市场形势逆转之前,服务器芯片的市场已经先喊出 AMD yes 了。
史上第一次,AMD 从数据中心处理器市场中获得的利润超越了英特尔。
近二十多年来,英特尔一直是数据中心 CPU 市场无可争议的领导者,其提供的 Xeon 处理器为全世界大多数的服务器提供动力。另一方面,仅在七八年前,AMD 的处理器还只能占据个位数的市场份额。
如今情况已发生了巨大变化。虽然英特尔的 Xeon CPU 仍然为大多数服务器提供动力,但越来越多的新服务器,特别是高端设备已经趋向于选用 AMD 的 EPYC 处理器。正如近日独立研究机构 SemiAnalysis 所指出的,AMD 的数据中心业务部门现在的销量已经超过了英特尔的数据中心和 AI 业务。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-06-7
08
WEEKLY NEWS
具身智能GPT-2时刻到了!这家国内公司已做出全球最大规模的端到端统一具身大模型——专访自变量机器人团队
内初创公司自变量机器人(X Square),是国内唯一一家从第一天就选择了端到端统一大模型技术路线的公司,与 PI 的技术路线不谋而合。这家公司正在训练的 Great Wall 操作大模型系列的 WALL-A 甚至从参数规模上已经超过了 PI。
今年 4 月,机器之心曾对自变量机器人公布的 Demo 进行报道,其中基于他们自研的端到端统一具身大模型,双臂机器人可利用低成本硬件即实现对不规则物体的精细操作(如抓握、拾取、切割等),以及折叠衣服、冲泡饮料等复杂任务,展现出相当程度的泛化性能。
当前,自变量机器人的模型效果已达到惊人水准,体现在包括处理长序列复杂任务,以及泛化性、通用性等方面。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-07-5
09
WEEKLY NEWS
AI有鼻子了,还能远程传输气味,图像生成香水
最近,一个名叫 Osmo 的初创公司宣布,他们成功地将气味数字化了。第一个成功的案例是「新鲜的夏季李子」,而且复现出的味道「闻起来」很不错。整个过程依靠 AI 技术来完成,不需要人工干预。有了这项技术,你就可以像下载音乐一样下载香水了。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-09-3
下期精彩继续