WEEKLY REPORT
11/17
2024
AIGC本周资讯
互联网行业一周新闻速览
01
WEEKLY NEWS
真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验
字节豆包大模型又又又上新了!
11 月 11 日,字节跳动豆包大模型团队推出了最新图像编辑模型 SeedEdit,主打一句话轻松 P 图。
它是国内首个产品化的通用图像编辑模型,无需描边涂抹,仅使用简单的自然语言,就能换背景、转风格,或者在指定区域进行元素的增删和替换。
比如,输入 Prompt「把老婆饼换成驴打滚」,SeedEdit 立马锁定修改目标,完成美食替换
目前,SeedEdit 已上线豆包 PC 端和字节 AIGC 平台即梦网页端开始测试。
豆包 Web:https://www.doubao.com/chat/create-image
即梦 Web:https://jimeng.jianying.com/ai-tool/image/generate
原文链接:
https://www.jiqizhixin.com/articles/2024-11-11-6
02
WEEKLY NEWS
当视觉大模型陷入认知失调,马里兰大学构建了一个幻觉自动生成框架
马里兰大学的研究团队提出了一个名为 AutoHallusion 的视觉大模型幻觉自动生成框架。这一工作基于团队之前在 CVPR 2024 上发表的工作 HalluionBench(https://arxiv.org/pdf/2310.14566)。它通过在场景图像中插入或删除特定物体,并针对这些修改后的图像提问,从而检测大模型在回答时可能出现的幻觉现象。
这一方法能够自动生成大量的大模型幻觉案例,有效缓解当前大模型幻觉研究中数据集缺乏的问题。在 GPT-4V、Gemini 和 Claude 等大模型上的实验表明,这些模型在本文提出的提出的基准数据集上问答准确率最高仅为 66.0%。该研究成果已发表于 EMNLP 2024。
论文标题:AUTOHALLUSION: Automatic Generation of Hallucination Benchmarks for Vision-Language Models
论文链接:https://arxiv.org/pdf/2406.10900
项目主页及代码:https://wuxiyang1996.github.io/autohallusion_page/
原文链接:
https://www.jiqizhixin.com/articles/2024-11-11-3
03
WEEKLY NEWS
OpenAI大改下代大模型方向,scaling law撞墙?
有研究预计,如果 LLM 保持现在的发展势头,预计在 2028 年左右,已有的数据储量将被全部利用完。届时,基于大数据的大模型的发展将可能放缓甚至陷入停滞。
但似乎我们不必等到 2028 年了。The Information 发布了一篇独家报道《随着 GPT 提升减速,OpenAI 改变策略》,其中给出了一些颇具争议的观点:
OpenAI 的下一代旗舰模型的质量提升幅度不及前两款旗舰模型之间的质量提升;
AI 产业界正将重心转向在初始训练后再对模型进行提升;
OpenAI 已成立一个基础团队来研究如何应对训练数据的匮乏。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-11-2
04
WEEKLY NEWS
揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷
北京大学李戈教授的团队提出了一种新型网络架构 FAN(Fourier Analysis Networks)。通过引入傅里叶级数的思想,FAN 能够将周期性信息直接嵌入网络的结构中,使模型更自然地捕捉和理解数据中的周期性模式。
论文链接:https://arxiv.org/pdf/2410.02675.pdf
代码链接:https://github.com/YihongDong/FAN
论文标题:FAN: Fourier Analysis Networks
实验表明,FAN 不仅在周期性建模上的表现显著优于现有模型,而且在符号公式表示、时间序列预测和语言建模等实际任务中也同样表现出色,超过了 Transformer 等主流模型。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-10-3
05
WEEKLY NEWS
国地共建具身智能机器人创新中心正式发布天工开源计划
国家地方共建具身智能机器人创新中心召开天工开源计划发布会,对外公布创新中心成立一年以来取得的建设成就,并就已有技术成果面向行业陆续开源开放,推动具身智能加快落地。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-11-9
06
WEEKLY NEWS
AlphaFold3开源了,诺奖AI工具人人可用,开启生物分子设计新时代
AlphaFold3 终于开源了。
六个月前 AlphaFold3 发布的时候,谷歌 DeepMind 没有公布其论文代码,因此引发了学界的巨大争议。
如今,DeepMind 于 11 月 11 日宣布,科学家现在可以免费下载软件代码,并将 AlphaFold3 用于非商业应用。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-12-8
07
WEEKLY NEWS
CCS 2024 | 如何严格衡量机器学习算法的隐私泄露?ETH有了新发现
arXiv地址:
https://arxiv.org/pdf/2404.17399
GitHub代码:
https://github.com/ethz-spylab/misleading-privacy-evals
论文标题:
Evaluations of Machine Learning Privacy Defenses are Misleading
隐私评估的具体方式至关重要!Empirical 隐私攻击和防御的文献考虑了多种指标,但往往未能准确描述这些指标的隐私语义(即某个指标捕获了哪种隐私)。
在论文中,我们提倡在个体样本层面上进行隐私评估,报告防御方法对数据分布中最脆弱样本的隐私泄露程度。为了高效地进行这样的评估,我们明确设计了一小部分审计子群体,这些样本具有最坏情况的特征,称为金丝雀样本。
在我们的评估中,我们发现 DP-SGD 是一种难以超越的防御方法 —— 即使在当前分析技术无法提供任何有意义保证的情况下!
原文链接:
https://www.jiqizhixin.com/articles/2024-11-12-3
08
WEEKLY NEWS
AI解锁500多年的圣殿,米开朗基罗杰作,你我触手可及
梵蒂冈请人给著名的圣彼得大教堂造了一个「数字孪生」,还计划推出新的 AI 服务:
届时,全球任何人都能以 3D 方式探索这座文艺复兴时期的建筑杰作 ;
有了 AI,实地参观者的体验也升级了。大教堂中那些遥不可及的细节部分也能尽收眼底。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-13-12
09
WEEKLY NEWS
钉钉AI重磅更新:深入业务场景,上线工单等场景AI助理
钉钉迎来重磅升级:AI 深入业务场景,钉钉面向企业关键场景推出“精选 AI 助理”,首批已上线工单助理、Excel 助理、法务助理等 6 大 AI 助理。同时,钉钉联合生态伙伴发布行业 AI 解决方案,覆盖制造、医疗、零售、教育等行业。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-13-10
下期精彩继续