WEEKLY REPORT
10/13
2024
AIGC本周资讯
互联网行业一周新闻速览
01
WEEKLY NEWS
长文本、语音、视觉、结构化数据全覆盖,中国移动九天善智多模态大模型震撼发布
Meta 首次公开展示了自家的「用于媒体的突破性生成式 10 月 12 日,在第十二届中国移动全球合作伙伴大会主论坛上,中国移动发布了最新的九天善智多模态基座大模型,全面解析了九天系列大模型的亮点能力、特色技术。
四大亮点:九天善智多模态大模型的强大功能解析
中国移动将新发布的多模态大模型命名为 “善智”,在人工智能高速发展的时代,平衡 “大善” 与 “大智” 至关重要。这一命名体现了中国移动追求技术卓越与社会责任并重的理念,使大模型不仅文理兼修、德艺双馨,更能普惠应用,进而创造人类文明新的福祉。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-13-5
02
WEEKLY NEWS
除了Ilya,刚拿诺奖的Hinton还教出了这些AI博士
在几十年研究生涯中,Hinton 培养出了 40 位博士生,其中不乏前 OpenAI 首席科学家 Ilya Sutskever、前苹果 AI 总监 Ruslan Salakhutdinov 这样的大牛。
在周二的一次演讲中,Hinton 表示自己非常幸运,遇到了很多聪明的学生,他们取得了非常大的成功,有的做出了伟大的成果。其中他为弟子 Ilya「解雇」奥特曼而感到自豪,并认为奥特曼现在更关心利润而不是安全。他同时呼吁加强对 AI 安全以及由好奇心驱使的基础研究的支持。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-05-5
03
WEEKLY NEWS
陶哲轩众包数学项目完成度99.99%:仍未看到AI工具的重大贡献
大约在三周前,陶哲轩提出了一个众包项目,结合专业和业余数学家、自动定理证明器、AI 工具和证明辅助语言 Lean, 来描述与 4694 条 magma(原群) 方程定律相关的蕴含图,这些定律可以使用最多四次 magma 操作调用来表达。
该项目已运行 19 天,从已解决的原始蕴含的角度来看,该项目(截至撰写本文)已完成 。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-13-3
04
WEEKLY NEWS
AI作曲缺数据,浙大GTSinger数据集上线:适配所有歌声任务、带有真实乐谱
来自浙江大学的研究团队提出了一个全球化、多技巧的大型开源高质量歌声数据集 GTSinger,带有技巧对照组、真实乐谱、配对朗读数据,涵盖了目前所有歌声任务的需求,并在多个歌声任务上提供基准测试。
论文地址:
https://arxiv.org/abs/2409.13832
项目主页:
https://gtsinger.github.io/
开源数据:https://huggingface.co/datasets/GTSinger/GTSinger
开源代码:
https://github.com/GTSinger/GTSinger
目前,该论文已被 NeurIPS 2024 Datasets and Benchmarks Track 接收为 Spotlight,并已开源完整数据集和相关代码。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-13-2
05
WEEKLY NEWS
AI发现超16万种新RNA病毒?阿里云、中山大学合作研究登Cell
人工智能(AI)已被用来揭示地球各个角落的多种基本生命体。
阿里云、中山大学、悉尼大学等机构的合作团队开发了一种深度学习算法,称为 LucaProt,用于发现来自全球不同生态系统的 10,487 个宏转录组中高度分化的 RNA 依赖性 RNA 聚合酶 (RdRP) 序列。LucaProt 整合了序列和预测结构信息,从而能够准确检测 RdRP 序列。
借助 LucaProt,研究人员发现了总共 161,979 种新的 RNA 病毒,认为这将极大地改善地球生命的绘制,并有助于识别数百万种尚未鉴定的病毒。
论文链接:
https://www.cell.com/cell/fulltext/S0092-8674(24)01085-7
原文链接:
https://www.jiqizhixin.com/articles/2024-10-12-6
06
WEEKLY NEWS
OpenAI今天Open了一下:开源多智能体框架Swarm
Swarm。这是一个实验性质的多智能体编排框架,主打特征是工效(ergonomic)与轻量(lightweight)。
项目地址:https://github.com/openai/swarm
Swarm 开源后引起了热烈讨论,有网友表示这能帮助简化许多潜在的多智能体用例的工作流程。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-12-3
07
WEEKLY NEWS
李飞飞:不要数字孪生,要数字表兄弟,一张照片生成机器人训练场景
我们很多人都听说过数字孪生(digital twin),在英伟达等公司的大力推动下,这种高效运营工作流程的方法已经在很多工业场景中得到应用。
但你听说过数字表亲(digital cousin)吗?
近日,斯坦福大学李飞飞团队就做出了一个这样的研究,其可有效地将真实数据变成适用于机器人学习的模拟数据 —— 在降低真实转模拟成本的同时还能提升学习的泛化性能。
简单来说,你只需拍一张照片,就能将照片中的物体变成虚拟版本,并且这个数字虚拟版本还不是照片中物体的一比一复刻,而是存在一定的变化。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-12-2
08
WEEKLY NEWS
Kimi探索版发布,10倍搜索量自主解决复杂问题
2024年10月11日,通用人工智能创业公司——月之暗面正式发布可自主海量搜索解决复杂问题的 Kimi 探索版。Kimi 探索版具备AI自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案,帮助用户更高效地完成分析调研等复杂任务。
Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。在内部性能评估测试中,Kimi 的性能评估团队结合 1000 多个来自用户的真实长难问题,对比了国内所有的主流 AI 助手和搜索类产品,包括付费和专业版本,Kimi 探索版的回答准确性和完整性具备全面优势,综合性能超过同类产品至少 30%。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-11-9
09
WEEKLY NEWS
豆包大模型再造爆款:抖音“AI绘本特效”播放超11亿
国庆期间,抖音上一款名为“AI治愈绘本”的特效凭借温暖优美的画风和高还原度吸引了数百万用户投稿,采用了动态绘本的拟物玩法,“AI治愈绘本”特效首次使用了3D立体翻书的形式,巧妙地将首张用户图作为书皮呈现,玩法新颖有趣。基于该特效投稿的“成为绘本里的温暖主角”话题播放量超过11亿。
据了解,“AI治愈绘本”特效底层使用了字节跳动豆包大模型的图像生成能力,技术团队通过多项自研算法,保证了模型有更好的风格响应度、画面美观度,让风格化效果更富有表现力,并且更大程度还原了人物面部特征、服装款式、颜色、配饰等主体特征,在“美且像”的维度上取得了良好的效果。
为呈现更好的交互方式,技术团队还使用了自研的主体抹除、扩图能力,对风格化结果图进行后处理,使得多张结果图可以在端上进行切换。上述过程中应用到的IP保持技术RealCustom和 AI扩图和AI消除技术ByteEdit,两项成果分别入选CVPR2024和ECCV2024。
RealCustom是一种个性化定制技术即IP保持,对于任意开放域物体或人物 IP 均可实现无需微调的实时定制化生成,在AI绘本中主要起到保持输入图片特征的作用。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-11-8
下期精彩继续