1.《COPIED 法案》或将开启AIGC监管新时代
7月11日,美国国会通过了一项重要法案《内容来源保护和防止编辑和深度伪造媒体完整性法案》(Countering Online Piracy and Illicit Distribution Act,简称“COPIED 法案”),旨在解决人工智能生成内容的“深度伪造”泛滥的问题,保护知识产权人的利益。法案正在等待总统签署成为正式法律,尚未正式生效,但已经得到美国电影电视协会(SAG-AFTRA)、美国唱片业协会(RIAA)和新闻/媒体联盟(News/Media Alliance)在内的许多出版集团和行业协会的支持。《COPIED 法案》对人工智能的定义与《2020年国家人工智能倡议法案》相同,即强调人工智能作为一种能够执行复杂任务、模拟人类智能的技术系统。法案将“合成内容”定义为完全由算法(包括人工智能)生成的信息,包括人类创作的作品,例如图像、视频、音频剪辑和文本。将“深度伪造(Deepfakes)”定义为“合成内容或经合成修改的内容,对合理人造成真实假象或印象”,包括图像、视频、音频剪辑和使用人工智能工具显著修改的文本等。该法案适用于美国境内年收入达5000万美元或注册用户数连续三个月超过2500万的平台。2. OpenAI 或将发布下一代 AI 模型“草莓”,芯片计划或在2027年见分晓 OpenAI 正在开发一款代号为“草莓”(Strawberry)的大模型,旨在提升人工智能模型的推理能力。这个项目非常神秘,其工作原理在 OpenAI 内部也是严格保密的 。“草莓”项目的目的是要使 OpenAI 的 AI 不仅能生成查询答案,还能提前做好计划,自主可靠地在互联网上导航,并执行所谓的“深度研究” 。该项目包括一种被称为“后训练”的特殊方法,即在模型已经在大量通用数据上预训练后,进一步调整模型以提高其在特定任务上的表现 。值得注意的是,OpenAI 最近公布的未来 AI 发展的五级路线图,暗示“草莓”项目可能与实现第二级别 AI ——推理者有关 。如果“草莓”项目成功,它可能会重新定义 AI 的能力,使其能够进行重大科学发现、开发新的软件应用程序,并自主执行复杂任务,进一步推动人类向人工通用智能(AGI)的发展迈进 。OpenAl 提出通用人工智能五级标准,自认为接近但未达到第二级。而“草莓”的开发与斯坦福大学2022年开发的一种“自学推理”(Self-Taught Reasoner,简称 STaR)方法有相似之处。STaR 可以使 AI 模型通过迭代创建自己的训练数据来提升智能水平,理论上可能让语言模型超越人类的智能 。OpenAI 的首席执行官山姆·奥特曼(Sam Altman)表示,AI 领域“最重要的进步将围绕推理能力展开”,这表明推理能力是实现或超越人类智能水平的关键。与此同时,奥特曼带领 OpenAI 挑战英伟达,自研芯片计划曝光。OpenAl 创始人奥特曼招募前谷歌 TPU 团队核心成员,筹划自研芯片以摆脱对英伟达依赖,预计2027年见分晓,同时与博通接触合作,自标实现更低成本和更强议价能力,推动 AI 算力和基础设施发展,迈向 AGI 和 ASI 的宏伟自标。3. 英伟达 AI 芯片被曝存重大设计缺陷将延期交付,或影响 OpenAI 研发进度和产品发布
据美国科技媒体《The Information》报道,英伟达在准备大规模生产 Blackwell 芯片时,台积电工程师发现了设计上的重大缺陷。具体而言,问题出现在连接两个 Blackwell GPU 的处理器芯片上,这导致生产效率降低,甚至可能使公司停止生产。英伟达已经确认了这一问题,并告知其主要客户,包括微软、谷歌和 Meta 等,推迟交付计划。英伟达原计划在今年第三季度开始量产 Blackwell 芯片,并在第四季度向客户交付。然而,由于设计缺陷,这一计划不得不推迟。此前,英伟达 CEO 黄仁勋曾表示公司原计划在今年晚些时候大批量出货新款芯片,但现在看来,这一目标已难以实现。这一延迟对英伟达及其客户来说无疑是一个重大打击。微软、谷歌和 Meta 等科技巨头都依赖于英伟达的高性能 AI 芯片来推动其 AI 应用和服务的发展。据报道,这些公司已经向英伟达下达了价值数百亿美元的芯片订单,用于支持其未来的 AI 项目,包括 LLM、ChatGPT 以及 Meta AI 等应用的开发。微软尤为依赖英伟达的 Blackwell 芯片。据微软内部参与英伟达芯片生产及服务器硬件的工作人员透露,微软管理层原计划在今年早些时候就向 OpenAI 提供采用 Blackwell 芯片的服务器,以支持其 AI 模型的训练和部署。然而,由于英伟达芯片的推迟,这一计划不得不推迟,可能影响到 OpenAI 的研发进度和产品发布。此外,英伟达还面临着美国司法部的反垄断调查。据知情人士透露,美国司法部正在评估英伟达是否通过施压云服务提供商购买其产品,从而滥用其市场地位。这一调查无疑给英伟达带来了额外的压力,使其在处理设计缺陷问题的同时,还需要应对法律层面的挑战。4.苹果推出开源大模型 DCLM-7B,英伟达联合 Mistral AI 发布 12B 参数小模式 Mistral NeMo
苹果公司在 HuggingFace 上发布了 DCLM-7B 模型,不仅模型权重开源,连同训练、代码和预训练数据集也一并公开,性能在多模态领域表现优异,挑战现有顶尖模型。数据显示,DCLM-7B 在多项自然语言处理任务中展现出了优秀的性能,特别是在少样本学习环境下。其性能已经超越了 Mistral-7B,并且接近其他领先的开源模型如 Llama 3 和 Gemma。具体指标:在 MMLU 基准上,DCLM-7B 的 5-shot 准确率达到64%,与 Mistral-7B-v0.3 的63%和 Llama38B 的66%相媲美。在53个自然语言理解任务上的平均表现也可与 Llama38B 相媲美,而所需计算量仅为后者的1/6。值得注意的是,不久前,英伟达联手 MistralAl 推出12B参数小模型 Mistral NeMo,性能卓越。Mistral NeMo 小模型,拥有120亿参数,支持128K上下文,与英伟达合作优化,性能超越 Gemma2 和 Llama3,单张 NVIDIARTX4090 即可运行,面向企业级应用,多语言支持,易部署,开源且高效。据行业人士透露,Mistral NeMo 可能针对特定的行业应用进行了优化,如医疗、金融、制造业等,以满足这些行业的特定需求。5. GPT-4o 新版本突然上线,更强更便宜
GPT-4o 新版本突然上线,能力全方位提升,ZeroEval 基准测试直接跃居第一。token 输出扩展到 16k,此前支持 4k。9.11和9.9谁大这个问题,也能丝滑解决。据悉,OpenAI 给 API 中引入了结构化输出。通过 JSON 模式确保模型输出符合开发者定义的结构,能让模型变得更可靠安全。最新版模型“GPT-4o-2024-08-06”在 JSON 模式评估中,得分100%。相比之下,去年6月的版本得分还低于40%。去年 OpenAI DevDay 上,官方正式给 GPT-4 引入了 JSON 模式,可以帮助开发者构建应用程序。尽管 JSON 模式能提高模型可靠性,但是它并不能保证模型生成结果符合特定模式。因此在这次更新中,OpenAI 在 API 中引入结构化输出,可以确保模型生成内容和开发者提供的 JSON 模式完全匹配。1、函数调用:通过在函数定义中设置 strict:true 来调用结构化输出。此功能适用于所有模型型号,包括 gpt-4-0613 和 gpt-3.5-turbo-0613 等。当结构化输出被启用时,模型输出将匹配提供的工具定义。开发者可以通过 json_schema (response_format 参数的新选项) 提供 JSON 模式。当模型不是调用工具,而是以结构化的方式响应用户时,这是有用的。该功能适用于 gpt-4o-2024-08-06 和 gpt-4o-mini-2024-07-18。当 response_format 使用 strict: true 提供时,模型输出将与提供的模式匹配。OpenAI 更新了 Python 和 Node SDK,支持本地的结构化输出功能。此外,还强调了安全输出。新模式将遵循现有的安全规则,并引入了 refusal 字符串值来帮助开发者识别模型拒绝 unsafe 请求的情况。结构化输出还可以用于动态生成用户界面、分离最终答案与推理过程、从非结构化数据中提取结构化数据等多种用例。最后在价格方面,输入价格为2.5美元/100万 token,输出价格为10美元/100万 token。由于新模型在输入和输出上能更节省,四舍五入也是降价了。6. 科学家首次实现空间表观遗传分析,或开辟一条全新的疾病治疗途径近日,科学家发布了两项全新的空间组学技术 Spatial-CUT&Tag 和 Spatial-ATAC-seq,首次实现了在空间和全基因组水平上观察组织发育的表观遗传机制。以癌症为例,利用这些技术可以精确定位癌细胞位置和状态,观察其周围微环境中的其他细胞类型。这些技术还可以揭示在微环境中癌细胞与附近免疫细胞或基质细胞之间的相互作用,而这些信息对理解癌症发生、发展和治疗机制至关重要。(来源:Signal Transduction and Targeted Therapy)
空间多组学指的是在同一组织切片上观察和分析多个组学层级的分子信息。传统的技术可能只能单独分析转录组或表观遗传组,而多组学技术则可以在同一切片上同时观察多个分子层面的信息,如转录组和表观遗传组。这种方法可以提供更完整和综合的视角,使研究人员更全面理解细胞和组织的功能和相互作用,有助于揭示更加复杂和深层次的生物学机制。这是一个非常新兴且热门的领域。2020年,空间转录组测序被《自然-方法》选定为“年度创新技术”之一。2022年,国际顶级学术期刊《自然》将空间多组学技术评为“年度七大颠覆性技术”之一。技术的快速发展和广泛关注也反映了其在研究和应用中的潜力和重要性。7. 准确率达60.8%,浙大基于 Transformer 的化学逆合成预测模型,登 Nature 子刊逆合成是药物发现和有机合成中的一项关键任务,AI 越来越多地用于加快这一过程。现有 AI 方法性能不尽人意,多样性有限。在实践中,化学反应通常会引起局部分子变化,反应物和产物之间存在很大重叠。受此启发,浙江大学侯廷军团队提出将单步逆合成预测重新定义为分子串编辑任务,迭代细化目标分子串以生成前体化合物。并提出了基于编辑的逆合成模型 EditRetro,该模型可以实现高质量和多样化的预测。大量实验表明,模型在标准基准数据集 USPTO-50 K 上取得了出色的性能,top-1 准确率达到60.8%。结果表明,EditRetro 表现出良好的泛化能力和稳健性,凸显了其在 AI 驱动的化学合成规划领域的潜力。相关研究以「Retrosynthesis prediction with an iterative string editing model」为题,于7月30日发布在《Nature Communications》上。论文链接:https://www.nature.com/articles/s41467-024-50617-1
该研究的核心概念是,通过使用 Levenshtein 操作的迭代编辑过程生成反应物字符串。该方法从基于编辑的序列生成模型的最新进展中汲取灵感。具体来说,采用了 EDITOR 中的操作,EDITOR 是一种基于编辑的 Transformer,专为神经机器翻译而设计。8. IJCAI 2024:论文提交量增加了23.8%,但录用率并无上升在8月6日的开幕式上,IJCAI 公布了今年的论文接收结果:5651篇提交论文,其中791篇被接收,录用率为14.0%。对比上届,IJCAI-23 共有4566篇论文被提交,643篇论文被接收,录用率为14.1%。今年的论文提交量创下新高,提高了23.8%,但录用率跟上年持平。自 2020年起,IJCAI 录用率便一路走低,接下来的几年一直在14%水平线上下徘徊,对比此前录用率保持在20%—28%范围内,自此网络上关于 IJCAI 录用严苛的讨论声起,今年也不例外。对此,大会主席张成奇认为,作者会对论文是否投中的结果有一定程度上的不同意见,这是正常现象。对于这一争议,其他会议上也会存在。作为人工智能领域的 CCF-A 类顶级国际会议,第一届 IJCAI 会议要追溯到1969年的加利福尼亚,之后每两年召开一次,从2016年开始 IJCAI 转为每年举办一次,去年 IJCAI-23 在澳门举行,无数人工智能研究人员从全球汇聚于此,在这个平台上展示前沿科学成果、展示论文,进行学术交流,本次会议涵盖了 Learning、Neural Networks、Models、Transformer、Contrastive、Reinforcement 等关键词,包含了多个领域,Uncertainty in AI,Robotics,Search,Planning and Scheduling……共15个方向。9. 大模型公司并购潮渐起,谷歌25亿美元买下 Character.AI美国的大模型资本游戏进入洗牌阶段。近日,人工智能初创公司 Character.AI 被谷歌收购,其创始人 Noam Shazeer 和 Daniel De Freitas 等人也将重返谷歌旗下 DeepMind 部门。DeepMind 主要负责开发大型语言模型和聊天机器人等人工智能产品 Gemini 套件。预计 Character.AI 共有30余人同时“转会”谷歌。成立于2021年的 Character.AI,总部位于加利福尼亚州。该公司利用大模型生成各种人物和角色风格的对话,测试聊天机器人产品于2022年9月向公众开放。2023年5月,Character.AI 在苹果 App Store 和 Google Play Store 发布了移动应用程序,第一周下载量就超过170万次,并被 Google Play 评为2023年度最佳 AI 应用。这家公司的联合创始人 Noam Shazeer 和 Daniel DeFreitas 都曾是谷歌的工程师,从事与人工智能相关的项目。其中,Noam Shazeer 曾两次离开谷歌,第二次离职后创办了 Character.AI。此前,Character.AI 就已传出曾与 Meta 和 xAI 在内的多家公司商谈合作事宜,最终选择与谷歌达成收购协议。按照协议内容,Character.AI 将向谷歌提供其当前大模型技术的非独家许可。Character.AI 在2021年成立之初筹集了4300万美元的种子资金,在2023年3月完成1.5亿美元融资后,估值达10亿美元。该公司声称,协议将为 Character.AI 提供更多资金。具体来看,谷歌将按照每股88美元,以25亿美元的估值收购其投资者股票。尽管这一数字低于早期传闻的50亿美元估值,但也帮助投资人完成了高倍率退出。10. Stable Diffusion 原始作者创业获3200万美元融资,井喷的 AI 视觉再添新玩家时隔4个月,SD(Stable Diffusion)一作再创业!开源文生图模型 FLUX.1,性能秒杀 Midjourney、DALL-E。黑马初创 Black Forest Labs 获3200万美元融资,由 Andreessen Horowitz 领投,也获得了 General Catalyst 和 MätchVC 的后续投资。SD 一作、Stabililty AI 核心成员 Robin Rombach 下场创业了,一出手就是王炸。离职4个月后,他于8月3日官宣:自己成立了 Black Forest Labs。更炸裂的是,公司的第一个产品 FLUX.1 系列模型,效果直接秒杀 Midjourney、DALL-E 和 Stable Diffusion!Black Forest Labs 专注于图像和视频等媒体的创新,推进生成式深度学习模型的发展。根据官网消息,文生图只是一个开始,后续还将发布视频生成模型,准备和 Sora 和 Gen-3 等产品过招。Black Forest Labs 的核心信念是,让文生图模型开源,促进研究界和学术界的创新与合作,并且提高透明度。11.交易金额6.88亿美元,两大 AI 制药公司 Recursion Pharmaceuticals 和 Exscientia合并两家公司在2021年上市时都凭借旨在解决长期药物开发挑战的技术筹集了数亿美元。然而,自首次公开募股以来,两家公司的股价都下跌了约80%。现在,Recursion 和 Exscientia 认为,合并双方的能力是最好的选择。新公司将保留 Recursion 的名称,Recursion 现有股东最终将持有约74%的股份,其余26%由 Exscientia 股东持有。新公司将设在盐湖城,并在纳斯达克交易。Recursion 首席执行官 Chris Gibson 将保留最高职位,而 Exscientia 的临时首席执行官 David Hallett 将担任首席科学官。合并后的公司将拥有8.5亿美元现金,并在未来18个月内推出10项临床读数。新公司表示,Recursion 和 Exscientia 目前签署的合作伙伴关系可能在未来两年内产生约2亿美元的里程碑付款,在收取潜在特许权使用费(介于中位数至两位数)之前,总收入将超过200亿美元。两家公司还预计通过运营“协同效应”每年节省约1亿美元。两家公司尚未正式披露交易金额,但据路透社报道称交易金额为6.88亿美元。合并交易完成后,Exscientia 董事会的两名未透露姓名的董事将加入 Recursion 董事会,预计合并交易将于2025年初完成,但须满足惯例成交条件,包括 Exscientia 股东的批准、Recursion 股东的批准、英格兰和威尔士高等法院的批准以及监管部门的批准。12. 14家科技巨头牵头组建“安全人工智能联盟”
7月中旬召开的阿斯彭安全论坛(Aspen Security Forum)会议中,谷歌、微软、亚马逊、英特尔、英伟达、IBM、思科、Paypal、OpenAI、Anthropic、Cohere、Chainguard、WIZ、GenLab 等14家科技巨头,宣布联合组建安全人工智能联盟(Coalition for Secure Al,CoSAl)。CoSAI 由 OASIS 全球标准机构主办,是一项开源计划,旨在为所有 AI 从业人员和开发人员提供创建设计安全人工智能系统所需的指导和工具。作为一个开源计划,CoSAI 将为全球 AI 从业者和开发者提供创建设计安全人工智能系统所需的指导和工具。联盟成员将共享开源方法、标准化框架和工具等,共同推动 AI 技术的安全发展。(文中部分图片来源于网络,如有侵权请告知删除)
1.https://www.theverge.com/2024/7/11/24196769/copied-act-cantwell-blackburn-heinrich-ai-journalists-artists
2.https://www.google.com/url?sa=t&source=web&rct=j&opi=89978449&url=https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/&ved=2ahUKEwiQlZek8-6HAxVarlYBHQ-JJh8QFnoECBoQAQ&usg=AOvVaw3w3u15w3jM-tD6VARv5RXm
3.https://www.nature.com/articles/s41392-023-01507-3
4.https://www.nature.com/articles/s41586-022-05094-1
5.https://blogs.nvidia.com/blog/mistral-nvidia-ai-model/
6.https://www.computerworld.com/article/3484668/openai-releases-new-version-of-gpt-4o-via-azure.html
深势科技是“AI for Science”科学研究范式的引领者和践行者。AI for Science 即运用 AI 学习一系列的科学原理和科学知识,并进一步解决科学研究和工业研发领域的关键问题。深势科技依托在交叉学科领域的深耕,构建了“深势 · 宇知®”AI for Science 大模型体系,将众多学科的科研方法从“实验试错 / 计算机”时代带入了“预训练模型时代”,并以“微尺度工业设计与仿真”为切入点,打造了Bohrium® 玻尔®科研空间站、Hermite® 药物计算设计平台、RiDYMO® 难成药靶标研发平台及 Piloteye® 电池设计自动化平台等科研和工业研发基础设施,形成了 AI for Science 的“创新-落地”链路和开放生态,赋能“千行百业”,为人类经济发展最基础的生物医药、能源、材料和信息科学与工程研究打造新一代工业设计与仿真系统。深势科技是国家高新技术企业、国家专精特新“小巨人”企业,在北京、上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、 物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中博士及博士后在公司成员中占比超过 35%。核心成员获得过2020年全球高性能计算领域的最高奖项“戈登贝尔奖”,相关工作入选2020年中国十大科技进展和全球 AI 领域十大技术突破。