1.GPT-4o 发布,语音交互响应速度达到人类水平近期,GPT-4o 的发布再次燃起了用户对未来 AI生活方式的期待。GPT-4o 拥有更强大的推理能力、更低的价格、更原生的视觉能力,并且展现了惊艳的语音交互能力。语音交互的核心指标是响应速度,传统技术路线需要模型听到语音后,解析成文字,推理出回应的文字,然后合成语音,整个过程时间较长。例如 GPT3.5/4 的响应速度约为3~5秒。虽然详细的技术细节还未批量,但业界普遍认为,OpenAI 成功实现了“语音->语言”的直接训练,从而大幅降低了响应时间,达到平均300毫秒的人类级别,带来了惊艳的产品体验。
值得注意的是,在 GPT-4o 的可选声音中,有一个声音近似明星 Scarlett Johansson(经典AI题材电影 《Her》的主演)。这再次引发了人们对 AI 侵权问题的讨论。目前 OpenAI 已经下架该声音。2.字节开启国内大语言模型“价格战”
5月15日,字节跳动正式对外发布"豆包大模型",称目前豆包大模型日均处理1200亿 Tokens 文本,生成3000万张图片。发布会重点披露了豆包大模型的价格——豆包主力模型在企业市场的定价为0.0008元/千Tokens(即0.8厘的价格可处理1500多个汉字)较行业平均价格便宜99.3%。市面上同规格模型的定价一般为0.12元/千Tokens,是豆包模型价格的150倍。
在字节宣布价格后,其他厂商快速跟进。5月21日,阿里云宣布通义千问主力模型 Qwen-Long 的 API 输入价格从0.02元/千Tokens降至0.0005元/千Tokens(比字节的0.0008元/千Tokens还要便宜0.0003),直降97%;百度则直接宣布旗下两个主力大模型 ERNIE Speed、ERNIE Lite,“免费,立即生效”。
去年 OpenAI 的内部剧变后,Ilya 长期没有出现在公众视野中,围绕其未来动向的猜测从未停止。近日,Ilya 在公开社交媒体宣布辞职。随后,多名 OpenAI 人员接连辞职。OpenAI 宣布解散 Ilya 领导的 supperalignment 团队。OpenAI 称将该团队成员分布到各个团队里更有助于其整体的安全策略。xAI 公司宣布获得60亿美元的B轮融资,投资人包括红杉、富达、a16z 等。xAI 公司在过去一年取得了显著进展,包括发布了 Grok-1 模型以及改进的 Grok-1.5 模型,并开源了 Grok-1 模型。xAI 公司将继续在未来几个月内推出多个令人兴奋的技术更新和产品。这轮融资的资金将用于将 xAI 的第一批产品推向市场、构建先进的基础设施,以及加快未来技术的研发。xAI 公司主要专注于开发具有真实,合格和最大效益的先进 AI 系统,以利益全人类。该公司的使命是理解宇宙的真正本质。
1.中国科学家绘制了目前最清晰的月球地图
中国科学院发布了迄今为止分辨率最高的月球地质图册。这本《Geologic Atlas of the Lunar Globe》详细显示了12,341个陨石坑、81个盆地和17种岩石类型,以及月球表面的其他基本地质信息。该地图的比例尺达到了前所未有的1:2,500,000。中国将利用这些地图来支持其月球探测计划,研究人员表示,这些地图也将对其他国家的月球任务有所帮助。2.物理学家和期刊编辑齐聚匹兹堡,热议“学术不端”等问题
最近的几起丑闻让物理学界担忧其声誉和未来。过去五年内,多篇关于量子计算和超导研究的突破性论文被撤回,原因是其他研究人员无法重复这些结果。一个典型例子是罗切斯特大学的 Ranga Dias 团队,他们在2023年宣称发明了首个室温超导体,但独立调查发现其数据造假,导致论文被撤回。
在匹兹堡的一次会议上(International Conference on Reproducibility in Condensed Matter Physics),约50位物理学家和编辑探讨了改进数据共享和审查流程的方法,以提高研究的可靠性和可信度。科学家们强调,缺乏可重复性会浪费资源和时间,呼吁建立更严格的数据共享和审查机制。期刊编辑则指出,撤稿并非总是负面,有时是为了纠正错误,并提倡通过标准化的审查程序和更透明的数据共享来提高研究的质量。会议还提出了具体的改进建议,包括如何推动研究界积极看待数据共享。据 Nature 报道,仅2023年就有1万篇论文被撤回,为历史最高。1.超越蛋白,AlphaFold3 可预测“全类型”生物分子;限制使用引发争议
AlphaFold 是一个由 DeepMind 开发的深度学习模型,旨在解决蛋白质折叠问题。蛋白质折叠是指将一条长长的氨基酸链折叠成特定的三维结构,这个过程对蛋白质的功能至关重要。AlphaFold 通过分析蛋白质序列之间的共进化信息,结合先进的深度学习技术,能够高精度地预测蛋白质的三维结构。近日,AlphaFold 更新至第三代。AlphaFold3 和 AlphaFold2 的主要区别在于预测能力和技术路线。AlphaFold2 主要用于预测蛋白质的三维结构,而 AlphaFold3 引入了扩散模型,使其能够处理更广泛的生物分子场景,包括核酸、离子和分子对接等。这种扩展的通用性很大程度上归功于扩散模型的灵活性和强大能力。通过扩散模型,AlphaFold3 能够从随机初始状态逐步生成复杂的生物分子结构,结合已知的序列信息,极大地提高了预测的准确性和适用范围。因此,AlphaFold3 不仅在蛋白质折叠预测上表现优异,还能适应更多类型的生物分子结构预测需求。
值得注意的是,AlphaFold3 在发布后引发了学界的不小争议,主要集中在其代码未公开的问题。与前一代 AlphaFold2 不同,AlphaFold3 仅提供了详细的伪代码说明,而不是完整的源代码。这引起了科学家的不满。他们认为这违背了科学进步的原则,因为缺乏代码使得难以评估和改进模型。尽管 DeepMind 承诺年底前发布代码,研究人员已开始开发自己的开源版本 AlphaFold3。OpenFold 团队和其他科学家希望创建不受限制的模型,并能够重训练以改进蛋白质与潜在药物分子之间的相互作用预测。2. 美国总统科技顾问委员会发表报告《加速科研:以 AI 之力解决全球挑战》
这份报告由总统科技顾问委员会(PCAST)呈递给美国总统乔·拜登,探讨了人工智能(AI)在科学研究中的潜力及其对解决全球性挑战的影响。报告强调了 AI 将彻底改变科学研究的方式,推动材料发现、半导体设计、气候变化研究、人类行为研究、生命科学等领域的重大进展。PCAST 认为,通过共享基础 AI 资源、采用负责任的 AI 使用原则以及增强科学家的能力,美国能够充分利用 AI 的潜力,加速科学发现和技术进步,以应对全球和社会挑战。
报告还指出,尽管 AI 有巨大的潜力,但其应用也面临许多挑战,包括数据偏见、计算能耗、错误科学的生成风险以及被恶意使用的可能性。因此,报告建议需要加强对 AI 的监督,建立负责任的使用文化,并推动 AI 资源的广泛和公平共享,以实现科学研究的民主化。3.科学家首次以纳米分辨率绘制了大脑的结构
A range of histological features in 1 mm3 of human brain were rendered, including neuropil (A) and its segmentation (B) at nanometer resolution, annotated synapses (C), excitatory neurons (D), inhibitory neurons (E), astrocytes (F), oligodendrocytes (G), myelin (H), and blood vessels (I). A previously unrecognized neuronal class (J) and multisynaptic connections (K) were also identified.
科学家们近日绘制了一小块人脑的精细三维地图,并在《科学》杂志上发表。这张细胞图谱揭示了神经元之间的新连接模式、细胞自身缠绕形成的结,以及几乎互为镜像的一对神经元。这张3D地图覆盖了大约一立方毫米的体积,包含约57,000个细胞和1.5亿个突触,数据量达到1.4PB。样本来自一位45岁女性癫痫患者的大脑皮层,通过电子显微镜成像,借助人工智能模型拼接重建。研究发现了一些非传统神经元和镜像神经元,进一步研究这些特征可能有助于理解大脑的工作机制以及治疗精神和神经退行性疾病。在四月,《三体》电视剧的科学顾问:一位行星科学家和一位纳米技术专家对这部热门的 Netflix 剧集进行了评审。大多数参与投票的读者认为,专家的建议有助于制作更好的科幻作品,而不会限制创作自由。
尽管读者觉得科幻是展现不可能或不现实概念的场景,但看到真实科学被糟糕地描绘出来会让很多人感到不适。植物生物学家 Bart Janssen 表示:“糟糕的科学会让观众‘出戏’,而一旦发生这种情况,就很难重新投入。”
反过来,这也引出了一个问题,是否科学家也应该有创意顾问来帮助他们?
(文中部分图片来源于网络,如有侵权请告知删除)
Chief Editor: Shef
Editor: Wendy
https://openai.com/index/hello-gpt-4o/
https://www.cnbc.com/2024/05/17/openai-superalignment-sutskever-leike.htmlhttps://x.ai/blog/series-bhttps://m.yicai.com/news/102111441.html ;https://36kr.com/p/2785713415603072https://www.technologyreview.com/2024/05/15/1092535/a-wave-of-retractions-is-shaking-physics ; https://www.nature.com/articles/d41586-023-03974-8https://english.cas.cn/newsroom/cas_media/202404/t20240422_660730.shtmlhttps://www.isomorphiclabs.com/articles/alphafold-3-predicts-the-structure-and-interactions-of-all-of-lifes-molecules ; https://www.nature.com/articles/d41586-024-01555-xhttps://www.whitehouse.gov/wp-content/uploads/2024/04/AI-Report_Upload_29APRIL2024_SEND-2.pdfhttps://www.nature.com/articles/d41586-024-01387-9https://www.nature.com/articles/d41586-024-01272-5深势科技是“AI for Science”科学研究范式的引领者和践行者。AI for Science 即运用 AI 学习一系列的科学原理和科学知识,并进一步解决科学研究和工业研发领域的关键问题。深势科技依托在交叉学科领域的深耕,构建了“深势 · 宇知®”AI for Science 大模型体系,将众多学科的科研方法从“实验试错 / 计算机”时代带入了“预训练模型时代”,并以“微尺度工业设计与仿真”为切入点,打造了Bohrium® 玻尔®科研空间站、Hermite® 药物计算设计平台、RiDYMO® 难成药靶标研发平台及 Piloteye® 电池设计自动化平台等科研和工业研发基础设施,形成了 AI for Science 的“创新-落地”链路和开放生态,赋能“千行百业”,为人类经济发展最基础的生物医药、能源、材料和信息科学与工程研究打造新一代工业设计与仿真系统。深势科技是国家高新技术企业、国家专精特新“小巨人”企业,在北京、上海、深圳等城市布局研发中心。科研技术团队由中国科学院院士领衔,汇集了超百位数学、 物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中博士及博士后在公司成员中占比超过 35%。核心成员获得过2020年全球高性能计算领域的最高奖项“戈登贝尔奖”,相关工作入选2020年中国十大科技进展和全球 AI 领域十大技术突破。