🚀 全球最快 AI 推理解决方案
🌏 Anthropic 全面开放 Artifacts AI 功能
👥 英伟达推出 NIM Agent Blueprints 服务
🌐 智谱 AI 开放 GLM-4-Flash 大模型
🛡️ 人脸隐私保护新方案 FaceObfuscator
💻 夸克全新 PC 端发布
🤝 日本金融巨头 SBI 与芯片创企 PFN 组建联盟
📈 燧原科技公司估值超 160 亿元
🦟 比尔・盖茨借助 AI 技术对抗疟疾
全球最快 AI 推理解决方案
Cerebras Systems 公司宣布推出 Cerebras Inference,被标榜为全球最快的 AI 推理解决方案。Cerebras Inference 为 Llama 3.1 8B 模型提供每秒 1800 个 token 的处理速度,为 Llama 3.1 70B 模型提供每秒 450 个 token 的处理速度,速度是英伟达 GPU 方案的 20 倍。
Cerebras Inference 定价远低于流行的 GPU 云服务,起价为每百万个 token 10 美分,提供 100 倍的性价比。该方案采用 Cerebras CS-3 系统和 Wafer Scale Engine 3(WSE-3)AI 处理器,CS-3 的内存带宽是 Nvidia H100 的 7000 倍,有效解决了生成式 AI 的内存带宽技术挑战。Cerebras Inference 的推出为开放的大型语言模型(LLM)开发和部署设定了新标准,是唯一能同时提供高速训练和推理的解决方案。
Anthropic 全面开放 Artifacts AI 功能
AI 科技公司 Anthropic 宣布向所有 Claude 用户开放 Artifacts 功能,用户现可在 iOS 和安卓版的 Claude 应用中创建和浏览 Artifacts。Artifacts 相当于一个动态工作区,允许用户在与 Claude 对话时生成文档、代码、矢量图等,并实时查看和迭代作品。
Artifacts 功能于 2024 年 6 月推出预览版,截至目前用户已创建了数千万个 Artifacts。Artifacts 用户可一键点击应用,将成果展现在对话旁的专用窗口中,简化了工作流程,提高了团队成员间的沟通效率。
英伟达推出 NIM Agent Blueprints 服务
英伟达宣布联合全球合作伙伴,推出全新的 NIM Agent Blueprints 服务,帮助企业打造自己的 AI 体验。NIM Agent Blueprints 是一个预训练、定制 AI 工作流程的目录,提供一整套软件,使企业开发人员能够构建和部署生成式 AI 应用。通过 NIM Agent Blueprints,企业可以创建一个数据驱动的人工智能飞轮,实现持续优化和性能提升。
NIM Agent Blueprints 服务适用于多种典型用例,包括客户服务化身、检索增强生成、药物发现虚拟筛选等。开发人员可以利用一个或多个 AI Agent 来创建 AI 应用,服务提供基于 NVIDIA NeMo、NVIDIA NIM 和合作伙伴微服务构建的示例应用。提供 Helm 图表等工具,便于企业在加速数据中心和云中部署生成式 AI 应用,企业可以使用自己的业务数据对 NIM Agent Blueprints 进行修改,并根据用户反馈不断完善 AI 应用。
智谱 AI 开放 GLM-4-Flash 大模型
智谱 AI 宣布其 GLM-4-Flash 大模型[1]现在免费开放给公众使用,通过智谱 AI 大模型开放平台可以进行调用。GLM-4-Flash 大模型专为简单垂直任务、低成本需求和快速响应设计,生成速度快,达到 72.14 token/s,约合 115 字符/s。
GLM-4-Flash 大模型支持多轮对话、网页浏览、函数调用和长文本推理(最大支持 128K 上下文),支持包括中文、英语、日语、韩语、德语等 26 种语言。采用自适应权重量化、多种并行化方式、批处理策略和投机采样等技术,降低模型延迟,提升推理速度,实现了更大的并发量和吞吐量,提高了效率,降低了成本。
人脸隐私保护新方案 FaceObfuscator
为了应对人脸识别系统中的人脸特征重构隐私威胁,浙江大学与阿里安全部共同研发了一种新型人脸隐私保护方案——FaceObfuscator[2]。FaceObfuscator 通过筛选频域通道删除人脸图像中的冗余视觉信息,并引入随机性干扰,有效抵御重构攻击,服务端通过逆变换移除随机性,保持人脸识别的准确性。
FaceObfuscator 在六个公开人脸数据集上进行了测试,实验结果表明,其无法被重构为人脸图像,有效保护了人脸隐,在 COS(余弦相似度)和 SRRA(重放攻击成功率)指标上表现优异,显著降低了重构攻击的成功率。FaceObfuscator 可广泛应用于监控识别、刷脸支付、门禁考勤等场景,服务于安防、金融、教育等多个关键行业领域,助力解决人脸隐私安全问题。
夸克全新 PC 端发布
阿里智能信息事业群旗下的夸克发布了全新 PC 端,通过系统级全场景 AI 能力,将普通电脑升级为 AI 电脑,提供一站式信息检索、创作和总结服务。
AI 搜索、AI 写作、AI PPT、AI 文件总结等功能全面升级,大幅提升信息处理效率。夸克 AI 回答速度和准确性行业领先,三栏式界面设计清晰展现信息,随时随地通过快捷键调用 AI 功能,简化搜索、解读、翻译等操作,右键点击文档即可总结关键信息,转换文档格式。
日本金融巨头 SBI 与芯片创企 PFN 组建联盟
日本 AI 芯片领域的 "独角兽" 企业 Preferred Networks(PFN)与金融巨头 SBI Holdings 宣布,就 PFN 下一代 AI 半导体的开发和产品化组建资本和商业联盟,双方计划联合研发 PFN 的下一代 AI 半导体,并合作推动芯片的产品化,将在芯片的封装测试流程中展开合作。
SBI 集团计划通过 SBI Holdings 向 PFN 投资,投资额至多 100 亿日元(约合 4.94 亿元人民币),投资将在 2024 年 9 月底前完成。PFN 的下一代 AI 芯片预计将采用三星电子的 2nm 工艺和 I-Cube S 先进封装技术生产 AI 加速器。
燧原科技公司估值超 160 亿元
中国 AI 芯片行业的领军企业燧原科技已正式启动 IPO 上市辅导,有望成为科创板上第二家 AI 算力设计公司。腾讯是燧原科技的单一大股东,持股 20.4944%,赵立东、张亚林通过直接和间接持股,合计控制公司 32.5087% 的表决权。
燧原科技成立于 2018 年 3 月,聚焦于 AI 算力产品,发布了两代训练和推理产品,涵盖芯片、板卡、智算一体机、液冷算力集群以及配套的软件系统,拥有全方位的原始创新研发能力,是国内 AI 算力领域头部企业。燧原科技拥有 20 多个互联网客户,50 多个泛客户,超过 500 个落地场景,覆盖金融、互联网、AI 大模型等诸多领域。
比尔・盖茨借助 AI 技术对抗疟疾
微软创始人比尔・盖茨宣布,在利用计算机视觉技术对抗疟疾方面取得了显著进展。盖茨在其博客文章中介绍了 VectorCam,这是一款能够快速识别蚊子种类的应用程序,由约翰霍普金斯大学的 Sumiya Achariya 博士及其团队开发。除了 VectorCam,盖茨还提到了 HumBug,这是一种根据蚊子翅膀拍打的声音来识别蚊子种类的技术,尽管仍处于早期开发阶段,但有望实现自动连续监测。
VectorCam 得到了盖茨基金会和乌干达疟疾控制计划的支持,能够通过智能手机和廉价镜头在几秒内区分蚊子的种类、性别,并评估其是否吸血或产卵。VectorCam 简化了蚊子数据收集、识别和报告的过程,使当地卫生工作者能够更高效地参与监测工作,让防病人员专注于更广泛的战略任务。
盖茨认为,尽管识别蚊子种类至关重要,但为了消灭疟疾,还需要开发更好的工具。他对这些创新技术持乐观态度,并相信它们将帮助世界更接近消灭疟疾的目标。
我们来到世上就是为了寻找答案。不是说你一定会找到,但你一定要努力去找找看。
——《我离开以后》
编辑团队
编辑:Yuki
设计:Ivan
商务合作请加微信:Rwkfbcianvd
参考资料
GLM-4-Flash 大模型: https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash
FaceObfuscator: https://www.usenix.org/conference/usenixsecurity24/presentation/jin-shuaifan