全球最快 AI 推理解决方案：狂飙英伟达 20 倍

科技 2024-08-28 23:18 美国

🚀 全球最快 AI 推理解决方案

🌏 Anthropic 全面开放 Artifacts AI 功能

👥 英伟达推出 NIM Agent Blueprints 服务

🌐 智谱 AI 开放 GLM-4-Flash 大模型

🛡️ 人脸隐私保护新方案 FaceObfuscator

💻 夸克全新 PC 端发布

🤝 日本金融巨头 SBI 与芯片创企 PFN 组建联盟

📈 燧原科技公司估值超 160 亿元

🦟 比尔・盖茨借助 AI 技术对抗疟疾

全球最快 AI 推理解决方案

Cerebras Systems 公司宣布推出 Cerebras Inference，被标榜为全球最快的 AI 推理解决方案。Cerebras Inference 为 Llama 3.1 8B 模型提供每秒 1800 个 token 的处理速度，为 Llama 3.1 70B 模型提供每秒 450 个 token 的处理速度，速度是英伟达 GPU 方案的 20 倍。

Cerebras Inference 定价远低于流行的 GPU 云服务，起价为每百万个 token 10 美分，提供 100 倍的性价比。该方案采用 Cerebras CS-3 系统和 Wafer Scale Engine 3（WSE-3）AI 处理器，CS-3 的内存带宽是 Nvidia H100 的 7000 倍，有效解决了生成式 AI 的内存带宽技术挑战。Cerebras Inference 的推出为开放的大型语言模型（LLM）开发和部署设定了新标准，是唯一能同时提供高速训练和推理的解决方案。

Anthropic 全面开放 Artifacts AI 功能

AI 科技公司 Anthropic 宣布向所有 Claude 用户开放 Artifacts 功能，用户现可在 iOS 和安卓版的 Claude 应用中创建和浏览 Artifacts。Artifacts 相当于一个动态工作区，允许用户在与 Claude 对话时生成文档、代码、矢量图等，并实时查看和迭代作品。

Artifacts 功能于 2024 年 6 月推出预览版，截至目前用户已创建了数千万个 Artifacts。Artifacts 用户可一键点击应用，将成果展现在对话旁的专用窗口中，简化了工作流程，提高了团队成员间的沟通效率。

英伟达推出 NIM Agent Blueprints 服务

英伟达宣布联合全球合作伙伴，推出全新的 NIM Agent Blueprints 服务，帮助企业打造自己的 AI 体验。NIM Agent Blueprints 是一个预训练、定制 AI 工作流程的目录，提供一整套软件，使企业开发人员能够构建和部署生成式 AI 应用。通过 NIM Agent Blueprints，企业可以创建一个数据驱动的人工智能飞轮，实现持续优化和性能提升。

NIM Agent Blueprints 服务适用于多种典型用例，包括客户服务化身、检索增强生成、药物发现虚拟筛选等。开发人员可以利用一个或多个 AI Agent 来创建 AI 应用，服务提供基于 NVIDIA NeMo、NVIDIA NIM 和合作伙伴微服务构建的示例应用。提供 Helm 图表等工具，便于企业在加速数据中心和云中部署生成式 AI 应用，企业可以使用自己的业务数据对 NIM Agent Blueprints 进行修改，并根据用户反馈不断完善 AI 应用。

智谱 AI 开放 GLM-4-Flash 大模型

智谱 AI 宣布其 GLM-4-Flash 大模型^[1]现在免费开放给公众使用，通过智谱 AI 大模型开放平台可以进行调用。GLM-4-Flash 大模型专为简单垂直任务、低成本需求和快速响应设计，生成速度快，达到 72.14 token/s，约合 115 字符/s。

GLM-4-Flash 大模型支持多轮对话、网页浏览、函数调用和长文本推理（最大支持 128K 上下文），支持包括中文、英语、日语、韩语、德语等 26 种语言。采用自适应权重量化、多种并行化方式、批处理策略和投机采样等技术，降低模型延迟，提升推理速度，实现了更大的并发量和吞吐量，提高了效率，降低了成本。

人脸隐私保护新方案 FaceObfuscator

为了应对人脸识别系统中的人脸特征重构隐私威胁，浙江大学与阿里安全部共同研发了一种新型人脸隐私保护方案——FaceObfuscator^[2]。FaceObfuscator 通过筛选频域通道删除人脸图像中的冗余视觉信息，并引入随机性干扰，有效抵御重构攻击，服务端通过逆变换移除随机性，保持人脸识别的准确性。

FaceObfuscator 在六个公开人脸数据集上进行了测试，实验结果表明，其无法被重构为人脸图像，有效保护了人脸隐，在 COS（余弦相似度）和 SRRA（重放攻击成功率）指标上表现优异，显著降低了重构攻击的成功率。FaceObfuscator 可广泛应用于监控识别、刷脸支付、门禁考勤等场景，服务于安防、金融、教育等多个关键行业领域，助力解决人脸隐私安全问题。

夸克全新 PC 端发布

阿里智能信息事业群旗下的夸克发布了全新 PC 端，通过系统级全场景 AI 能力，将普通电脑升级为 AI 电脑，提供一站式信息检索、创作和总结服务。

AI 搜索、AI 写作、AI PPT、AI 文件总结等功能全面升级，大幅提升信息处理效率。夸克 AI 回答速度和准确性行业领先，三栏式界面设计清晰展现信息，随时随地通过快捷键调用 AI 功能，简化搜索、解读、翻译等操作，右键点击文档即可总结关键信息，转换文档格式。

日本金融巨头 SBI 与芯片创企 PFN 组建联盟

日本 AI 芯片领域的 "独角兽" 企业 Preferred Networks（PFN）与金融巨头 SBI Holdings 宣布，就 PFN 下一代 AI 半导体的开发和产品化组建资本和商业联盟，双方计划联合研发 PFN 的下一代 AI 半导体，并合作推动芯片的产品化，将在芯片的封装测试流程中展开合作。

SBI 集团计划通过 SBI Holdings 向 PFN 投资，投资额至多 100 亿日元（约合 4.94 亿元人民币），投资将在 2024 年 9 月底前完成。PFN 的下一代 AI 芯片预计将采用三星电子的 2nm 工艺和 I-Cube S 先进封装技术生产 AI 加速器。

燧原科技公司估值超 160 亿元

中国 AI 芯片行业的领军企业燧原科技已正式启动 IPO 上市辅导，有望成为科创板上第二家 AI 算力设计公司。腾讯是燧原科技的单一大股东，持股 20.4944%，赵立东、张亚林通过直接和间接持股，合计控制公司 32.5087% 的表决权。

燧原科技成立于 2018 年 3 月，聚焦于 AI 算力产品，发布了两代训练和推理产品，涵盖芯片、板卡、智算一体机、液冷算力集群以及配套的软件系统，拥有全方位的原始创新研发能力，是国内 AI 算力领域头部企业。燧原科技拥有 20 多个互联网客户，50 多个泛客户，超过 500 个落地场景，覆盖金融、互联网、AI 大模型等诸多领域。

比尔・盖茨借助 AI 技术对抗疟疾

微软创始人比尔・盖茨宣布，在利用计算机视觉技术对抗疟疾方面取得了显著进展。盖茨在其博客文章中介绍了 VectorCam，这是一款能够快速识别蚊子种类的应用程序，由约翰霍普金斯大学的 Sumiya Achariya 博士及其团队开发。除了 VectorCam，盖茨还提到了 HumBug，这是一种根据蚊子翅膀拍打的声音来识别蚊子种类的技术，尽管仍处于早期开发阶段，但有望实现自动连续监测。

VectorCam 得到了盖茨基金会和乌干达疟疾控制计划的支持，能够通过智能手机和廉价镜头在几秒内区分蚊子的种类、性别，并评估其是否吸血或产卵。VectorCam 简化了蚊子数据收集、识别和报告的过程，使当地卫生工作者能够更高效地参与监测工作，让防病人员专注于更广泛的战略任务。

盖茨认为，尽管识别蚊子种类至关重要，但为了消灭疟疾，还需要开发更好的工具。他对这些创新技术持乐观态度，并相信它们将帮助世界更接近消灭疟疾的目标。

我们来到世上就是为了寻找答案。不是说你一定会找到，但你一定要努力去找找看。

——《我离开以后》

编辑团队

编辑：Yuki

设计：Ivan

商务合作请加微信：Rwkfbcianvd

参考资料

[1]

GLM-4-Flash 大模型: https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash

[2]

FaceObfuscator: https://www.usenix.org/conference/usenixsecurity24/presentation/jin-shuaifan

十字路口Crossing

AI 正在给各行各业带来改变，我们在「十字路口」关注变革与机会，寻找、访谈和凝聚 AI 时代的「积极行动者」，和他们一起，探索和拥抱，新变化，新的可能性。「十字路口」是乔布斯形容苹果公司站在科技与人文的十字路口，伟大的产品往往诞生在这里。

最新文章

致AI创业者：2025年，去找这些VC拿融资｜与「暗涌」刘旌复盘一级市场这一年

Devin 对决 Cursor：500美元/月的AI编程工具真的值吗？

字节在跳动，阿里在躁动，AI六小龙被震动｜与「晚点」复盘大模型这一年的激战

「让我们快速到达下一个失败」：AI 时代的增长黑客修炼指南 | 对话王博龙

盘点2024年中国AI领域的创新：从模型到硬件，从应用到越来越多的超级个体

实践Global PMF，打造高效SEO与社媒营销增长体系｜Linkloud Workshop第三期招生

AI 在中国④: “我的面试官不是人？不是人！” | 对谈梁公军：海纳 AI 创始人

十字路口 x Abotify x a16z: 一起在北大斯坦福中心聊聊1000天后的AI世界 | 北京线下聚会

这绝对是你想不到的 2024 年 AI 领域 Top 10｜对谈「赛博禅心」主理人大聪明

找到 PMF 的两位创始人，为什么还在焦虑？| 对谈集思科技、Talk AI

“科技领域最被低估的壁垒是品牌” | 访谈Daniel Gross - 硅谷顶尖的创业者和VC

NotebookLM刷屏后，我们总结了10个用法并重新回答一个老问题：AI如何影响内容？

重回美元 VC，是 1949 年加入国军吗？|对谈孟醒：五源资本新合伙人

AI 设计师指南：我是谁，从哪来，到哪去？| 对谈 Pozzo 与赵晨

AI 在中国②：“10 亿规模的公司了，AI 帮我们收入再涨了 30%” | 暖哇科技与百药师的案例实践与启示

你要一起去日本吗？| Linkloud 先锋加速营第九期招募

在北京，一起聊聊 AI 如何看见爱恨情仇？

AI 在硅谷：热火朝天，沸沸腾腾 | 对谈硅谷徐老师和 Beta University 创始人云飞

在上海，看见硅谷 | 本周六的 toC AI App 聚会，来吗？

AI时代，硬件的现实与狂想｜和怒喵科技李楠聊硬件、营销、硅谷和改变人生的经历

从 Cursor 刷屏说起：为什么 AI Coding 是一个巨大的机遇？

AI工程师指南：我是谁，从哪来，到哪去？｜对谈硅基流动创始人袁进辉与独立开发者idoubi

Y Combinator S24 终于公布了！这次又投了哪些牛逼初创公司？

Runway AI 删除开源模型引关注 | ChatGPT 周活用户破 2 亿 | 阿里重磅开源多模态模型 Qwen2-VL

Midjourney进军硬件领域 | 谷歌推出首个AI游戏引擎 GameNGen

全球最快 AI 推理解决方案：狂飙英伟达 20 倍

爆苹果将推出桌面机器人和 AI 驱动的 iPhone

Meta AI 推出 Transfusion 新方法 | 腾讯游戏推出AI队友 | 日报

「AI把整个硅谷都改变了」｜和前500Startups中国负责人马睿聊SaaS AI 创业、硅谷投资

诗和远方的生活，怎么 AI 先过上了？

「六块腹肌」不是梦： AI 让你美梦成真

a16z发布全球 Top 100 AI 应用榜单，字节跳动大放异彩，约会应用和跨模态应用崛起

“为什么AI Super App还没出现?“ | 十点思考、一道曙光

泡茶、摊饼、咏春拳，AI机器人比我还会养老啊

英伟达也算立功了：助力《黑神话：悟空》

AI在中国：10个企业落地案例带来的商业启示 | 对谈任鑫：AI创业者、投资人

这个AI搜索引擎吸引 1.2 万付费用户，融了1100万美元

今天，我要邀请1万个年轻人用AI写遗嘱

AI产品经理指南：我是谁，从哪来，到哪去｜对谈字节AI产品负责人Vanessa，面试了100位AI产品经理后的心得总结

快手发布新 AI 产品「飞船」，能起飞吗？

李沐：“创业就是想逆天改命，想什么退路呢？”

“有了AI，我要让投资像刷抖音一样简单” | 对谈 RockFlow创始人Vakee

谷歌造了个会打乒乓的机器人，有点猛

第一批90后，已经开始用AI解决爱恨情仇的烦恼了

马斯克又要搞事情？挑战GPT-5的「Grok 2」蓄势待发

“公关稿已死，长播客当道” | 雷军和 Elon Musk的共同选择

Palantir：隐秘的数据分析巨头如何在GenAI时代成功

“就这样被你征服” | 400 万人，被 AI 骂到溃不成军、哭笑不得、却欲罢不能

“创业者最懂创业者”——在黄金时代的十字路口，相遇、交流和决策。

第一批机器人，已经在宝马工厂打工了

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉