AI观察20240622：GPT5延期？Cloudflare与苹果PCC

文摘科技 2024-06-22 14:39 上海

关注共识粉碎机，获取历史讨论会纪要

公众号会定期更新一些对AI行业的看法，内容会较久谦小程序和PC论坛平台延迟发送一周时间，如果对详细内容感兴趣就点击下文的久谦销售同事进行试用或采购。

1 GPT5延期？

OpenAI的名义CTO Mira在最新的访谈中提到：

GPT3是Toddler-level的智力水平，GPT4更像是聪明的高中生智力水平。
在一年半后，我们会有一个能在Specific Tasks上达到PhD-level智力水平的大模型。

视频最早在周四发出来，在周五Twitter和中文自媒体开始讨论，并且理解为“GPT5将在一年半后发布”。大家可以查阅原视频，Mira在整个讨论中都没有提过GPT5，也只是提到一年半后会有一个PhD-level的模型。

OpenAI在流程上实际的CTO是Greg，但Greg更喜欢编程而不是管理，所以有了Mira任职目前的CTO的工作。但Mira本身的职能主要在负责Enterprise大客户，不负责目前的模型训练，这也造成了Mira在很多外部沟通中都出现了模棱两可的回答，包括上次提到“OpenAI实验室内的模型没有比外部更加先进”，再往前回溯还有类似的回答。

目前我们了解到的情况，下一代模型的参数量和训练数据量都在GPT4级别的5-10倍，同时会加强多模态和复杂任务的reasoning。传统训练模型方法，在小模型上做足够的ablation实验，然后到大模型上尝试的方法，在这么强大的下一代模型面前，有一定失效，因此很多实验需要在大模型上直接跑，需要的算力资源是巨大的。同时，这么强大的和复杂的模型，如何做post-train和alignment也非常复杂，需要大量的算力资源。

OpenAI的超大集群互联可能还是有一定挑战，仍然是2-3个集群进行互联，而不是一个10万+的大集群。这样在实验和训练的效率上都会受到影响，跨集群训练的问题在于集群间的传输速度和集群内的传输速度不一样（集群间一般只有集群内的1/3或者更低的传输速度）。导致集群间的传输调度策略要保证各种协同、一致变得非常复杂，而参数量大的模型的训练本身数据传输就非常多，协同要求也非常高

比如，有的实验或者pretrain，如果只跑了一半或者1/3，可能并不能看出来最后的结果如何。因此，OpenAI也需要更多的时间和计算资源，来调配出（炼丹）最优的pretrain和posttrain的recipe。

这也是为什么Elon Musk会很激进的提到XAI今年就要做出来10万卡集群，未来想要30万卡+的B卡集群。因为下一代B卡的互联性能有很大的提升，能够极大的帮助后进者来提升实验的效率和速度，追赶OpenAI。

尽管目前仍然有工程问题，但随着更大互联集群的迅速落地，大部分问题都会很快解决。

2 苹果PCC对Cloudflare的带动

Apple在 Apple Intelligence的安全方案PCC中披露网络层会使用一家三方服务商来确保客户隐私数据传输的安全性。

这里提的3rd party的OHTTP的服务商大概率是说的Cloudflare。因为Apple从2022年开始和Cloudflare合作，iCloud Private Relay。主要目的是iCloud 通过Cloudflare的出栈代理系统，进行IP、位置信息及其他可能涉及隐私数据的隐藏和加密，确保处理用户数据的任何一方都无法获得有关用户身份以及他们尝试访问的内容的完整信息。

这种合作大概率延申到PCC，解决PCC对外的网络传输层对于外部服务器的访问的问题。主要的底层技术方案是OHTTP(Oblivious HTTP,详细介绍见后文)。该项技术最主要是实现了端到端加密。

趋势：Cloudflare于2022年推出这个方案。是行业中推出比较早的商业化方案的公司，主要合作伙伴是Apple。Fastly于2023年推出，主要合作伙伴是Google，主要应用场景是device通过Chrome浏览器对外部的访问。

后续影响：

1.对Cloudflare的收入影响：

如果Apple Intelligence 的推广较为顺利的话，通过PCC的request会带来一些增量。

因为不确定Cloudflare在这个方案中的位置：request per day(手机每天每用户request 大约在1,000量级) X Total number of users(200M，假设Apple Intelligence能占Apple用户的~20%) X OHTTP单价（$0.01/10K requests, OHTTP会比一般的HTTP访问 $0.0075/10K贵一些，假设贵30%) X discount(70%，Apple作为大客户) X 天数（365）= $50M/year的增量，占Cloudflare年收入（23年，$1.3B）的4%

2.对广告行业的影响：通过这套方案，外部基本上获得不了用户specific的信息，通过外部大模型进行用户specific广告的路径基本上无法实现。

OHTTP介绍（选自Cloudflare官方网站）：

端到端加密的请求和响应通过中继在客户端和服务器之间转发，将谁与发送的内容分离。这是一种常见的模式，Oblivious DoH和Apple Private Relay等部署的技术证明了这一点

应用程序使用 OHTTP 来确保请求不会链接到以下任一项(Stronger than a promise: proving Oblivious HTTP privacy properties (cloudflare.com))：

1.客户端标识信息，包括 IP 地址、TLS（Transport Layer Security，TLS，TLS 的主要用例是对 web 应用程序和服务器之间的通信（例如，web 浏览器加载网站）进行加密。）指纹等。作为代理协议，这是一项基本要求。

2.来自同一客户端的未来请求。这对于不跨请求携带状态的应用程序是必需的。

这两个属性使 OHTTP 非常适合希望在不影响基本功能的情况下为用户提供隐私的应用程序。

值得注意的是，这两个属性都可以通过面向连接的协议来实现，但代价是客户端希望传输的每条消息都有一个新的端到端 TLS 连接。对于参与该协议的所有实体来说，这可能非常昂贵（2022年的时候）

技术架构：

客户端->Server

从请求封装开始，混合公钥加密。客户端首先将其 HTTP 请求转换为二进制格式，称为二进制 HTTP，由 RFC9292 指定。此表示形式允许客户端将 HTTP 请求编码为二进制编码值，并允许网关反转此过程，从二进制编码值中恢复 HTTP 请求。二进制编码是必需的，因为公钥加密层需要二进制编码的输入。

一旦HTTP请求被编码为二进制格式，它就会被馈送到HPKE中以生成加密消息，然后客户端将其发送到中继以转发到网关。网关解密此消息，将二进制编码的请求转换回其等效的 HTTP 请求，然后将其转发到目标服务器进行处理。

Server->客户端：加密

来自网关的响应以非常相似的方式封装回客户端。网关首先将响应编码为等效的二进制 HTTP 消息，使用只有客户端和网关知道的对称密钥对其进行加密，然后将其返回到中继以转发到客户端。客户端解密并转换此消息以恢复结果。

可能的影响：

1.Apple的request 和 traffic很大的话对Cloudflare是个利好，但单独看苹果没那么大

2.如果苹果外，还有其他手机厂商采用类似PCC的方法呢？

3.通过大模型的个性化广告无法实现

我们正在发售两篇报告，其内容是：

互联技术以及未来发展趋势（本周可约路演）
北美算力租赁厂商近况及供需平衡情况（本周可约路演）

尚有三篇报告正在调研中，其内容是：

美国数据中心与电力情况
AI客服的进展与影响
AI手机以及Personal Agent场景

在过去的三个月个月，我们已经发售了三篇报告：

算力需求场景测算
AI与GPU在META中的应用
微软Copilot进展、GenAI售卖场景以及如何影响公有云选择

除了报告外，我们也承接定制化的投研需求。

对报告感兴趣，有定制化投研需求，或者对我们的日常调研纪要（每月超过50篇AI调研纪要）感兴趣的请联系下面的久谦销售同事：

大模型未来三年的十个假设

Data Infra：大模型决战前夜

http://mp.weixin.qq.com/s?__biz=MzI2MTM2MTgxNQ==&mid=2247486980&idx=1&sn=4fe2b329aa0216ba649b7e4ec71439dd

共识粉碎机

寻找与共识的不同

最新文章

怎么才能算准PLTR业绩？

能原谅MSFT与META的业绩吗？

Orion模型要发布了？Scaling Law不是到头了吗？

怎么总有这么低的算力租赁价格？

特斯拉的Scaling Law是什么？

如何在 AI 噪音中捕捉价值

线下讨论会报名：过去一年见过的最好大模型用例

微软CAPEX又砍了吗？

算力租赁崩了吗？

解密OpenAI高管集体离职与o1模型十问十答续

EP20 非常好的LLM保险销售案例(对谈暖哇)

AI到底是一种什么研究范式，不要用成熟产业的思维去套

揭秘全球顶尖大模型应用场景，一册在手，尽览AI应用的百科全书，全球顶尖科技公司共创！

我们和朋友们一起出了一本书

OpenAI o1模型十问十答

NV大涨与RL自己的Scaling Law

EP20 大模型保险Sales Agent直播预约

OpenAI联合创始人离职解密

EP19 长文本vsRAG(月之暗面对谈 Zilliz)

OpenAI到底亏了多少钱？

AI观察20240731：META、MSFT业绩点评

微软宕机：财报感冒又打了个喷嚏

这8位AI创业者的话，让你做AI的路上，少走几年弯路

AI观察20240724：META的LLM路径

EP18 呼叫中心与Voice Agent讨论纪要

CrowdStrike：仅次于“千年虫”的史诗网安事件

AI观察20240709：Scaling Law、Robotaxi、WAIC与应用

EP19 长文本 vs RAG讨论会（听听月之暗面对谈Zilliz）

AI产品榜｜2024 年 6 月共 37 个重要榜单，新增出海 APP 增长榜

AI观察20240625：NVDA在跌啥？OpenAI封禁中国影响

视频号|世纪佳猿出道啦

投研服务业务简介

AI转型咨询简介

Will's GenAI硬件榜 2024年6月

EP17 AI Coding以及对Coding软件的影响

AI观察20240622：GPT5延期？Cloudflare与苹果PCC

AI观察20240613：苹果，小模型批发时代

AI观察20240603：从AI应用季财报看到的

AI产品榜｜2024 年 5 月共 33 个重要榜单

AI观察20240527：MSFT Build，NV财报，SNOW安全危机

EP16 GPT4o对实时互动与RTC的影响

EP17 AI Coding以及对Coding软件影响讨论会报名

EP16 GPT4o后LLM的RTC需求讨论会报名

AI观察20240514：OpenAI、Google I/O、苹果

AI产品榜｜2024 年 4 月共 33 个重要榜单

AI研究共创邀请

AI产品榜｜2024年3月榜单，新增APP增长榜

Data Infra：大模型决战前夜

AI产品榜｜2024 年 2 月 33 个榜单，ChatGPT已经没在增长了

季度AI观察1Q24：贪吃蛇与俄罗斯方块

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉