公众号会定期更新一些对AI行业的看法,内容会较久谦小程序和PC论坛平台延迟发送一周时间,如果对详细内容感兴趣就点击下文的久谦销售同事进行试用或采购。
OpenAI的名义CTO Mira在最新的访谈中提到:
GPT3是Toddler-level的智力水平,GPT4更像是聪明的高中生智力水平。
在一年半后,我们会有一个能在Specific Tasks上达到PhD-level智力水平的大模型。
视频最早在周四发出来,在周五Twitter和中文自媒体开始讨论,并且理解为“GPT5将在一年半后发布”。大家可以查阅原视频,Mira在整个讨论中都没有提过GPT5,也只是提到一年半后会有一个PhD-level的模型。
OpenAI在流程上实际的CTO是Greg,但Greg更喜欢编程而不是管理,所以有了Mira任职目前的CTO的工作。但Mira本身的职能主要在负责Enterprise大客户,不负责目前的模型训练,这也造成了Mira在很多外部沟通中都出现了模棱两可的回答,包括上次提到“OpenAI实验室内的模型没有比外部更加先进”,再往前回溯还有类似的回答。
目前我们了解到的情况,下一代模型的参数量和训练数据量都在GPT4级别的5-10倍,同时会加强多模态和复杂任务的reasoning。传统训练模型方法,在小模型上做足够的ablation实验,然后到大模型上尝试的方法,在这么强大的下一代模型面前,有一定失效,因此很多实验需要在大模型上直接跑,需要的算力资源是巨大的。同时,这么强大的和复杂的模型,如何做post-train和alignment也非常复杂,需要大量的算力资源。
OpenAI的超大集群互联可能还是有一定挑战,仍然是2-3个集群进行互联,而不是一个10万+的大集群。这样在实验和训练的效率上都会受到影响,跨集群训练的问题在于集群间的传输速度和集群内的传输速度不一样(集群间一般只有集群内的1/3或者更低的传输速度)。导致集群间的传输调度策略要保证各种协同、一致变得非常复杂,而参数量大的模型的训练本身数据传输就非常多,协同要求也非常高
比如,有的实验或者pretrain,如果只跑了一半或者1/3,可能并不能看出来最后的结果如何。因此,OpenAI也需要更多的时间和计算资源,来调配出(炼丹)最优的pretrain和posttrain的recipe。
这也是为什么Elon Musk会很激进的提到XAI今年就要做出来10万卡集群,未来想要30万卡+的B卡集群。因为下一代B卡的互联性能有很大的提升,能够极大的帮助后进者来提升实验的效率和速度,追赶OpenAI。
尽管目前仍然有工程问题,但随着更大互联集群的迅速落地,大部分问题都会很快解决。
Apple在 Apple Intelligence的安全方案PCC中披露网络层会使用一家三方服务商来确保客户隐私数据传输的安全性。
这里提的3rd party的OHTTP的服务商大概率是说的Cloudflare。因为Apple从2022年开始和Cloudflare合作,iCloud Private Relay。主要目的是iCloud 通过Cloudflare的出栈代理系统,进行IP、位置信息及其他可能涉及隐私数据的隐藏和加密,确保处理用户数据的任何一方都无法获得有关用户身份以及他们尝试访问的内容的完整信息。
这种合作大概率延申到PCC,解决PCC对外的网络传输层对于外部服务器的访问的问题。主要的底层技术方案是OHTTP(Oblivious HTTP,详细介绍见后文)。该项技术最主要是实现了端到端加密。
趋势:Cloudflare于2022年推出这个方案。是行业中推出比较早的商业化方案的公司,主要合作伙伴是Apple。Fastly于2023年推出,主要合作伙伴是Google,主要应用场景是device通过Chrome浏览器对外部的访问。
后续影响:
1.对Cloudflare的收入影响:
如果Apple Intelligence 的推广较为顺利的话,通过PCC的request会带来一些增量。
因为不确定Cloudflare在这个方案中的位置:request per day(手机每天每用户request 大约在1,000量级) X Total number of users(200M,假设Apple Intelligence能占Apple用户的~20%) X OHTTP单价($0.01/10K requests, OHTTP会比一般的HTTP访问 $0.0075/10K贵一些,假设贵30%) X discount(70%,Apple作为大客户) X 天数(365)= $50M/year的增量,占Cloudflare年收入(23年,$1.3B)的4%
2.对广告行业的影响:通过这套方案,外部基本上获得不了用户specific的信息,通过外部大模型进行用户specific广告的路径基本上无法实现。
OHTTP介绍(选自Cloudflare官方网站):
端到端加密的请求和响应通过中继在客户端和服务器之间转发,将谁与发送的内容分离。这是一种常见的模式,Oblivious DoH和Apple Private Relay等部署的技术证明了这一点
应用程序使用 OHTTP 来确保请求不会链接到以下任一项(Stronger than a promise: proving Oblivious HTTP privacy properties (cloudflare.com)):
1.客户端标识信息,包括 IP 地址、TLS(Transport Layer Security,TLS,TLS 的主要用例是对 web 应用程序和服务器之间的通信(例如,web 浏览器加载网站)进行加密。) 指纹等。作为代理协议,这是一项基本要求。
2.来自同一客户端的未来请求。这对于不跨请求携带状态的应用程序是必需的。
这两个属性使 OHTTP 非常适合希望在不影响基本功能的情况下为用户提供隐私的应用程序。
值得注意的是,这两个属性都可以通过面向连接的协议来实现,但代价是客户端希望传输的每条消息都有一个新的端到端 TLS 连接。对于参与该协议的所有实体来说,这可能非常昂贵(2022年的时候)
技术架构:
客户端->Server
从请求封装开始,混合公钥加密。客户端首先将其 HTTP 请求转换为二进制格式,称为二进制 HTTP,由 RFC9292 指定。此表示形式允许客户端将 HTTP 请求编码为二进制编码值,并允许网关反转此过程,从二进制编码值中恢复 HTTP 请求。二进制编码是必需的,因为公钥加密层需要二进制编码的输入。
一旦HTTP请求被编码为二进制格式,它就会被馈送到HPKE中以生成加密消息,然后客户端将其发送到中继以转发到网关。网关解密此消息,将二进制编码的请求转换回其等效的 HTTP 请求,然后将其转发到目标服务器进行处理。
Server->客户端:加密
来自网关的响应以非常相似的方式封装回客户端。网关首先将响应编码为等效的二进制 HTTP 消息,使用只有客户端和网关知道的对称密钥对其进行加密,然后将其返回到中继以转发到客户端。客户端解密并转换此消息以恢复结果。
可能的影响:
1.Apple的request 和 traffic很大的话对Cloudflare是个利好,但单独看苹果没那么大
2.如果苹果外,还有其他手机厂商采用类似PCC的方法呢?
3.通过大模型的个性化广告无法实现
我们正在发售两篇报告,其内容是:
互联技术以及未来发展趋势(本周可约路演)
北美算力租赁厂商近况及供需平衡情况(本周可约路演)
尚有三篇报告正在调研中,其内容是:
美国数据中心与电力情况
AI客服的进展与影响
AI手机以及Personal Agent场景
在过去的三个月个月,我们已经发售了三篇报告:
算力需求场景测算
AI与GPU在META中的应用
微软Copilot进展、GenAI售卖场景以及如何影响公有云选择
除了报告外,我们也承接定制化的投研需求。
对报告感兴趣,有定制化投研需求,或者对我们的日常调研纪要(每月超过50篇AI调研纪要)感兴趣的请联系下面的久谦销售同事:
大模型未来三年的十个假设
Data Infra:大模型决战前夜