昨晚熬夜看了下OPEN AI的春季发布会,看完还是蛮兴奋的,本想熬夜写个点评,但是实在爬不起来,太仓促的写东西也容易思考的不全面,所以决定还是第二天早上起来再好好写一下。先放一张使用图片,证明是在深度体验后写的,体验才有发言权。
先放结论,2024-2025年,AI还会是A股和美股的共同主线,这次的发布会是春季发布会,说明至少还有个冬季发布会,AI的主线会贯穿全年。
其实4-5月份的AI市场,已经处于炒无可炒的状态,英伟达已经很贵了,现在很多人已经往电力上开始炒了。
中美之间的AI传到逻辑一帮是这样的:美国先发布一个技术,A股假想对标炒一波,中国实体企业跟进技术路线,A股消息党再吵一波,最后应用端都炒无可炒,沿着产业链最后再炒一波硬件,整个2023年就是这么玩的。这次OPEN AI的发布会,至少为未来3个月的市场走向指明了方向。
好了,接下来正式分二个部分,讲一讲这轮发布会对2024年AI投资的一些想法。仅为个人拙见,欢迎入群沟通讨论。
第一部分:GPT4o发布会简评
第一部分先跟大家聊聊这次的GPT的技术和革新,先放一个大的结论,GPT的开发方向明显发生了一个转弯,从追求准确性和功能性性的炫技向追求易用性和普惠性转型。
这次发布会的的革命性创新,主要体现在3个方面
1) 实时语音对话能力
实时,实时,实时,重要的事情要说三遍,大家可能觉得这不算啥,不值得重视,但是这点上我最有发言权,大家都知道,金叔我在2023年GPT3.0刚出来的时候,就用API做了一个GPT音响,还发布了DEMO,虽然是玩票性质的,但是也受到了身边小伙伴的好评,后续很多国内厂商也做了类似的东西,实际上毫无技术门槛,是通过Whisper 语音转文字,GPT-4 回复文字内容,TTS 生成对话语音来最终达成效果。但是这次GPT4o则是完全重新训练的,含文字、视觉、音频的端到端模型,也就是说所有输入和输出都由同一神经网络处理。
这两者最大的区别在于,我做的DEMO(包括国内目前99%人做的)都是把语音转成文字,然后让GPT识别文字,然后再输出文字。相当于聋子看书。
而这次GPTo是真的自己听语音,自己思考,自己回答,在反应速度和语音语调上于真人无异,这对实际应用端会产生巨大的影响,包括实时翻译,帮助盲人识别环境,视频会议,辅助面试,辅助语言学习、数学学习等方面。
投资机会点评:
声音软件:这第一波破天的富贵应该会撒到汤姆猫身上,但是实际上国内的能力并不能达到GPT的级别,但是AI语音陪伴,这块还是可以持续关注的。
GPT-4o 也许会是有史以来最强的 TTS 软件,也会是最后一个TTS软件,现在小说AI语音阅读功能大家可能都用过,十分的生硬,GPT出来之后,在声线和语气上都可以做模拟,目前国内做的最好的是阅文集团,但是跟GPT比也差远了,但是对网文来说绝对是巨大的好机会。不过对配音演员来说,有声书讲波来说可能日子就不好过了,最利好的应该是抖音和喜马拉雅,大幅度降低创作成本,但是奈何这两家都没上市。国人最喜欢简单的想象迁移。相关个股情况可以加星球索取
硬件:翻译机,辅助面试,盲人环境识别这块,可以很快的做封装硬件出来,科大讯飞,网易这些公司在这方面都有储备,我相信在OPEN AI指明方向之后,国内应该很快会有DMOE产品出来。
产业链:音响产业链,果链肯定是有机会,但是不是这一波。传导和认知还没到这一步。
2)桌面GPT——GPT识别屏幕能力
这个能力简单来说,就是GPT变成了一个APP,可以在电脑本地使用,并且可以实时截图识别。
从表述上看起来很简单,但实际上是从文字到图像识别的多模态进化
这个东西其实非常厉害,对工作流的优化是革命性的,比如我可以直接截图表格让他帮我数据分析,截图我正在写的这篇文字帮我优化标点和错别字,比如直接阅读我的屏幕帮我总结一篇文章的精髓
这些功能实际上过去GPT都支持,但是不易用,不实时,不流畅。这轮GPT4o本地化后,让使用变得简单傻瓜。
下面放个GPTo直接识别我写方案的图片
投资机会点评:
这块的投资机会比较抽象,因为GPT的APP只能在苹果端上部署,后面也可能会部署到微软端,但是苹果是板上钉钉的,苹果搭载这个功能变成AI PC和AI IOS后,对销量可能会产生怎么样的影响,我想全市场的人都不知道,但是一定是值得关注的,成了就是新一代换机革命,败了,对苹果也不产生实际影响,从这个层面来看,果链是一定值得关注的,但是整个的发酵链路还是会比较长的。
3) GPT可是连贯的生成人物,可以在图片里写文字(仅支持英文)
这个功能,实际上是市面上MJ和SD都有类似的功能,但是不智能。不便捷,这次统一融合在4o里面,将极大的简化工作流,可以想象对简单图像处理和生成靠GPT就可以了,特别是海报这类东西,对于电商公司将会是极大的利好,做素材的成本会越来越低。
投资机会:美图秀秀这类的公司将会是很大的机会,虽然
第二部分:关于GPTo业务战略的思考
我是做战略出身的,所以有时候更多的会思考一些企业战略层面的事情。这块主要跟一级有关。
这里要跟大家聊两个事情,一个是企业重点客户群体和企业发展阶段。
作为一家AI模型技术公司,一般会有两个发展思路,分别是 to B 和to C,在国内还有 to G。其实国内早期的大部分AI创业公司是选择 to B 的发展模式,因为创业公司没钱烧市场嘛,并且B端在2023年也相对好做。但是其实24年开始就不太一样,从中国的月之暗面等公司,实际上都是C端战略,包括这次的open ai 免费战略,也是实际上向C端重点发力,我们甚至能感知到,openai 在用B端收入补贴C端的算力。我认为这是一个非常不错的选择,国内的AI公司,也要重视起来C端的运营,未来AI的运营将会是一个很重要的环节,别闭门造车了。
第二个企业发展阶段的问题
其实今天的AI,有点像2013年中国的打车软件补贴大战阶段,Open ai在产品层面,从技术展现向实用性易用性转型,并且大规模补贴算力,无需注册降低使用门槛。在全球市场层面开始抢占用户。AI工具这个东西,实际上在日常使用中是具有排他性的,用户粘性很强,并不会随便迁移。欧美已经真枪实弹的在抢用户了,中国的创业者在干嘛?这个问题值得我们思考。
GPT4o这次的发布,无论是从技术方向,投资方向,企业经营方向,都为未来1-2年的AI发展指明了方向,让我们拭目以待吧。很庆幸能生在这个时代,大家一起见证AI的诞生与进步。
最后,宣传一波我的知识星球,如果你也对科技,投资感兴趣,欢迎一起在星球讨论,星球里也包含这次为大家整理的三个方向的AI选股,欢迎索取。