从爆火至今不到两年,AI技术爆炸疯狂发展,推荐大家回顾消费级AI这一年多的历程

文摘   2024-10-25 11:35   广东  

专栏 | AI 研习社

微信公众号 | 远远Faraway

作者 | 远远
今天是2024年10月下旬,记得2022年的11月份,OpenAI公司的ChatGPT爆火出圈,成为了史上用户增长最快的消费级应用。
仅仅5天,用户数量达到100万,60天活跃用户过亿,吸引无数人的眼球,也得到国内外资本的青睐,纷纷押注AIGC的未来,ChatGPT一路高歌猛进,在科技圈一路狂飙。
博主是国内首批注册体验ChatGPT的用户,怀着十足的好奇心注册并登录,即使注册过程繁杂,也抵挡不了人们对先进科技的热情。

本人是个十足的科技狂热分子,各个社交媒体平台了解本人的喜好,当ChatGPT爆火出圈的时候,关注到了各个平台推送的科技创新的前沿信息,自然,全球爆火的应用不可能逃过博主尖锐的眼睛。
2007年,当史蒂夫·乔布斯在旧金山推出第一代苹果手机的时候,让很多人感到震撼。当年,市面上的手机还是使用实体按键,系统功能较为单一。而苹果的这款新产品却以一种前所未有的创新方式出现,更大的触摸屏、更好的使用体验、更多的功能、更流畅的系统,让大家心甘情愿地为之买单。
这一瞬间被称为“iPhone时刻”,从那以后,苹果不仅彻底改变了手机行业、重新定义了什么是手机,还持续引领着手机行业,改变了人们的生活。
十几年来,智能手机的出现,推动了移动互联网的发展,手机和移动互联网将人们的生命变了个样,网购、社交、自媒体兴起,造就了一批新的富翁。而科技狂人们也在期待什么时候会是下一个iphone时刻。
直到ChatGPT出现,一些人明白,又一场改变人们生活方式和现今商业结构的科技变革已经到来。

记得当时刚登录使用之前就已经看了很多介绍说ChatGPT有多么厉害,GPT使用了一种叫预训练大语言模型的技术,一种叫Transformer的架构,其中的注意力机制让模型有了理解能力,能听懂你说了什么,能判别你的意图。
这就很神奇了,专业是计算机应用技术的本人学了几年编程我代码都没写明白,计算机竟然就已经发展到能听懂人话的水平了
终于能够让电脑自己干活了啊,这以后就不是人学习计算机了,反过来了,变成了计算机学习人了,大部人不用再深入学习计算机程序设计,不用再大把大把地掉头发了。
不用再因为程序报错而抓耳挠鳃,不用再因为Bug频出而头痛欲裂,也不用再因为搞不懂那些很难的设计模式而痛哭流涕了。
真的有这么厉害吗?登录上去之后,就迫不及待地和AI交流,记得我第一次交互打得竟然是“你好”二字,还挺有礼貌自我感动,然后就开始给AI测智商了,问了一大堆我已经有预期答案的问题,AI的反应还不错,实事、知识和理论层面基本上都能有比较好的回应,但一些高深一些的东西还理解不了,不过这很正常,大部分人都理解不了一些比较难的东西。
使用下来之后,我就隐约感觉到没错了,人工智能技术这次走上正道了。把“用发展的眼光看世界”这句话刻在脑子里的本人,当时就知道AI技术将会很快发展,而且发展速度会比移动互联网普及的时候还快,因为互联网就是AI发展的基础设施。
正所谓,判断正确就有可能,但人们往往在判断的实践上会出现错误,而可能的概率,取决于判断错误的大小。

许多人还不了解AI行业这两年的发展,写这篇文章的初心就是想梳理这差不多两年的时间里都发生了什么,当然,AI行业也不止是OpenAI公司一家,应该放眼整个行业,找找看还有哪些激动人心的时刻。
现在的全球AI市场情况是一家领先,百家追逐,已经不再是一家独秀的时候了。现在有ChatGPT、Claude、Mistral、‌LLaMA、Gemini、Qwen、文心一言
模型名称
首发时间
最后更新
参数量
文心一言
2023年3月2024年9月
2600亿
ChatGPT4o
2022年11月
2024年9月17000亿
Claude
2023年3月
2024年10月未公布
LLaMA2023年2月2024年4月
4000亿
Gemini2023年12月2024年8月13700亿
Qwen2023年6月2024年9月720亿

参数量是大模型的一个重要指标,同等训练条件下,参数量越大的模型理解能力越强,智力水平更高。所有的AI大模型的参数量都在提升,而且是以更快的速度提升,这表明了大模型的发展正在持续加速。

更强的理解能力、更智能、更多的常识、更多的知识。很可能现在那些未发布的模型已经实现AGI(像人一样的智能水平)。

而且OpenAI这家公司总是把王牌藏起来,在发布ChatGPT3.5的时候,那时候GPT4已经训练完成了,也就是说这些AI公司发布的都不是最新的产品,用户普遍认为OpenAI手里会永远握着王牌。

上个月,OpenAI开始向用户推送他们在今年5月14日所展示的高级语音模式,本人体验过后感觉非常震撼,ChatGPT的高级语音模式表现已经很像真人了,AI味基本没有了,拥有了更多的能力,响应速度就像真人对话一样快。

近期,OpenAI发布canvas功能,这个功能颠覆之前的对话模式,可以在canvas页面指定修改生成内容的某个部分而不用重新生成整个文本内容。这个更新对于将GPT用于写作的用户很实用。

Claude3.5发布,也带来了一个震撼的功能,能够操作用户的电脑,AI正在朝着与这个世界的实际交互方向发展,现在能帮助用户实用电脑,未来就可能替代用户上班了,这绝不是幻想,科幻正在慢慢变成现实。

上面是语言模型的发展,总之就是越来越聪明,越来越像人。

除了语言模型外,还有一个领域也发展迅速,那就是图像和视频的生成技术。在这是视听为主的媒体网络时代,视频和图像的需求显然是很大的,AI技术在图像和视频生成方面的发展也非常具有商业价值。

现在文生图技术可以说已经非常成熟了,通过简单的描述就可以生成精美的图像,文生图技术已经给设计平面行业带来了巨大的冲击。现在人们感觉AI出图稀松平常,但在几年前,文字生成图片功能还只是一种奢望,这技术现在还在迅猛发展,生成的图像已经达到了可以拿出来当广告图的水平了。

直接干翻了设计行业和平面模特还有摄像师,AI是工具,是一种会淘汰人的工具,所以一定要把握AI的动向,跟进AI的发展,不然抓不住时代的机遇不说,甚至有可能被市场淘汰。

在2022年的3月,一款名叫MidJourney的绘图工具发布,现在这款工具颠覆了设计行业,是世界上最先进的AI绘图工具,能够生成各种风格的图像,甚至可以生成无法分辨真假的照片级摄影图像。

还有一款叫stable diffusion 的开源AI绘图模型也是很不错,这两款AI绘图模型就是行业的标杆,是想学习和实用AI绘图的人的必学工具。

除了图像生成模型外,还有视频生成模型也在发展,中国本土的可灵、即梦、国际上的Runway、Luma AI等等。

自从OpenAI展示了他们的视频生成技术sora以来,一直未向公众发布他们的产品和服务,据说只是和影视工作室合作,在那之后,AI视频工具如雨后春笋那样冒出来。

也许,sora就是OpenAI的一步臭棋,不过说来,现在的视频生成工具还是不太行,不知道OpenAI会不会在未来给用户惊喜。

不了解AI的人搞不懂为什么AI技术这么重要,但AI的未来一定足够激动人心,这是人类社会的重大技术突破,如果说农业革命让人类产生文明、工业革命让人类超越体力、信息革命让人类超脱地域,人工智能则能让人类文明超越自我。

随着AI技术的发展,一定会出现具有身体的AI,也就是拥有智能的机器人,这是什么概念,就是人可以创造一个类似于人的机器,聪明、钢铁之躯、从不喊累,这就是人类社会新的生产力,而且人工智能这种生产力的提升会远远超过工业带来的生产力提升。

AI农业让人类不再需要种粮食也不愁吃穿;AI航天让人类不需要冒险就能建立地外生存基地;AI出行让人类不受交通事故风险;AI养老让每一个老人被用心对待;AI科研让科技突飞猛进;

AI的能力发展方向是人能做的AI都能做,AI商业的本质是AI的能力就是你的能力,学习AI、使用AI、驾驭AI是一种基本能力。

人类会进入一个正真富足的时代。

点击关注我
一起思考、探索、解构和创新

远远Faraway
互联网原住民,每日冲浪,让我们一起思考、一起成长
 最新文章