专栏 | AI 研习社
微信公众号 | 远远Faraway
2023年3月 | 2024年9月 | 2600亿 | |
2024年9月 | 17000亿 | ||
2023年3月 | 2024年10月 | 未公布 | |
LLaMA | 2023年2月 | 2024年4月 | 4000亿 |
Gemini | 2023年12月 | 2024年8月 | 13700亿 |
Qwen | 2023年6月 | 2024年9月 | 720亿 |
参数量是大模型的一个重要指标,同等训练条件下,参数量越大的模型理解能力越强,智力水平更高。所有的AI大模型的参数量都在提升,而且是以更快的速度提升,这表明了大模型的发展正在持续加速。
更强的理解能力、更智能、更多的常识、更多的知识。很可能现在那些未发布的模型已经实现AGI(像人一样的智能水平)。
而且OpenAI这家公司总是把王牌藏起来,在发布ChatGPT3.5的时候,那时候GPT4已经训练完成了,也就是说这些AI公司发布的都不是最新的产品,用户普遍认为OpenAI手里会永远握着王牌。
上个月,OpenAI开始向用户推送他们在今年5月14日所展示的高级语音模式,本人体验过后感觉非常震撼,ChatGPT的高级语音模式表现已经很像真人了,AI味基本没有了,拥有了更多的能力,响应速度就像真人对话一样快。
近期,OpenAI发布canvas功能,这个功能颠覆之前的对话模式,可以在canvas页面指定修改生成内容的某个部分而不用重新生成整个文本内容。这个更新对于将GPT用于写作的用户很实用。
Claude3.5发布,也带来了一个震撼的功能,能够操作用户的电脑,AI正在朝着与这个世界的实际交互方向发展,现在能帮助用户实用电脑,未来就可能替代用户上班了,这绝不是幻想,科幻正在慢慢变成现实。
上面是语言模型的发展,总之就是越来越聪明,越来越像人。
除了语言模型外,还有一个领域也发展迅速,那就是图像和视频的生成技术。在这是视听为主的媒体网络时代,视频和图像的需求显然是很大的,AI技术在图像和视频生成方面的发展也非常具有商业价值。
现在文生图技术可以说已经非常成熟了,通过简单的描述就可以生成精美的图像,文生图技术已经给设计平面行业带来了巨大的冲击。现在人们感觉AI出图稀松平常,但在几年前,文字生成图片功能还只是一种奢望,这技术现在还在迅猛发展,生成的图像已经达到了可以拿出来当广告图的水平了。
直接干翻了设计行业和平面模特还有摄像师,AI是工具,是一种会淘汰人的工具,所以一定要把握AI的动向,跟进AI的发展,不然抓不住时代的机遇不说,甚至有可能被市场淘汰。
在2022年的3月,一款名叫MidJourney的绘图工具发布,现在这款工具颠覆了设计行业,是世界上最先进的AI绘图工具,能够生成各种风格的图像,甚至可以生成无法分辨真假的照片级摄影图像。
还有一款叫stable diffusion 的开源AI绘图模型也是很不错,这两款AI绘图模型就是行业的标杆,是想学习和实用AI绘图的人的必学工具。
除了图像生成模型外,还有视频生成模型也在发展,中国本土的可灵、即梦、国际上的Runway、Luma AI等等。
自从OpenAI展示了他们的视频生成技术sora以来,一直未向公众发布他们的产品和服务,据说只是和影视工作室合作,在那之后,AI视频工具如雨后春笋那样冒出来。
也许,sora就是OpenAI的一步臭棋,不过说来,现在的视频生成工具还是不太行,不知道OpenAI会不会在未来给用户惊喜。
不了解AI的人搞不懂为什么AI技术这么重要,但AI的未来一定足够激动人心,这是人类社会的重大技术突破,如果说农业革命让人类产生文明、工业革命让人类超越体力、信息革命让人类超脱地域,人工智能则能让人类文明超越自我。
随着AI技术的发展,一定会出现具有身体的AI,也就是拥有智能的机器人,这是什么概念,就是人可以创造一个类似于人的机器,聪明、钢铁之躯、从不喊累,这就是人类社会新的生产力,而且人工智能这种生产力的提升会远远超过工业带来的生产力提升。
AI农业让人类不再需要种粮食也不愁吃穿;AI航天让人类不需要冒险就能建立地外生存基地;AI出行让人类不受交通事故风险;AI养老让每一个老人被用心对待;AI科研让科技突飞猛进;
AI的能力发展方向是人能做的AI都能做,AI商业的本质是AI的能力就是你的能力,学习AI、使用AI、驾驭AI是一种基本能力。
人类会进入一个正真富足的时代。