专栏 | AI 研习社
微信公众号 | 远远Faraway
作者 | 远远
一直以来流行一个说法,说互联网的发展是靠人性推动的,因此还衍生出另一句话,叫不以泡妞为目的的社交应用都是在耍流氓。
原始需求是最强的产品驱动力,连微信最开始的时候都是利用摇一摇这个社交功能发展壮大的,张小龙果然是中国最牛产品经理。
当今AI技术突飞猛进,发展速度远超人们的想象,现在AI绘画技术发展到了什么阶段了?能生成什么东西?有哪些限制?
带着你的好奇心和心中的问题,让我们来看看,AI绘图能帮你做什么?
没想到短短的几年时间,AI绘图就已经这么成熟了。有些工具生成的图片已经让人们已经无法分辨了。现在插画、摄影、室内设计和广告等行业都已经将AI绘图运用到了工作之中,简直是引领了新的创作潮流,AI绘画成为了一个全新的领域,很多新手小伙伴可能摸不着头脑,不知道该怎么使用AI绘图,而懂得AI绘图的人即使自己不会画画和设计,也能创作出很好的作品。在这个领域里,最火的有两款工具,一款叫Midjourney,另一款叫Stable Diffusion了解AIGC领域的小伙伴对这两款软件一定都不陌生,也有很多还没接触过AI绘图的小伙伴却还不了解。我给大家大概介绍一下,学习这件事,沉下心来才会有所收获,本文干货满满,字数也不少,但我尽量给大家讲讲AI绘图之道,让你能用AI绘制出你想象中的画面,如果对你有帮助,把关注按钮点一下。这两款工具,准确地说是两款AI图片生成模型,它们之间有很多不同的地方,各有所长,也各有所短。其中,最主要的区别是Midjourney不是开源的而Stable Diffusion是开源的。什么是开源和闭源?打个比方,比如你会做一道很好吃的菜,你不告诉别人你具体是怎么,别人要吃的时候就找你买,这是闭源(不让别人掌握);但如果你把这道菜的制作过程公开,这样一来,别人就能做出这道菜,还能根据自己的口味改造这道菜,这就是开源。
Midjourney是闭源策略,这个公司采用了一种收费模式,人们要用他们公司的这个大模型生成图像,就需要付费使用,Midjourney使用Discord软件作为他们的服务交付平台,付费之后你在Discord上发送生成图像的指令,Midjourney公司的服务器就能生成好图像后发送给你挑选和优化。
而Stable Diffusion是开源的,这样一来,你可以下载Stable Diffusion的模型程序,部署到你自己的电脑上,高配置一点的电脑和好一点的显卡就能让Stable Diffusion在你的电脑上运行,你不需要联网就能在你的电脑上生成图像。你也可以部署Stable Diffusion然后通过网络让用户付费或者免费使用。
而使用这两款模型就很简单,就是尽量描述你想要的画面,但是想用好这两款软件其实也并不容易,用好这两款软件的要点就是准确描述你要的画面,关于如何准确描述画面让文生图模型准确理解生成出超预期效果的图像,这方面的知识会我的知识星球社区详细分享。
计算机绘图可不是字面上理解的那样,其实更准确的叫法应该是AI图像生成,甚至可以生成一张照片。摄影风格是AI图像生成的一个重要风格,可以生成很多让人分不清真假的图片。在中文互联网上,有很多AI生成的美女图片,因为太像真人了,系统也没有办法检测是不是AI生成,所以,很多真人图片博主的流量也被AI卷走了,首当其冲的就是小红书。AI生成的美女已经在小红书上掀起了一场“虚拟女神”的风暴,小红书不但没有把图片识别成AI图,而且还给推流,推送系统是一点都看不出来是AI,真人女博主已经被卷翻了。商业的逻辑是大家爱看的就是好内容,平台未来可能不会去检测是否是AI生成的,只要用户喜欢,推流系统就给推就是了,只要是合法内容,其实没有必要做AI检测,在未来,AI检测就是徒劳。而且很有趣的一点是,很多AI美女账号的号主,都是男的。这妥妥的就是男性通过利用技术在女性擅长的地方抢饭吃啊,而且一个人可以批量操作上百个账号,每天获利不菲。
给他一百个账号,造出100个名字,生成100个美女,收获无数个粉丝。这侧面说明,使用小红书的男性用户也越来越多了,都是冲着看小姐姐去的,小红书本来是缺男用户的,估计推美女也是小红书战略的一环。现在,使用AI视频技术可以让图片变成视频,AI美女也会攻占短视频领域,只要图生视频技术更加成熟,美女短视频这也会是一个趋势。细思极恐,如果有一天你分不清图片和视频中的小姐姐是真人还是虚拟的,你会怎么想?如何以假乱真,这是AI绘图一开始发展的时候就已经存在的问题,在传统的技术方案中,使用一种叫生成对抗网络的技术来让图像更加真实,现如今,主流AI绘图使用一种叫稳定扩散的技术来生成逼真的图像。我们为什么能够看到那么多真实的美女图片,就是因为这些技术的演进。其实这些技术说起来原理很简单,理解其中的技术有利于你生成你自己想生成的图像。传统的生成对抗网络技术原理很简单,两个计算机神经网络模型(生成器和判别器),一个负责生成逼真的图像,另一个神经网络负责判断生成的图像不是真实的,如果生成的图像骗不到负责判断的神经网络,那么,生成图片的神经网络模型就需要调整参数生成更加真实的图像。
但是,这种方法有弊端,就是计算量太大了,很多计算都是白费的,训练效率很低,所以后来出现了稳定扩散技术。主流的Midjourney和Stable Diffusion就是使用这种技术原理。稳定扩散的原理也很简单,就是先生成图像的噪点,然后逐步扩散这些点,一步一步变成一张真实的图像,这种方法比生成对抗网络效率更高,还能实现局部修改和扩图等高级功能,值得一提的是,Stable Diffusion 就是稳定扩散的意思。
Midjourney不是开源的产品,有很多使用规范,称为社区规范。问题来了,到底如何怎么让AI生成任何人们想生成的图片?从前,因为信息闭塞,普通人在计算机发展时看不懂计算机的作用、因为认知差在网络信息时代来临时也抓不住机会。但是在信息时代,信息触手可及,每个有野心的人都能了解AI、使用AI。
如果你20-40岁,可一定要好好掌握AI,AI是每个人的工具。我们正在进入一个AI时代,这是自工业革命和信息革命之后最大的变革。
在公众号回复你的行业,我们聊聊