最近,大宁哥深切感受到大家对 DeepSeek 处理图片的期待,呼声那叫一个高。
不过得先和大家说明白,DeepSeek R1 并非多模态大模型,原生对图片的支持确实有限,不像豆包、ChatGPT 那样能直接生成精美图片。
但千万别灰心,只要掌握方法,咱们照样能让 DeepSeek 在图片处理上 “玩出花”。
01
文字生成图片
两步轻松搞定
文字生成图片基本就两步:
1️⃣ 先提需求让 DeepSeek R1 优化内容,得到优化文本。
2️⃣ 再提需求让 DeepSeek R1 把优化文本转为图片。
下面介绍的几种生图方法中,第一步都是相同的,区别是第二步。
那么第一步该怎么做呢?
还是我们之前介绍的方法,套万能模样:背景+需求+约束条件,或用模仿的方法来优化内容。
比如把前文讲怎么用好 DeepSeek 的内容生成小红书样式的图片。
第一步,先让 DeepSeek R1 帮我们优化内容。
模仿小红书爆款格式,展示如下内容:
标题:DeepSeek 使用技巧
技巧:
1. 万能提问模板:背景+需求+约束条件(可选)
例子:我家小孩读初一(交代背景),怎样提高他的英语水平(提出需求),不需要考虑口语问题 (约束条件,可选)
2. 让 DeepSeek “说人话”
例子:我想了解 DeepSeek 成本这么低的原因。说人话。
3. 模仿人物回答
例子:模仿李白,写一首“万事如意”的藏头诗。
DeepSeek 给我优化的内容如下:
怎么样,还行吧?😁
然后进入第二步,将优化文本转为图片,这一步的方法较多,且听我一个个介绍。
02
多种生图方法大揭秘
■ 1.生成 SVG 图片
我们日常常见的图片格式有 png、jpg、webp 等,而 DeepSeek R1 目前仅支持直接生成 SVG 格式的图片。
所以,我们可以明确要求 DeepSeek 生成 svg 图片,并提出一些具体要求,比如配色、布局等。
如我要求 “将整个回答转为 svg 图片,要求配色简约” 后,DeepSeek 输出如下:
点击运行 HTML,弹出页面展示 svg 图片:
如果生成的样式符合你的预期,直接复制整块内容,创建一个新文件,把后缀名改为 svg,再粘贴内容即可。
要是觉得样式还不够完美,就根据 DeepSeek 提示的配色方案、布局结构等继续调整,直到满意为止。
■ 1.生成 PNG、JPG 图片
要是你特别想用 png 和 jpg 等格式显示图片,也不是没办法。
这类需求一般可以通过专门的 Python 库来处理图片,或者写个 HTML 文件生成图片。
别被这些技术名词吓到,有 DeepSeek 帮忙,我们不用写一行代码。
比如我直接提的需求:
将整个回答以小红书卡片的风格展示,用 html 输出,要求如下:
1. 每块文本对应一个卡片,每个卡片都提供下载为 png 的按钮,生成的图片中不要包括这个按钮。
2. 不要调整文本内容。
3. 配色简约,卡片美观。
DeepSeek 思考几秒后,直接就给我返回了 HTML 代码文件。
同样的,我们点击“运行 HTML” 按钮就行,比如 DeepSeek 给我返回的样式如下。
点击“保存图片”就能拿到 png 图片。
怎么样,是不是很简单?
我这里的卡片样式没有仔细打磨,如果你在小红书小绿书做图文赛道,可以花时间弄一套自己的提示词,直接让 DeepSeek 变成你的出图神器!
03
拓展思路
借助第三方工具
除了上述方法,我们还可以借助第三方文字转图的 AI 工具。
现在市面上有很多免费出图的 AI 工具,它们能根据提示词生成图片,而提示词的质量直接决定了图片的质量。恰好,DeepSeek 非常擅长生成提示词。
比如,我让 DeepSeek 帮我生成一个鲸鱼跃出海面喷水的图片提示词,它很快就返回了一段内容。拿到提示词后,再找个 AI 出图工具,就能得到图片。
一般来说,英文提示词生成的图片效果会更好,所以我通常让 DeepSeek 直接生成英文提示词。
这种组合特别适合生成漫画图、文章封面图,甚至制作视频。这里给大家推荐几个常用的生图 AI 工具:
Midjourney
AI绘画板块,首推的依旧是Midjourney,不仅出图速度快,而且图像质量也属于Top级别的。最新的图像编辑器融合Controlnet控图技术,但控图的自由度较低,适合做灵感创意、素材生成等工作。
请忽视那不固定的免费生图次数吧,推荐30美元/月的套餐,可无限生图。
StableDiffusion
如果要我只推荐一款AI绘画工具,那么无疑是StableDiffusion,开源无敌!(开源即免费)
国内外有超多基于SD训练的风格模型、插件/节点可以免费使用。无论是素材生成、创意合成还是商业设计,它都可以做到。但生图对电脑配置较高,本地部署会稍微麻烦点。
可以使用云端服务器或者是云端软件,推荐哩布哩布AI。
Flux
Flux 是黑森林团队推出的 AI 图像生成模型,它生成的图像质量非常逼真,甚至可以和 Midjourney 相媲美。前段时间小红书上大量的美女图,就是由 Flux 模型生成的,这些图片就像从现实世界中直接截取下来的一样,人物的表情、姿态都栩栩如生。
它提供开源模型可免费在 WebUI/ComfyUI 中使用,不过对电脑配置要求也很高。如果你的电脑配置不够强大,就像开着一辆小马力的汽车去爬山,可能会有些吃力。所以,推荐使用云端,让云端强大的算力来帮助你实现创作梦想。
Ideogram
在文本生成领域迈出第一步的模型,Ideogram。有着超强的文字嵌入功能,对提示词文本的理解也足够精准,擅长生成英文海报、Logo、徽章等,美中不足的是不支持中文生成。
每日登录赠送10积分,生成4张图需要2积分,付费订阅最低7美元/月。
Recraft
Recraft 是最适合设计师使用的 AI 生图工具,它具有较强的文本渲染能力,虽然不支持中文,但在设计领域的表现却非常出色。它专为设计而生的四大功能:排版设计、风格迁移、矢量图生成、样机生成,就像为设计师量身定制的一套工具包,能够满足设计师在不同场景下的创作需求。
前段时间,全网火爆的hellokitty,最开始就是由Recraft创作的。每日赠送50积分,生成一张图片需要花费1积分。
即梦AI
字节跳动旗下一站式AI创意创作平台,国内top级的生图模型,支持中文海报生成。2024年下半场小红书上爆款的AI作品基本上都是即梦生成,并且它还支持AI视频生成,可以将生成的图片一键转换为视频,非常实用。
每天登录可领取80创作积分,需求量不大的话,完全够用。
Whisk
Whisk 是由 Google Labs 推出的一款创新的 AI 图像生成工具,它打破了传统的文本提示方式,通过图像输入来生成新的图像。用户可以上传代表主体、场景和风格的图像,Whisk 会基于这些元素自动生成独特的视觉作品,比如 “巨物小黄人” 创意视觉图像。
这就好比你给它提供了一些建筑材料,它就能根据这些材料为你建造出一座独一无二的建筑。而且它是免费使用的,对于想要尝试新玩法的用户来说,是一个非常不错的选择。
04
AI视频工具
可灵AI
可灵 AI 是快手团队开发的视频生成大模型,也是目前市面上生图效果最好,市场占有率最高的 AI 视频生成工具。最新的 1.6 模型在文本响应度上提升明显,对运动、时序类动作、运镜等文字描述的响应更好,并且对物体的运动更加合理,人物表情更自然。就像一位专业的电影导演,能够准确地理解你的创意,并将其转化为一部精彩的电影。
在视频生成领域,你可以永远相信可灵。每月可领取 366 积分,大约能生成 10 - 20 条视频,如果创作需求大还是需要开通会员的。
海螺AI
海螺 AI 在 2024 年下半场在海外特别火,它在视频生成方面,能够根据文本提示生成高质量的视频内容,支持多种风格和效果。其视频模型在美学表现、运镜控制、复杂提示词理解等方面都有不错的表现。就像一位多才多艺的艺术家,能够根据你的要求,创作出各种风格的视频作品。
每日登录可领取 100 积分,视频生成消耗 30 积分,一天可免费生成 3 次,这样的免费额度对于一些轻度用户来说,已经足够满足日常的创作需求。
PixVerse
PixVerse 视频生成工具是由国内团队开发的,最近刚上线的 V3.5 模型在 Turbo 模式下,能够在 10 秒内生成一条视频,就像一位高效的快手,能够在短时间内为你交付作品。
它能在国内外火出圈,主要是因为 “效果模板” 功能,通过简单的上传图片、选择特效加上简单的描述,即可生成特效视频,比如 10 月份爆火的毒液变身特效。每日登录赠送 60 积分,能生成 2 - 3 条视频,付费价格也不算贵,对于想要快速生成特效视频的用户来说,是一个性价比很高的选择。
Runway
Runway 算是视频生成模型的老大哥,它的功能非常丰富,支持视频转绘、相机运镜、表情控制等等,生成的视频画质高,并且能展示复杂的场景变化和多种电影风格。就像一位全能的电影制作人,能够满足专业创作者在不同方面的需求。
它有一个比较亮点的功能 Act - One,能通过上传一段人物视频,来驱动另一个角色 1:1 复刻面部表情,类似传统电影里的动作捕捉。
注册后一次性可获得 125 个积分,消耗完后需要购买套餐才能继续使用,对于专业的视频创作者来说,虽然需要付费,但它的强大功能绝对物有所值。
Pika
Pika 有许多预设的特效模板,支持多种风格生成,能够根据用户输入的文本、图像或视频生成高质量的视频。它生成的一些解压的抽象视频,充满了创意和想象力,就像一位充满奇思妙想的艺术家,能够为你带来全新的视觉体验。
不过,它的图片质量与 Runway 还存在差距,更适合广告创意人,能够帮助他们快速生成一些富有创意的视频广告。每月赠送 150 个视频积分,能免费生成 5 - 10 个视频,对于有一定创意需求的用户来说,这样的免费额度也能满足他们的部分创作需求。
LumaAI
最后出场的这位LumaAI,名气和模型效果虽不如前面的大哥们,但也是上线仅4天,用户数就突破了100万的选手。Luma AI的视频生成速度较快,能够在120秒内产出包含120帧的高品质视频。同时它还推出了图像生成模型Luma Photon,图像效果表现不错,适合日常小需求的创作。
赠送的免费生图、生视频额度还比较多,可作为AI视频生成工具的补充。
好了,关于 DeepSeek 处理图片的内容就分享到这了。
如果你还想知道 DeepSeek 的更多用法,可以在评论区留言。
当然,如果你有更多好玩的用法,也欢迎在评论与我交流。
近期不少朋友在后台咨询了很多问题,如果你也有问题的话,可以加微信号 :daningpyq。拉你进我们DeepSeek 全球交流学习群。
End
-♥️你的每一次“在看”,我都认真当成喜欢♥️-