智谱开源2款生图模型，第一手实测后，效果不太好

创业 2024-10-14 20:11 湖南

作者｜子川

来源｜AI先锋官

就在刚刚，智谱宣布开源两款图片生成模型：

CogView3

CogView3-Plus-3B

据说能力非凡，它们俩兄弟在多项第三方测试中表现出色，甚至在某些测试中超越了Midjourney-V6、Flux-dev模型。

什么时候国产文生图模型这么强了？

那这不得好好盘一盘这两兄弟。

CogView3

CogView3 是第一个在文本到图像生成领域实现中继扩散的模型，它首先通过创建低分辨率图像，然后再基于中继的超分辨率来执行任务。

具体来讲就是：

首先通过标准扩散过程生成512x512低分辨率图像后,然后利用中继扩散过程先将其放大至1024x1024,随后再进一步迭代至2048x2048的高分辨率图像。

在人工评估中，CogView3 的性能比当前开源文本到图像扩散模型 SDXL要高出 77.0%。同时仅使用了 SDXL 推理时间的 1/10

CogView3-Plus

CogView-3-Plus在 CogView3 的基础上进行了改进，引入了最新的 DiT 框架，从而提高了整体的性能。

它使用了 Zero-SNR 扩散噪声调度，并增加了文本和图像联合注意力机制。与常规的 MMDiT 结构相比，这样做能在保持模型性能的同时，减少训练和推理的成本。

根据官方发布的测评结果：CogView-3-Plus在MPS、Image Reward等测评中的成绩比Midjourney-V6和Flux-dev还要高。

官方放出的效果对比图：

是不是觉得效果还不错。

目前CogView3-Plus已经上线到智谱清言app中。

随后小编立马做了实测。

先说结论：貌似翻车了。

首先，来个简单的提示词：一个美丽的中国姑娘站在海边，索尼镜头，正面照，全身照，写实。

生成的效果是这样的：

生成的效果整体而言，AI感满满，效果不用对比就知道不如Mijourney和Flux-dev模型。

随后小编又重新生成了很多张，效果和第一张一样，不太行。

既然短提示词效果不太行，那么我们试一下较长提示词。

提示词：在客厅里，20岁左右的女孩，单纯，极致漂亮细腻的，(淡妆)，棕色头发，甜美的笑容，细腻漂亮白皙的皮肤，精致完整的五官，脸部刻画详细，高鼻梁，红色嘴唇，漂亮温柔美少女，飘柔顺滑发丝，极致细腻的头发，柔美的气质，脸部补光，超现实，写实，8K画质，极端细节，大师作品，身材绝美，绝世佳人，最高画质，8k分辨率，女神，微笑，精细五官，头发过肩，棕发，大长细腿，面对镜头，身材匀称紧实，温柔的眼神，站立姿势，全身照

效果和大家所看到的那样，还是不太行！

忍不住想要问一问，这官方给出的测评结果也忒不准了吧

看到测评结果，本来觉得国产的生图模型要熬出来了，想不到。。。

.END.

扫码邀请进群，我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型，顺便学一些AI搞钱技能。

往期文章回顾

‍

http://mp.weixin.qq.com/s?__biz=MzA3MzgzMjA3NA==&mid=2650765521&idx=1&sn=6c75e8bd5cc13b3a3d20cb5487203175

AI先锋官

AIGC大模型及应用精选与评测

最新文章

生数科技Vidu 1.5 称首次突破多主体一致性，实测发现效果很差

阿里推全球首个B2B AI搜索，采购转化提升 30%，垂直 AI 搜索工具还有这些

李彦宏说iRAG灭了 AI 生图幻觉，我们实测文心一言发现并没有

智谱 AI 清影全新升级，上手实测不敌可灵

媲美 Runway，看看字节这款 AI 表情迁移工具有没救下向佐演技

腾讯混元Large、混元3D模型开源，我们实测了下都有些拉跨

特朗普、哈里斯谁会当选？我们把问题抛给了 20 个 AI 大模型

万圣节“毒液”变身视频刷屏，这款 AI 视频工具火出圈了

微信悄咪咪上线“ AI搜索”，我们连夜实测发现有点垮

评测超级小爱：Apple Intelligence爽约，跟随者小米要在AI上反超苹果了？

Runway推视频换头术，我们将它与Viggle、快手LivePortrait来了个PK

字节推 AI 配音应用，口型同步Get，且与表情、说话风格完美结合（附5款AI配音应用）

刚刚 Claude 3.5 升级发布:AI 可像人一样操控电脑，查资料、填表格、写代码、改 bug、发布网站

Adobe 推神级 AI 工具:2D 矢量图直接变 3D，可编辑无需重绘

阶跃星辰做的这款 AI 歌曲爆改器太魔性了

更懂电商语境！阿里推翻译大模型，实测比GPT 4o、Google、DeepL好

实测Suno新功能，看图/视频就可创作一首歌

有点炸裂！这项 AI 技术居然能让我的物理课本动起来

智谱开源2款生图模型，第一手实测后，效果不太好

收藏! Anthropic CEO烧脑雄文（略删减 ):5-10年，AI将扫除人类几乎所有疾病，寿命翻倍

慢思考会是AI搜索的理想形态么？我们评测了下Kimi探索版和智谱AI搜索

Flux 1.1成最强AI绘画工具？对比了MJ、Ideogram2.0，效果并没有那么好

AI能帮炒股么？小编做了个专项产品评测，这几个小工具不错

Pika憋了个大招，特效酸爽，看下和可灵1.5、Vidu的对比评测

最强 AI 换衣工具升级了，可能成了最强大的视频编辑工具之一

收藏！Google发布6大类185个最佳人工智能用例

当ChatGPT开始说中国方言

多邻国推视频通话功能，看看真人般 AI+语言学习有多酷

字节豆包发布 AI 视频模型，剧情、人物一致性有不俗突破

OpenAI 奥特曼深夜发文：深度学习起效了，几千天内将迎来超级智能

让 AI 帮理财靠谱么？我们体验了下蚂蚁金服的“蚂小财”

活动预告｜9月25日 AI 赋能智绘未来——人工智能应用创新专场活动

6个维度测评可灵1.5模型，效果不输Sora，太惊艳啦！

不限次数，完全免费！阿里通义万相AI生视频评测：更懂中国风，且能加音效

阿里又双叒叕开源啦，14 款模型，效果劲爆！

豆包开学季升级了豆包爱学，这几个小功能有点意思

Suno 上线翻唱功能，一键换曲风、哼两句就自动编曲，实测有翻车

Openai o1系列模型：博士级理科水平，但阉割严重像半成品，且太贵

Google 发布蛋白质AI生成模型，阻断癌症靶点效率提升 300 倍

Openai 推新模型“草莓”，这里是第一批用户使用体验

Apple intelligence 真等于 AI 么？看看昨晚出炉的 iphone16 N 大 AI 场景

AI编程门槛又降低！自然语言输入，2分钟一个可用APP

原来狗语翻译器真的可以有，还是个华人团队搞的

火线评测支小宝：这是在我手机装了个真正的 Siri吧？

文心一言改名文小言，造词“新搜索”能颠覆AI搜索、传统搜索？

MiniMax推 AI 视频模型，我们对比了Sora、可灵，效果有点翻车

字节悄咪咪上了一款 AI 音乐生成工具，对比 Suno 我们做了测评

电脑装了个夸克，就变 AI 电脑了？

AI 换衣难题，快手推出的这个模型，可以首次实现人衣分离

比 Claude 更强的 AI 前端设计工具，零代码复刻个美团

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉