首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

李彦宏说iRAG灭了 AI 生图幻觉，我们实测文心一言发现并没有

创业 2024-11-13 07:48 日本

斯

作者｜子川

来源｜AI先锋官

今天的 2024百度世界大会上，百度创始人李彦宏介绍了一项很顶的技术——“iRAG（image based RAG）”。

他说，过去两年里， AI行业发生最大变化就是大模型基本消除了幻觉。

AI 的幻觉大家都有体验。

尤其在大模型初期，无论ChatGPT还是其他模型，总喜欢一本正经的胡说八道——直到RAG（检索增强）的技术的出现。

此次百度发布的技术叫“iRAG（image based RAG）”。字面意思我们不难看出，是为了解决文生图技术的幻觉问题。

关于这个问题，大家看两组用Midjourney生成的实例就知道是咋回事了。

比如让“马斯克在北京大学门口喝豆汁”

嗯？？？这是豆汁吗？这是北京大学的门口吗？马上打开查了查，北京大学的门口应该长这样式的。

再生成一张“库克拿着小米15手机”的照片。

ennnnnnn。。。。。这是哪位友商的超大版的手机在乱贴苹果标。

就如大家所看到的那样，AI生图有着很大幻觉问题，往往是张冠李戴，图不对文。即使强大如 Midjourney ，也不能幸免。

李彦宏说，依托iRAG可让AI大模型文生图功能准确性大增，不再有“幻觉”，也就是说，AI制作的图片不会再有“AI味儿”了。

真的有介绍的那么厉害，消除了幻觉吗？

我们忍不住实测了一下文心的绘图功能。

比如，我们一起用 AI 来完成下马斯克的梦想，让“马斯克在火星上开着特斯拉”。

生成的效果还不错，是一辆特斯拉，不过里面的司机细看，可不是马斯克。

随后，我们接着换一个简单的。“特朗普站在火星上吃着麦当劳”。

这个生成的就比较不错，无论是特朗普还是火星地貌火星地貌都较好呈现的出来了。

再来一个，刚刚结束的美国大选，特朗普成功的当上了总统，再就让“哈里斯给特朗普颁发皇冠”。

🤔，这不是哈里斯，而是特朗普的老婆梅拉尼娅，依旧存在着幻觉问题。

随后我们反反复复测试了很多搭配，发现幻觉问题依旧存在，并没有发布会介绍的那么神。

写在这里，不经思考，iRAG到底有用还是真的没用。

那就让搭载了iRAG的文心的绘画功能和没有搭载iRAG的Midjourney来一场PK。

先来一个人物图“勒布朗詹姆斯和斯蒂芬库里身穿勇士球衣，在场上打球”。

左：文心右：Midjourney

从这两张图不难看出，文心除了生成的更加真实，连斯台普斯球场都生成出来了，不过它们俩生成的球衣号码都有问题。

再来一个全是物体的图片“广州塔、埃菲尔铁塔和上海明珠出现在月球上”。

左：文心右：Midjourney

在景物还原度来看，两者都没有把所有的高塔生成出来，不过Midjourney生成出来的是月球表明没错了，而文心只是生成了一张月球的背景图。。。

最后来一个人物加景物图“霍金和爱因斯坦在故宫打麻将”。

左：文心右：Midjourney

同样的问题，文心在多人物方面生成的极其不准确，这都出来了两个爱因斯坦。反观，隔壁的Midjourney要更加拉跨，里面的元素出了爱因斯坦有较好的还原外，麻将和故宫的元素愣是一个都没有看到。

总的来说，iRAG技术还是有用的，它能在一定程度上消除幻觉，不过体验下来，还是差了点意思，没有达到预期。

不过，如果把iRAG技术搭载到Midjourney会是什么样的结果呢？

.END.

扫码邀请进群，我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型，顺便学一些AI搞钱技能。

往期文章回顾

http://mp.weixin.qq.com/s?__biz=MzA3MzgzMjA3NA==&mid=2650766132&idx=1&sn=c38f72d823ef9252be6168c0cad80dd1

AIGC大模型及应用精选与评测

最新文章

生数科技Vidu 1.5 称首次突破多主体一致性，实测发现效果很差

阿里推全球首个B2B AI搜索，采购转化提升 30%，垂直 AI 搜索工具还有这些

李彦宏说iRAG灭了 AI 生图幻觉，我们实测文心一言发现并没有

智谱 AI 清影全新升级，上手实测不敌可灵

媲美 Runway，看看字节这款 AI 表情迁移工具有没救下向佐演技

腾讯混元Large、混元3D模型开源，我们实测了下都有些拉跨

特朗普、哈里斯谁会当选？我们把问题抛给了 20 个 AI 大模型

万圣节“毒液”变身视频刷屏，这款 AI 视频工具火出圈了

微信悄咪咪上线“ AI搜索”，我们连夜实测发现有点垮

评测超级小爱：Apple Intelligence爽约，跟随者小米要在AI上反超苹果了？

Runway推视频换头术，我们将它与Viggle、快手LivePortrait来了个PK

字节推 AI 配音应用，口型同步Get，且与表情、说话风格完美结合（附5款AI配音应用）

刚刚 Claude 3.5 升级发布:AI 可像人一样操控电脑，查资料、填表格、写代码、改 bug、发布网站

Adobe 推神级 AI 工具:2D 矢量图直接变 3D，可编辑无需重绘

阶跃星辰做的这款 AI 歌曲爆改器太魔性了

更懂电商语境！阿里推翻译大模型，实测比GPT 4o、Google、DeepL好

实测Suno新功能，看图/视频就可创作一首歌

有点炸裂！这项 AI 技术居然能让我的物理课本动起来

智谱开源2款生图模型，第一手实测后，效果不太好

收藏! Anthropic CEO烧脑雄文（略删减 ):5-10年，AI将扫除人类几乎所有疾病，寿命翻倍

慢思考会是AI搜索的理想形态么？我们评测了下Kimi探索版和智谱AI搜索

Flux 1.1成最强AI绘画工具？对比了MJ、Ideogram2.0，效果并没有那么好

AI能帮炒股么？小编做了个专项产品评测，这几个小工具不错

Pika憋了个大招，特效酸爽，看下和可灵1.5、Vidu的对比评测

最强 AI 换衣工具升级了，可能成了最强大的视频编辑工具之一

收藏！Google发布6大类185个最佳人工智能用例

当ChatGPT开始说中国方言

多邻国推视频通话功能，看看真人般 AI+语言学习有多酷

字节豆包发布 AI 视频模型，剧情、人物一致性有不俗突破

OpenAI 奥特曼深夜发文：深度学习起效了，几千天内将迎来超级智能

让 AI 帮理财靠谱么？我们体验了下蚂蚁金服的“蚂小财”

活动预告｜9月25日 AI 赋能智绘未来——人工智能应用创新专场活动

6个维度测评可灵1.5模型，效果不输Sora，太惊艳啦！

不限次数，完全免费！阿里通义万相AI生视频评测：更懂中国风，且能加音效

阿里又双叒叕开源啦，14 款模型，效果劲爆！

豆包开学季升级了豆包爱学，这几个小功能有点意思

Suno 上线翻唱功能，一键换曲风、哼两句就自动编曲，实测有翻车

Openai o1系列模型：博士级理科水平，但阉割严重像半成品，且太贵

Google 发布蛋白质AI生成模型，阻断癌症靶点效率提升 300 倍

Openai 推新模型“草莓”，这里是第一批用户使用体验

Apple intelligence 真等于 AI 么？看看昨晚出炉的 iphone16 N 大 AI 场景

AI编程门槛又降低！自然语言输入，2分钟一个可用APP

原来狗语翻译器真的可以有，还是个华人团队搞的

火线评测支小宝：这是在我手机装了个真正的 Siri吧？

文心一言改名文小言，造词“新搜索”能颠覆AI搜索、传统搜索？

MiniMax推 AI 视频模型，我们对比了Sora、可灵，效果有点翻车

字节悄咪咪上了一款 AI 音乐生成工具，对比 Suno 我们做了测评

电脑装了个夸克，就变 AI 电脑了？

AI 换衣难题，快手推出的这个模型，可以首次实现人衣分离

比 Claude 更强的 AI 前端设计工具，零代码复刻个美团

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉