首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

大模型已基本解决幻觉问题？

科技 2024-11-12 20:38 北京

你是否经历过大语言模型一本正经“胡说八道”？大模型在发展初期的幻觉问题尤为严重，所回答问题基本属于“已读乱回”，至于哪家企业的大模型不在本文探讨之列，大家心知肚明，更重要的是大语言模型的幻觉问题有了最新进展。

今日，百度创始人李彦宏公开表示，“大模型基本消除了幻觉”，这对于大语言模型来说是一个巨大的进步，过去一年来大模型的幻觉问题为用户造成了很多困扰，笔者在参加某次业内会议时，有专家明确指出：“我们期望大模型即使不回答也不要输出误导性的错误答案。”

面对大语言模型的幻觉问题，各企业也在全力攻克，尤其头部的一些大模型开发厂商。OpenAl CEO Sam Altman曾指出：“我们正在努力解决幻觉问题，这将需要一年半到两年的时间。”

然而，信息技术行业发展到今天，已经步入到“日日新”的阶段，大型语言模型发展短短两年时间，就已在该领域上取得了巨大突破。

那么，为什么LLM会出现幻觉？360创始人周鸿祎曾一针见血地指出：“目前人工智能存在一个全世界公认的难题——它会产生幻觉，这是大模型本身固有的特性。”也就是说，幻觉问题是大语言模型与生俱来的。

此外，产生幻觉的原因可大致分为三个方面：数据源、训练过程、推理。

具体来看，大语言模型产生幻觉的原因包括数据质量、算法、专业领域知识丰富度、是否拟合等。

从数据质量上来看，大规模数据集中可能存在数据质量问题，例如缺失值、异常值或不一致性，这些问题可能会导致大文本模型输出错误结果。

从算法选择来看，目前大模型已经遍地开花，各家大模型选择的算法各不相同，不同的算法对于大规模数据的处理方式各不相同，选择不恰当的算法可能导致对数据的错误建模，从而产生幻觉。

从专业领域的知识的丰富程度来看，大语言模型在涉及某些专业领域时，会因为知识储备（语料）不充足或者不能理解专业领域的数据，产生对客观事实的错误解读。

从大语言模型训练的角度来看，存在过拟合的问题。模型在训练数据上表现良好，但是对样本外的数据进行测试时表现效果不佳，欠拟合和过拟合的大模型出现幻觉的概率一般较高。

虽然大语言模型幻觉一度困扰开发者和用户，但有人却持有不同的观点——大模型幻觉是非常宝贵的特性，之所以有这样的观点，是他们认为因为“幻觉和创新其实只有一线之隔”，未来，如何破除幻觉和创新的壁垒将是大模型努力的方向。

其实大语言模型发展到今天，面临的不止“幻觉”这一个挑战，如未来随着数据量的巨增，必须要进行模型压缩与优化；多模态模型与大语言模型的结合，将自然语言处理与计算机视觉、语音处理等多模态信息相结合，扩大应用场景。

END

精品期刊《通信世界》

“纸电同步” 自由切换

一年只需480

ICT圈大小事尽在掌握

抓紧时间来订阅

推荐阅读

中国移动全新国际漫游流量包重磅上线！低至￥7.99起/天，助力出游更省心！

新兴技术向前，GenAI向“后”？

蝶变“AI+” | 专家解读：AI智能终端设备产业发展与监管策略

作者：孙天

责编/版式：盖贝贝

审校：王涛梅雅鑫

监制：刘启诚

【通信世界新媒体矩阵】

央视频 | 微软MSN | 视频号 | 微博 | 今日头条 | 百家号 | 网易号 | 搜狐 | 腾讯新闻

新浪看点 | 雪球号 | 抖音 | 快手 | 爱奇艺 | 知乎 | 哔哩哔哩 | 咪咕视频 | CSDN | 36氪

【新媒体团队】

监制｜刘启诚

审校｜王涛梅雅鑫

编辑｜王禹蓉盖贝贝

视频剪辑｜黄杨洋卢瑞旭

运营｜林嵩

点分享

点收藏

点在看

点点赞

http://mp.weixin.qq.com/s?__biz=MjM5NTI1NzgyMQ==&mid=2650944458&idx=1&sn=c4a9ec0ad00832bfdc8a6acf87371de9

在路上，读懂世界！在这里，读懂通信！

最新文章

@ICT小伙伴：一起来谈谈“我”的2024

中国铁塔科协成立大会暨2024年科技创新大会在京召开

新闻“晚”知道 | 谢少锋任工业和信息化部总工程师

咪咕互娱“双特色”新战略解读：新质向新打造云游戏高质量发展新生态

5G-A加持，助力数智江苏向新而行

【总编视点】中国铁塔在强国建设中彰显使命担当

向新求质·共铸未来 | 中国铁塔科技创新专题【通信世界】

新闻“晚”知道 | 我国将在五年内基本建成国家数据基础设施主体结构

“折叠屏鼻祖”宣告破产，60亿估值的“神话”何以破灭？

思仪科技率先突破并商用145GHz光波元件分析仪

激发人才创新活力！沈小平受邀参加东南大学奖学金颁奖典礼

新闻“晚”知道 | 中国信通院牵头制定的8项大模型标准正式发布

工业5G模组价格大幅下跌，是利好也要警惕

“5G速率计费”的第一块蛋糕谁来抢？

新闻“晚”知道 | 1200万套！中国电信启动迄今最大规模FTTR设备集采

倪光南院士：拥抱开源RISC-V，强化半导体产业链

12月18日！京城ICT圈虎啸龙吟，谁执牛耳？

一文读懂：何为信息通信业“链长制”？

新闻“晚”知道 | 工信部发布首批“5G+工业互联网”融合应用试点城市

openEuler开源五年树立新里程，斩获50%新增市场份额

王建宙：新一代人工智能加速6G网络演进

新闻“晚”知道 | 中国联通简勤：深化数字技术融合创新，共筑新质生产力

国家统计局：着力扩大国内需求，推动工业高质量发展

通鼎集团沈小平出席社会组织服务高质量发展苏州大会

聊聊芯片大厂冲刺IPO那些事儿

如何助力卫星通信发展？思仪科技无线信道“神器”不容错过

一文读懂美国关键和新兴技术战略

新闻“晚”知道 | 工信科技期刊集群及12本单刊成功入选中国科技期刊卓越行动计划二期

人形“智能”大热，何时能够加入我们的生活？

王志勤：6G迈入标准化研究阶段，七大技术试验成果显著（附PPT）

增值电信业务对外开放为何能实现“双赢”？

新闻“晚”知道 | 工业和信息化部宣传思想文化工作座谈会在京召开

最新！看运营商大数据复盘“双十一”

14家企业参与，全球6G创新发展合作五大倡议发布！

记者探“鄂” | 搭乘“5G+工业互联网”快车，湖北竞速实数融合

新闻“晚”知道 | 闻库：需要开发出满足市场需求的6G

邬贺铨：避免重蹈5G覆辙，6G应在多频段实现多需求

大模型已基本解决幻觉问题？

《通信世界》2024年第21期来了！

新闻“晚”知道 | 中国联通简勤：夯实数字底座，助力企业数字化转型

来啦来啦！2025 ICT趋势年会12月18日，不见不散！

运营商进入低增速时代？

400个！《2024年5G工厂名录》出炉

通鼎互联亮相2024年APC全球光纤光缆大会

华为汪涛：AI加速超宽带产业创新，共赢商业新增长

旧瓶装新酒，智能手机带火无网通信？

投资7亿元！中兴通讯成立新公司，涉及多项AI业务

新闻“晚”知道 | 400个项目上榜！工信部公布2024年5G工厂名录

总编视点 | 中企应该重视马来西亚数字市场

不换卡号，每月免费30条！中国移动北斗短信业务来啦

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉