首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI 大模型泡沫终将破灭

科技 2024-09-24 00:02 江苏

🎯AI 大模型发展，数据成关键

在 Scaling Law 的“指引”下，AI 大模型技术不断朝着加大训练数据、加大算力投入、堆积参数等方向前进。

然而，随着发展，如何用更可靠的数据进行训练模型，成为了根本性、长期性的关键要素之一。

外滩大会“从 DATA for AI 到 AI for DATA”见解论坛披露的数据显示，自 2026 年起，人类产生的新数据量将比模型学习的新数据量要少，预估到 2028 年，AI 大语言模型将耗尽人类数据。

这意味着未来基于现有数据技术的模型效果可能出现“瓶颈”，难以实现通用人工智能（AGI）目标。💡提高数据质量至关重要肖仰华教授指出，当前大模型仍面临“幻觉”、垂直行业信息缺乏等核心挑战，而造成“幻觉”现象的主要原因是大模型缺乏高质量数据支撑。

在一定程度上，数据决定了 AI 大模型“智能水平”的上限，但当前千亿大模型中 80%都是“水分”，即大量语料数据无意义、错误率极高。

所以，提高数据的质量和多样性对于未来大模型技术发展及落地应用至关重要。🌟大模型落地本质是数据工程肖仰华教授认为，AI 大模型落地的本质仍然是数据工程。

当前大模型发展过程中，对数据的消耗和使用极为“粗放”，使用效率极为“低下”。

如果大模型要走向千行百业，必须解决“幻觉”问题，可运用合成数据、私域数据、个人数据、小模型、知识图谱等技术方法。

📊三种高质量数据模型技术方案 - **合成数据**：

互联网数据虽消耗殆尽，但人类可以在其基础上合成更多数据。

合成数据不仅能缓解数据用光的问题，还能激发大模型的智商和理性能力，因为其中大部分是人类思考过程的数据。

- **私域数据**：

人类更多高质量、高价值的数据在私域（垂直行业）中，用好私域数据可能让大模型变成行业专家。

- **个人数据**：

个人数据用于训练大模型才刚刚开始，未来如何把个性大数据和大模型结合好，为每个人提供服务还有很长的路要走。

❓合成数据引发争议虽然合成数据被认为对创造下一代大模型有很大帮助，但也存在多样性和丰富度不足的问题。

OpenAI 创始成员安德烈·卡帕蒂承认当前数十亿级参数量的大模型存在很多无用信息，认为数据集没有经过精细化调整。

💭反对“机器取代人类” 肖仰华教授反对“机器取代人类”的观点，认为技术的发展要“以人为本”，没有人的文明是没有意义的。

以大模型为代表的 AGI 的到来，应倒逼人类回归价值本原。

🌅未来展望与挑战展望未来，这波生成式大模型的泡沫早晚会破，天花板一定会到来。

原因有三：

一是人类产生优质数据的过程缓慢，成为大模型发展的天花板；

二是合成数据质量控制存在技术挑战，且会限制大模型获得本质新颖的知识与能力；

三是即便训练出超级大模型，人类当下的智识水平可能限制我们认识它。

AI 就像一面照妖镜，将摧毁人类社会中没有价值的事情，倒逼所有行业回归价值本原，让人类做真正有价值的事。

专注于AIGC的技术发展和商业应用，在人工智能时代，致力于让新技术为更多的普通人赋能增效。

最新文章

年底了，发财唯一的机会来了（错过再等一年！）

满天飞的私董会，塌房的网红来排队

ChatGPT诞生700多天了，世界发生了什么?

落幕：土老板们的IP梦

为什么现在的年轻人都不想上班了？

Sora正式发布，测评！

OpenAI 直播第二天，这些内容值得关注！

OpenAI o1 正式发布！堪称王炸级的更新！它到底有多强！

人工智能系统已经具备了主观体验。

抖音网红羊毛月为什么会惹众怒？

无路可逃的债务困境，为何个人破产法迫在眉睫？

无路可逃的债务困境，为何个人破产法迫在眉睫？

128G用户哭了！微信或将迎史诗级“瘦身”，网友：内存有救了。

128G用户哭了！微信或将迎史诗级“瘦身”，网友：内存有救了。

李子柒：不只是网红，更是文化符号

李子柒：不只是网红，更是文化符号。

谷歌下一个AI爆款：Learn about

恐怖袭击：珠海驾车撞人事件35死43伤。

恐怖袭击：珠海驾车撞人事件35死43伤。

手机里的微信群为什么都死了。。。

AI浪潮将席卷一切

AI浪潮将席卷一切

别让追问意义，困住你的人生

别让追问意义，困住你的人生

特朗普和哈里斯，谁上台对中国最有利？

AI数据中心的万卡集群，是如何运作的？

马斯克被曝：非法创业

马斯克为什么要发明“筷子夹火箭”？

思考：为啥现在AI没什么热度了？

AI军事与战争：美国国防科技AI公司估值140亿美元

一口气了解洗钱，你不知道的花活儿~~~文章1万字有点长，有点干，先泡好茶。

马斯克放弃千亿身家，正在密谋一件改变人类的大事！看完此文，突破阶层！

如果AI聪明到不服管！还有别的路吗？

美元霸权之真相：理性看待全球货币体系

台积电/三星/英特尔斗地主：决战2nm芯片制程工艺

你儿子多大了

为啥诺奖要颁发给两位AI教父

网红大蓝是怎么教你炒股的？

老美是如何将日本芯片行业：揍趴下的

AI 失业，卢德运动是历史前鉴吗？

想知道中东为什么老是打仗，你得先知道以色列的由来

英特尔是怎么被3年亏200亿美元的代工业务拖垮的

A股还能涨多久

A股第一批韭菜已经长起来了

你已经掉进了，消费主义陷阱

除了聊天，AI改变世界了吗

现在找女朋友已经卷出了新高度

AI 时代个人精进：打破泡沫，找到法门

AI 大模型泡沫终将破灭

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉