[送5本]《大模型制造业的构建与实践》制造业人必要破除的AI大模型误区

科技 2025-01-11 00:01 北京

免费送5本新书《大模型制造业的构建与实践》官方配套习题集，参与方式：关注下方公众号并“大模型科技说”公众号后台回复关注截图，并本文末留言，我们随机抽取5位幸运读者送书，截止时间1月12号晚24点。

大模型作为人工智能领域的革新技术，对很多人尤其是人工智能领域之外的人而言，具有一定的新颖性和神秘感。人们对大模型进行理解与认识的过程中往往存在着一些误区，这阻碍了人人拥抱大模型、有效使用大模型。

所以有必要介绍几种常见的误区，让制造业的同仁对大模型有更清楚的认识。

误区一：大模型是新型搜索引擎

有很多人认为 ChatGPT 这类自然语言生成应用，在回答问题的时候，是先检索资料或者在网络上搜索，从资料或者网络信息中找到答案，最后返回给用户。

这种说法是不准确的。

事实上，大模型和搜索引擎存在着显著区别。

1. 工作原理不同

大模型能够回答问题是基于模型所具有的推理能力，是一种“无中生有”的生成新信息的过程。而这种能力是在大量数据集上进行训练和学习获取的。

搜索引擎是一种通过对互联网上的网页和其他在线资源进行索引来帮助用户查找信息的服务。其工作原理是检索并排序已存在的网络信息，而非生成新信息。

2. “预知未来”的能力不同

面对从未出现过的信息，由于没有网络留痕，搜索引擎无法检索到准确的匹配结果。而大模型却能够对此做出一定的推理和回答，只不过这种回答通常是“胡说八道”，通常将这种现象称为“幻觉”。但是，至少大模型“假装”知道答案。

目前，为了防止大模型出现“幻觉”，会采用价值对齐等方式，避免它“胡说八道”。

3. 大模型有望取代搜索引擎

大模型是一种新的知识表示和调用方式，有取代搜索引擎成为下一代信息检索工具的趋势。在人类知识表示和调用方式的演进历史中，先后经历了口口相传、文字记录、数据库等历史阶段。目前最流行的方式是谷歌、百度等搜索引擎。

鉴于大模型友好的自然语言交互特性和强大的能力，大模型有望成为下一代的信息检索工具。

误区二：大模型就是通用人工智能

以大模型为核心的智能应用表现出了强大的能力，在各自的领域中取得了显著成果。例如：

ChatGPT 在对话聊天方面为用户带来了前所未有的互动体验。
Sora 在文生视频方面极大地拓宽了多媒体创作领域的边界。这些技术进步与创新应用让很多人夸张地惊呼“现实不存在了”“通用人工智能时代已经来临”。

然而，尽管这些基于大模型的应用展现了较高的智能化水平，但它们仍然是在特定任务上才具有高适应性的专用系统，而非真正意义上的“通用人工智能”。

通用人工智能（AGI） 是指具有人类水平的综合智能，能够在任何未预先编程的领域中学习并解决问题，同时具备跨领域的适应性和自我意识。

目前的大模型技术，尽管在特定领域表现卓越并有逐步扩展的趋势，但在解决抽象思维问题、自主思考与创新以及对自身行为的理解等方面，距离真正的通用人工智能还有较大差距。

因此，既不应过分夸大大模型的能力，也要正视大模型朝通用人工智能发展的速度。

误区三：大模型给出的结果和答案就是正确的

由于大模型在很多时候能够提供准确、合理且有深度的答案，很多人乐意使用大模型。久而久之，人们在面对大模型给出的答案时，往往会不假思索地将其当成正确答案，完全信任大模型。

事实上，这种做法是不对的，是一种具有极大风险的行为。

由于大模型的技术特点，并不能简单地认为大模型给出的所有结果和答案都是绝对正确的，主要有如下几个原因。

1. 算法局限性

目前，大模型是基于概率统计实现的。大模型的技术原理是根据已学习的数据分布进行预测，把预测结果的抽样作为答案反馈给用户。因

此，即使模型结构再强大，也无法保证对所有问题都能找到 100% 正确的答案，尤其是在逻辑推理、道德判断等更需要深入思考的问题上，大模型无法给出完全符合人类价值观或真理的回答。

当然，目前大模型的研究正朝着高准确性和价值对齐的方向演进，有望通过其他技术手段突破模型本身的局限性。

2. 数据依赖性

大模型的构建基于其训练时所使用的数据集。如果数据集中存在错误、偏见或不完整之处，模型也会“学偏”，就会在处理相关信息时得出不准确的答案。正如人类的学习过程一样，如果学习的时候采用了不恰当的教材，那么学生的认知和做事的方式就很难保证正确。同理，大模型输出答案的准确性也取决于训练数据的质量。

3. 上下文理解

尽管大模型（如 GPT 系列）在理解上下文方面有所改进，但仍然可能出现对复杂语境理解不准确的情况，导致回答偏离正确方向，尤其是当用户的问题有歧义的时候。

4. 实时更新性

模型一旦训练完成并部署，对于它未学习过的最新知识或实时更新的信息就可能无法掌握。因此，在某些特定领域，特别是快速发展的科学和技术领域，它所提供的信息可能滞后或不准确。

因此，大模型虽然展现了强大的智能，但用户在实际应用中仍需谨慎对待其输出，并结合专业知识、人工审核及不断的优化迭代来确保结果的准确性。

更进一步，我们制造业的从业者，如何将大模型落地到实际的生产与设备运维等场景中呢？这是一个需要更大篇幅来深入探讨的问题。

欢迎关注我的新书《大模型制造业的构建与实践》，从实际的制造场景出发，对构建与落地问题都进行了详细阐述。并且，结合生活和历史小故事，对一些深奥的概念进行类比讲解，适合各类型读者阅读。

目　　录

前言

基础篇

第1章　制造业与大模型 2

1.1　制造业的数字化进展 2

1.1.1　企业数字化 3

1.1.2　智能制造 8

1.2　大模型的基本知识 11

1.2.1　什么是大模型 11

1.2.2　大模型的基本能力 12

1.2.3　对大模型的常见误区 17

1.3　制造业为什么需要大模型 19

1.3.1　大模型赋能制造业 19

1.3.2　制造业是大模型的主战场 20

1.3.3　大模型在制造业中的应用 22

1.3.4　制造业大模型 24

1.4　小结 26

小故事 27

第2章　大模型基础 28

2.1　人工智能的发展历程 28

2.1.1　人工智能发展的三起三落 29

2.1.2　人工智能技术的流派之争 34

2.2　大模型简介 36

2.2.1　模型的概念 37

2.2.2　模型的分类 37

2.2.3　大模型的发展 39

2.3　大模型架构原理 41

2.3.1　Transformer架构的背景 41

2.3.2　Transformer架构的原理 42

2.3.3　Transformer架构模型的特点与发展 51

2.4　小结 53

小故事 54

第3章　大模型构建路径 55

3.1　大模型构建的基本方法 55

3.1.1　基本路径 55

3.1.2　资源准备 59

3.2　数据处理 62

3.2.1　低质过滤 62

3.2.2　冗余去除 63

3.2.3　隐私消除 65

3.3　分词 65

3.3.1　词级分词 66

3.3.2　字母级分词 67

3.3.3　子词级分词 67

3.3.4　中文分词 71

3.3.5　常用的分词器 72

3.4　词嵌入 73

3.4.1　独热编码 73

3.4.2　Word2Vec 75

3.4.3　常用的词嵌入方法 77

3.5　模型训练 79

3.5.1　模型构建 79

3.5.2　模型训练步骤 80

3.6　小结 83

小故事 84

第4章　大模型价值对齐 85

4.1　预训练模型的局限性 85

4.1.1　可控性 86

4.1.2　鲁棒性 88

4.1.3　安全性 89

4.1.4　大模型幻觉 90

4.2　指令微调 91

4.2.1　有监督微调 92

4.2.2　奖励模型 94

4.2.3　基于人类反馈的强化学习 95

4.2.4　指令微调总结 96

4.3　混合专家模型 96

4.3.1　MoE的概念 97

4.3.2　MoE的基本原理 98

4.3.3　MoE的实现方式 101

4.3.4　MoE总结 104

4.4　小结 106

小故事 107

第5章　多模态大模型 109

5.1　多模态大模型简介 109

5.1.1　多模态大模型的概念 109

5.1.2　多模态大模型的发展历程 112

5.1.3　多模态大模型的主要任务 113

5.2　多模态基本技术 115

5.2.1　多模态编码 115

5.2.2　多模态融合 117

5.2.3　对比学习 118

5.3　AIGC技术 119

5.3.1　生成对抗网络 119

5.3.2　扩散模型 121

5.4　AIGC应用 127

5.4.1　常用的多模态大模型 128

5.4.2　文生图 128

5.4.3　文生视频 130

5.5　小结 134

小故事 136

第6章　提示词工程 137

6.1　提示词简介 137

6.1.1　提示词的概念 137

6.1.2　提示词的必要性 140

6.1.3　提示词的类别 141

6.2　提示词工程技术 142

6.2.1　少样本提示 142

6.2.2　零样本提示 143

6.2.3　提示词通用技巧 145

6.3　思维链系列技术 152

6.3.1　思维链 153

6.3.2　思维树 155

6.3.3　思维图 157

6.4　对抗提示 157

6.4.1　提示词攻击 158

6.4.2　防御策略 159

6.5　小结 160

小故事 162

应用篇

第7章　制造业企业应用大模型的方法 164

7.1　企业应用大模型的8种情形 164

7.1.1　企业资源现状 164

7.1.2　大模型应用的8种情形 167

7.2　垂直制造领域大模型的构建方法 169

7.2.1　全量微调 170

7.2.2　局部微调 170

7.2.3　适配式微调 171

7.2.4　前缀式微调 173

7.2.5　外挂式微调 175

7.2.6　混合式微调 177

7.2.7　微调技术对比 178

7.3　大模型检索增强生成 179

7.3.1　RAG的概念 181

7.3.2　向量数据库的构建 182

7.3.3　相似检索 185

7.3.4　智能生成 186

7.3.5　RAG效果评估 188

7.3.6　RAG应用场景 190

7.4　小结 190

小故事 193

第8章　基于大模型的AI Agent 195

8.1　AI Agent简介 195

8.1.1　AI Agent技术简史 195

8.1.2　对AI Agent的不同理解 197

8.2　AI Agent原理 199

8.2.1　基本框架 200

8.2.2　感知模块 201

8.2.3　大脑模块 204

8.2.4　行动模块 206

8.2.5　大模型与AI Agent的关系 207

8.3　AI Agent应用 208

8.3.1　流行的AI Agent 208

8.3.2　AI Agent与RPA的关系 211

8.4　LangChain：AI Agent高效实战工具 213

8.4.1　LangChain工具简介 214

8.4.2　提示词模板 216

8.4.3　链模块 218

8.4.4　代理模块 224

8.5　小结 225

小故事 227

第9章　大模型部署与压缩 228

9.1　大模型部署 228

9.1.1　云端部署 228

9.1.2　边缘部署 230

9.2　大模型压缩 231

9.2.1　模型压缩简介 232

9.2.2　蒸馏 234

9.2.3　量化 236

9.2.4　剪枝 238

9.2.5　参数共享 239

9.3　软硬件适配 241

9.4　小结 242

小故事 243

第10章　工业制造大模型的应用实践 244

10.1　工业制造大模型简介 244

10.1.1　工业制造大模型的概念 244

10.1.2　工业制造大模型的种类 246

10.1.3　工业制造大模型的构建方式 247

10.2　大模型在生产制造环节的应用 248

10.2.1　智能排产 249

10.2.2　生产工艺优化 251

10.2.3　产品质检 252

10.2.4　工业机器人 255

10.3　小结 257

小故事 258

第11章　设备运维大模型的应用实践 259

11.1　设备运维大模型的现状 259

11.1.1　设备运维行业的特点 259

11.1.2　设备运维大模型的行业案例 262

11.2　电梯运维行业 264

11.2.1　电梯运维简介 265

11.2.2　电梯运维行业的挑战 267

11.3　大模型在电梯运维行业的应用 268

11.3.1　人才培养与培训 269

11.3.2　预测性维护 271

11.3.3　运维现场规范管理 274

11.3.4　智能客服与知识问答 276

11.3.5　运维档案管理 278

11.4　小结 280

小故事 282

第12章　总结与展望 283

12.1　大模型技术大观园 283

12.1.1　技术理论流派 284

12.1.2　思想与技术 286

12.2　大模型应用万花筒 289

12.2.1　赋能千行百业 289

12.2.2　制造业应用 292

12.3　大模型展望 292

12.3.1　正确认识大模型 293

12.3.2　Transformer是终极架构吗 294

12.3.3　模型越大越好吗 295

12.3.4　通用还是垂直 297

12.3.5　大模型与机器人 299

12.3.6　伦理与道德 300

12.4　小结 302

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。

最新文章

终于弄懂了《Transformer入门到精通》高清pdf分享

困在“第一学历”里的博士

所有大模型领域学习者必读论文，没有之一！由深度学习三巨头联合撰写！

深度｜Scale AI 95后华裔创始人：AI Agent的分水岭在于产品设计而非技术本身

AMD发布科研Agent，论文自动化评分趋近顶会NeurIPS水平~

微软 Phi-4：小模型的大智慧——技术详解及简单测评

最新中文版大模型书籍《大语言模型从理论到实践》免费pdf分享

GAN归来：模型大幅简化，训练更稳定，逆袭扩散模型，AI社区疯传

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

Phi-4技术报告解读及简单测评

亲妹控告 Sam Altman 性虐待：将其告上法庭

[送5本]《大模型制造业的构建与实践》制造业人必要破除的AI大模型误区

2024 年度总结 LLM System Research：过去半年的科研心路历程

央国企！入局AI大模型（附66家名单）

让7B千问模型超越o1，微软rStar-Math惊艳登场，网友盛赞

下载10W+深度学习4大神书《深度学习科学》免费pdf下载

叹惜！年仅40岁，985教授离世一年后，成果登上Nature

下载10W+爆火神书《基于LangChain进行生成式AI开发》免费pdf分享

微软Phi-4开源，14B的王~

大厂新年第一裁，微软全部门危！内部员工：客户宁愿跳槽也不想与我们 IT 部门打交道

必看！大模型训练圣经《从头训练大模型》免费PDF分享

突发！长鑫存储、长江存储、中芯等被列入黑名单！

最新中文版大模型书籍《大语言模型从理论到实践》免费pdf分享

深度｜谷歌前CEO：即使美国赢得比赛第一阶段，也有充分理由相信中国最终会赢得这场竞赛，他们能够更快地在大规模产品中采纳技术

deepseek v3训推优化的剖析

英伟达「世界基础模型」诞生，引爆物理AI革命！75页报告出炉，GitHub狂飙2k星

学术顶会变成了“大厂”顶会?

所有大模型领域学习者必读论文，没有之一！由深度学习三巨头联合撰写！

AAAI 2025论文中了：没算法没实验，全靠idea思路好...

Github32k收藏，2025最新《Transformer入门到精通》高清pdf分享

老黄亮出全球最小超算，大模型在家跑！5090惊天问世，惊爆价16499

大语言模型中的查询优化技术：从基础到前沿的全景解析

手机也能玩RAG？谷歌EdgeRAG做到了~

Yann LeCun力荐！Facebook、Meta AI大佬编写《深度学习原理》经典教程书！

痛心！无人机领域顶尖专家张代兵博士去世，年仅47岁！知情人曝光原因…

终于弄懂了《Transformer入门到精通》高清pdf分享

刚刚，奥特曼更新博客：创业第十年，我的反思

TradingAgents：用多Agent框架炒股，多赚6个点收益

计算DeepSeekV3训练的MFU

神书《从零构建大模型》分享，尚未发布，GitHub标星22k！！

讣告：沉痛悼念博士生杜梅同学

必看！大模型训练圣经《从头训练大模型》免费PDF分享

DeepSeek-V3技术报告完整解读

LLM中的Attention实现及优化

在字节干大模型，是一种怎样的体验?

突发！SK海力士裁员！赔偿1年薪水！

[送5本]周志华“西瓜书”《机器学习》官方配套习题集

Infra视角下的DeepSeek-V3，到底有多强？

2025，AI Agents爆发元年~

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉