首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

我的新书出版了！

职场 2024-12-18 08:05 上海

文|方进（转载请注明出处）

公众号：数字AI方进

微信号：fjibj115952

从2023年起，我开始在公众号上写和数字人相关的技术文章，到收到人民邮电出版社编辑的写书约稿，再到《AI数字人原理与实现》的成书完稿，时间匆匆已过一年多。

▼点击下方，即可购书

在数字化浪潮中，AI数字人技术以其独特魅力和巨大潜力，正悄然改变我们的生活。

从2012年洛天依作为中国首位虚拟歌手的诞生，到2023年AI孙燕姿成为热议话题，再到如今数字人技术让我们重温逝去亲人的温暖，这项技术不只是代码和模型的堆砌，它承载着情感，实现着梦想。

这些年，我一直深耕于前沿技术领域，在多家知名企业成功推动机器学习平台建设，领导模型创新工作。

同时，我也密切关注数字人行业，通过开源项目和学术研究，不断提升自己的数字人系统构建技能：精通SD图生成、VITS语音合成等技术，实现了数字人在形象、语音和情感等方面的创新创作。

我深知自己在数字人领域的探索之路还很长，希望通过《AI数字人原理与实现》与读者分享我的知识和经验，同时也期待与读者一起见证数字人技术如何改变我们的世界。

因此，我结合自己在数字人相关领域的多年研究和实践经验，以及对国内外预训练语言模型的深入分析来讲解相关内容。

每个技术点都配有详细的代码实现，确保读者能够快速上手，将理论知识转化为实际操作能力。

同时，这本书也对数字人技术的未来发展趋势进行了探讨，为读者描绘了一个充满希望的技术蓝图。

说真的，我特兴奋，这本《AI数字人原理与实现》在今天终于能跟大家见面了！

Part.1

创作

我从小就对机器人和数字分身充满憧憬，这份憧憬随着我对科技的热爱而滋长。

现在，和孩子们一起捣鼓机器人编程的时候，我仿佛重返童年。

《哈利波特》里的赫敏使用时间转换器的情景，激发了我对能同时处理多项任务的数字分身的无限向往。

在 AI领域工作的我，时常幻想拥有一个数字人能在我忙碌时替我工作和学习，让我有更多的时间去追求那些尚未实现的梦想。

最近几年，随着计算机视觉、语音识别、深度学习等技术的进步，数字人在智能水平上有了很大的提升，能够进行更加复杂的环境感知、多轮智能对话和知识表达。

数字人现在已经走进我们的生活，我来举几个例子：

（1）虚拟偶像的崛起

比如洛天依，这个中国本土的虚拟偶像在舞台上魅力四射，更在社交媒体上和粉丝互动，成了现实和虚拟世界的连接点。洛天依不仅技术上厉害，商业上也很成功，代言、演唱会、周边商品都很受欢迎，这不仅是技术的胜利，也是文化自信的体现。

（2）数字人技术逐步走向成熟

去年，AI孙燕姿火了一把。通过向AI输入大量孙燕姿的声音数据，构建了一个声音模型，进而利用这个模型演绎其他人的歌曲，效果就像孙燕姿本人唱的一样，声音、表情、唇形都特别像。

这显示了数字人在声音和形象模拟上的能力，也让我们看到了科技和人文的结合。这些虚拟人物不仅能理解我们的情感，还能在教育、娱乐、医疗等领域提供帮助。

（3）数字人技术的多面性

数字人技术还能用在更温馨的地方。比如商汤科技用数字人技术“复活”了已故的汤晓鸥教授，让他以数字化的形式继续表演脱口秀，挺感人的。但同时，数字人技术也带来了风险，有人用AI技术伪造声音进行诈骗，造成了损失，比如“睿声三只羊AI假声”事件。这提醒我们，在享受技术便利的同时，也要警惕潜在的风险。

技术的飞速发展让我意识到，想象中的场景正在变成现实。

AIGC时代的到来，为数字人的发展提供了前所未有的广阔天地。我深信，只要我们保持对知识的渴望，不断深入研究，那些看似遥不可及的梦想终将成为可能。

正是这种对未来的憧憬和对技术的追求，促使我决定写本书。

做事得有计划，我本想用思维导图工具提高效率，结果我得到了一份特别长的思维导图。

不开玩笑，我做个数字人可能需要3个月，但按这个写估计至少得3年。没办法，我只能请出我随身携带的神器——一枝快写不出来的签字笔，在笔记本（非电脑）中找到半页空白，写了起来……

后面，考虑到国内少有全面介绍数字人技术的图书，我又希望自己写的书能够为那些对数字人技术充满好奇和热情的读者提供一个详尽的指南，帮助他们在这一新赛道上抢占先机。

那么，光图片上的内容肯定不够，于是，我又多次修改了大纲，决定从数字人的定义、发展历史到分类，从系统架构到算法实现，再到应用实践和未来展望，统统深入地讲解一遍。这样一来，就能让读者能够从零开始，逐步掌握构建数字人的核心技能，形成一套完整的知识体系。

Part.2

内容

很多读者可能好奇，《AI数字人原理与实现》这本书究竟包含哪些内容。

简单来说，这本书从技术基础、应用实践和未来展望三个角度，全面剖析了数字人技术。它不仅详细介绍了数字人的系统构建、视觉和听觉处理、智能对话等技术细节，还讨论了数字人技术的风险和人机协作的未来。

（1）技术基础

在开篇的技术基础部分，我们首先对数字人的定义、发展历程、分类及其应用场景进行了介绍，为读者构建了一个全面的知识框架。

接着，我们详细讲解了四种数字人的核心技术：视觉算法、语音合成、语义理解和知识表示，并通过代码实战的方式帮助读者快速掌握这些技能，并将理论知识应用于实际，从而创建出属于自己的数字人。

在数字人的创作过程中，我逐渐找回了自己。每一项技术的突破都像是在重塑自我。

视觉算法让“我”学会了如何更像人类。

语音合成技术让“我”的声音自然且充满感情。

语义理解技术让“我”能听懂人类语言，实现智能交互。

知识表示技术，特别是预训练语言模型，赋予了“我”学习和思考的能力。

你是否也想造一个这样的“自己”呢？如果想的话，可以跟着这本书的实践部分进行实战。

（2）应用实践

在应用实践部分，我们深入剖析了数字人创作的全流程，涵盖了从内容策划、角色建模到交互设计的每一个环节，并对每个步骤进行了详尽的阐释。这是一次技术与艺术的深度融合，使读者能够全面掌握数字人创作的各个环节。

此外，本部分还深入探讨了数字人身份的认同问题以及相关的技术规范，强调了“技术是把双刃剑”的观点，分析了数字人的“善与恶”，引导读者深入思考数字人技术在安全性和社会伦理方面的挑战。

除了理论和实践并重外，对数字人技术的未来发展方向当然也不会忽视。

（3）未来展望

在未来展望部分，我们探讨了数字人技术的未来发展方向，将其与元宇宙、数字孪生、具身智能等概念相结合，勾勒出一幅宏伟蓝图：数字人“替身”将在元宇宙中生活，而数字人的“具身”将融入人类世界。

在虚拟现实和增强现实技术的加持下，数字人不再局限于屏幕和网络，它们可以出现在现实世界的任何角落，与我们进行面对面的交流。这种技术的进步，让虚拟与现实的界限变得模糊，为我们的生活带来了前所未有的体验。

未来，数字人技术可能会成为人类文明发展的一个重要里程碑，它将如何塑造我们的世界，让我们拭目以待吧。

Part.3

设计

这本新书对于我意义非凡，尽管时间紧迫、任务繁重，我仍希望它能成为一部经得起时间考验的经典。在内容和设计上，我和出版社的编辑团队都倾注了大量心血。

首先是封面的设计，异步的设计师为我们精心打造了两个版本。

1

1

我还在公众号上邀请读者朋友们分享他们对封面的第一印象，以便我们共同决定选出最满意的封面。

大多数读者倾向于选择第一种封面设计，于是我们根据反馈，比如“蓝的，数字人做成点阵凸起”，对封面的元素和布局进行了调整，最终确定了封面的设计。

(样书)

然后是书中代码的设计，为了便于读者实践和学习，书中的所有源代码已在GitHub(https://github.com/fjibj/from_0_to_1 )上公开，我会持续更新和修正，确保内容的准确性和实用性。

除此之外，随书附赠全书知识架构的思维导图。

这是我根据书中的重点内容精心整理的，旨在帮助你快速了解数字人技术的整体框架，并掌握各章节的核心要点。

最后，我想说的是，数字人技术的进步不仅标志着技术的革新，而且代表了人类对自我认识的拓展。

《AI数字人原理与实现》不单是一本著作，更是一场深入数字人世界的探险之旅。我期望通过这本书，能够点燃更多人对数字人技术的好奇心和热情，携手步入这个充满无限潜能的新纪元。

—END—

最后附上宣传海报一张，欢迎大家踊跃购买！

同时附上【荐书官招募计划】，有赠书、有佣金，无订金，大家赶紧报名吧！

技术领导力

分享科技商业洞见。作者Mr.K，黄哲铿，知名数字商业顾问，「顿悟山丘」创始人，曾担任海尔、中通、1药网技术高管，著有《技术人修炼之道》《技术管理之巅》。近期关注：AI大模型、数字化转型、新媒体IP、科技领导者成长。

最新文章

接下来几年，一定要敬重自己的饭碗

2025年，守住、忍住、挺住

吴晓波预见2025跨年演讲，这个AI帮你秒看

一个人最顶级的能力：认知力、心力、执行力

百度AICA第八期正式收官 79名首席“AI架构师”毕业执桨起航

2024年搞AI，方向不对，努力白费

将军赶路，不追小兔：给管理者的5条建议

暴跌了！暴跌了！

讨厌一个人，最好的办法不是翻脸，降熵就行了

2024年RAG 发展回顾（万字长文）

月薪已炒到15w？真心建议技术人也冲一冲行业新兴领域，工资高前景好！

停更了，提前说下

去复旦学AI，彻底爆了

你的一切痛苦，都源于对人性的无知

突发！商汤科技，爆了

今年的优秀员工奖，都被AI抢走了

AI能帮助科学家做实验？首个科学计算基座大模型BBT-Neutron开源了！

建议所有人都去做小红书，赢麻了！！！

我的新书出版了！

怎样从易疲劳体质，变成一个精力充沛的人？

一觉醒来，老板被AI干掉了

技术和业务，到底谁说了算？

高手，从来不吃低级的苦

世界尽头爱与自由中国历史上第一位诗人的专场音乐歌剧盛典

有这几个迹象，你的个人IP就要凉了

信通院最新报告：百度文心飞桨协同优化推理性能提升百余倍

使用了商汤办公小浣熊，我卸载了所有AI工具

扫过厕所，爱穿皮衣，市值3.6万亿美元，全球首部黄仁勋授权采访的新书来了……

我在阿里月薪6万，结果昨晚看完张一鸣微博，越想越后怕…

华为管理顾问田涛：为什么华为的“95后”“00后”从不躺平？

当今社会最可怕的现象：傻子共振

《奥尔特曼传》：ChatGPT发布2周年，揭秘OpenAI的权力之争

一个人爆发的迹象：停止索取情绪价值

中国报表工具的前世今生

CNNIC报告：文心一言登顶中国生成式AI使用率榜首占比达11.5%

一个人成为领导后，气质就变了

三流领导靠罚，二流领导靠说，一流领导靠...

国产大模型，进入生死战

经济下行，利润却翻倍！AI救了这些企业的命

中国历史上第一位诗人的专场音乐歌剧盛典

定了！全部取消：职场人恭喜了！即日开始实行！

AI全栈布局，重塑企业研发与创新能力

46岁大厂高管，给35岁-45岁人提个醒：职场下半场，做好这3点

职场人，同步一件事！！！

技术管理者，一定要有体系

很多传统CTO，都被干掉了

很严重！未来3年，大家随时做好准备…

技术人员如何提升商业敏感度？

企业数智化新纪元，安全体系保驾护航

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉