关注我们丨文末赠书
2024 年度诺贝尔物理学奖揭晓之后,不少网友表示出乎意料,更有人笑称这是物理学将计算机科学给“收编”了。
两位获奖者约翰·J·霍普菲尔德(John J. Hopfield)和杰弗里·E·辛顿(Geoffrey E. Hinton),皆因他们在上世纪 80 年代各自在人工神经网络领域的独立研究成果而获此殊荣。
虽然他们在研究工作中使用或借鉴了物理学方法,但公众普遍认为当下人工智能技术掀起的浪潮,也是诺奖评委会不可忽视的因素。
而获奖者之一的杰弗里·辛顿博士,则一直奋斗在人工智能的前线,坚持对人工神经网络的研究,在坐了 30 年冷板凳之后终于迎来了 AI 市场大爆发,他也获得 2018 年度图灵奖,是学界与业界公认的“AI教父”。
▲辛顿博士
辛顿博士对人工神经网络的突出贡献,就是在训练神经网络中推广反向传播算法,实现了深度学习的重大突破。在深度学习基础之上的大语言模型,则涌现出超预期的智能,成为此次技术革新的推动力量。
无疑,对于技术人来说,吃透深度学习就能把握 AI 发展的脉络,但深度学习会不会高深难学?
有这两本书相助就可轻松学会:《破解深度学习(基础篇):模型算法与实现》与《破解深度学习(核心篇):模型算法与实现》。它们以“只说人话”的风格讲透了深度学习的原理,帮助读者在工作中自如运用,解决实际问题。
▼点击下方,即可购书
我们先来了解深度学习的基本原理,以及它如何改变世界。
深度学习改变世界
深度学习是机器学习的一个分支,它基于人工神经网络的学习算法。深度学习模型通过模仿人脑的神经元网络来处理数据和识别模式。深度学习模型由多层组成,每一层都包含节点(或神经元),这些节点可以学习数据的不同特征。
深度学习模型通常需要大量的数据来训练,以便学习有效的特征表示,数据从输入层流向输出层,模型通过反向传播算法和梯度下降等技术来调整网络中的权重。
当前有三类主流深度学习模型:卷积神经网络(CNN)适合处理具有网格状拓扑结构的数据,比如图像;循环神经网络(RNN)适合用来处理序列数据,如文本或时间序列;注意力神经网络适合文本生成、机器翻译、文本摘要等。
当今世界正在被基于深度学习的 AI 产品所改变,ChatGPT 即是一个引爆点。另外,在自动驾驶、医疗诊断、推荐系统、信息安全等领域,深度学习也得到了广泛应用,已经在影响着我们的工作和生活。
可以预见,能透彻掌握深度学习的技术人,在市场上会何等抢手。但当前多数讲深度学习的图书处在专家视角,对于初学者来说门槛过高。抱着让深度学习可以轻松学会并上手的目标,本书的作者团队以自己在 AI 教育领域的经验,写出了这套系统化、学习体验优异的深度学习著作。
本书三位作者均是来自学界和业界的人工智能专家,拥有多年的研究与应用经验,我们来认识一下他们。
瞿炜,美国伊利诺伊大学人工智能博士,多个顶级学术期刊审稿人及国际学术会议委员。他在人工智能业界拥有20余年的技术积累和实践经验,曾先后在互联网、医疗、安防、教育等行业的多家世界 500 强企业担任高管。
作为知名教育博主,他擅长用通俗易懂的表达方式结合直观生动的模型动画,讲述复杂的人工智能理论与算法;创作的人工智能系列视频和课程在B站(账号:梗直哥丶)、知乎、公众号、视频号(账号:梗直哥丶)等平台深受学生们的欢迎和认可,累计访问量超数千万人次。
李力,人工智能专家,长期致力于计算机视觉和强化学习领域的研究与实践。他曾在多家顶尖科技企业担任资深算法工程师,拥有10余年行业经验,有效地应用先进模型解决图像识别、目标检测、自然语言处理、机器人研发等多个领域的实际问题。
杨洁,人工智能和自然语言处理领域资深应用专家,在自然语言理解、基于知识的智能服务、跨模态语言智能、智能问答系统等技术领域具有深厚的实战背景。她拥有10年以上的行业管理经验,擅长引领团队将复杂的理论转化为实际应用,解决行业中的关键问题。
现在就跟随这三位大神,从基础入门进阶成为深度学习高手。
从基础入门进阶成为深度学习高手
在深入探索深度学习之前,我们需要具备一些编程基础,会使用 Python 语言,熟悉一些常用库的操作。本套书中的示例基于流行的 PyTorch 深度学习框架编写,读者可以选择 PyCharm 或者 Visual Studio Code 编辑器搭建运行调试环境。
做好准备工作后,就可以从基础入门、高手进阶两部分来学习了。
基础入门
本部分的内容在《破解深度学习(基础篇):模型算法与实现》一书中,它从深度学习的基本概念和应用领域讲起,引导读者首先了解必要的数学预备知识:
▮微积分,需要理解函数梯度、梯度下降法则等概念;
▮线性代数,它在处理神经网络中的矩阵和向量运算中起着关键作用;
▮概率统计,它是评估模型性能和处理不确定性的关键工具。
接着详细介绍了深度学习环境的搭建,包括 Python 安装、深度学习框架 PyTorch 的使用,以及 Jupyter Notebook 等实用工具的操作。
具备了实验环境,书中深入讲解了深度神经网络的核心原理,包括多层感知机、前向传播和反向传播、回归和分类问题等,以及神经网络训练过程中的常见问题,如过拟合和欠拟合,以及相应的正则化解决方案。
该部分对三大流行深度学习模型逐一介绍,首先是基础卷积神经网络,包括从图像卷积、卷积层、池化层到具体的代码实现;其次是基础循环神经网络,包括RNN、LSTM等;最后是注意力神经网络,详细介绍了注意力机制的原理和常见的注意力机制模型 Transformer。
▲图像卷积运算过程
这部分的学习,可以帮助读者建立起深度学习的全局知识框架。
高手进阶
打好基础的读者,可以在这部分去探索深度学习的核心知识,主要内容在《破解深度学习(核心篇):模型算法与实现》一书中。
书中先是回顾了目前已有的经典卷积神经网络模型,如 AlexNet、VGGNet、GoogLeNet、ResNet 和 DenseNet 等,接着讲解了长短期记忆网络(LSTM)和门控循环单元(GRU)等经典的循环神经网络结构,以及常用的优化算法和正则化方法。
然后对大规模预训练模型进行介绍,包括 BERT、GPT 系列、T5、ViT 等,还介绍了更复杂的深度神经网络模型和基于概率统计的建模技术,包括变分自编码器(VAE)、生成对抗网络(GAN)和扩散模型等。
本书详细介绍了深度学习的三大应用方向:
▮ 计算机视觉:包括数据加载、图像数据增强、迁移学习等,并辅以实战案例,深入剖析相关技术的实现细节。
▮ 自然语言处理:阐释人机交互、语义处理等方面的技术原理,并给出相关数据集及实战案例,如词嵌入、预训练模型、Hugging Face 库的使用等。
▮ 多模态生成式人工智能:探索 AIGC 方向的前沿模型,如 CLIP、DALL·E 系列和 InstructGPT 等。
这部分的学习使读者能够将理论知识应用到实际问题中,快速提升深度学习的实战能力,并把握未来的发展方向。
结语
《破解深度学习(基础篇):模型算法与实现》和《破解深度学习(核心篇):模型算法与实现》这两本书体系化地讲透了深度学习的各方面知识,有四大特点,是学习深度学习的理想之选。
▮“只说人话”,破解难题:将深度学习中复杂的概念和算法用“人话”表达,通过生动的类比结合日常生活案例,使得初学者和非专业读者也能够轻松理解。
▮ 贴合应用,突出实战:书中提供了大量的实战案例和详尽的代码实现,这种”应用为先、实战为重“的教学方式,确保读者能够将所学知识应用于解决实际问题。
▮ 图文视频,三位一体:采用了图文、动画和视频相结合的方式,使深度学习的原理和应用场景直观生动,帮助读者轻松理解深度学习的概念和模型。
▮ 多元互动,个性辅导:有配套的 GitHub 专栏课程和视频课程,还有专业的答疑团队可以互动交流,为读者提供个性化的问题解答和技术支持,真正实现因材施教。
《破解深度学习(基础篇):模型算法与实现》适合初学者,如学生、转行者或独立学习者,帮助他们快速入门。而《破解深度学习(核心篇):模型算法与实现》则适合已经具备一定深度学习基础的专业研究者、算法工程师,帮助他们进阶为高手。
AI 的研究和应用还将风起浪高,真正破解深度学习之秘者,必定能勇立潮头!
—END—
说说你认为深度学习有哪些应用?
在留言区参与互动,并点击在看和转发活动到朋友圈,我们将选1名读者获得赠书1本,截止时间11月15日。