10月8日,2024 年诺贝尔物理学奖揭晓,两位人工神经网络的研究者分享此殊荣,他们是约翰·J·霍普菲尔德(John J. Hopfield)和杰弗里·E·辛顿(Geoffrey E. Hinton)。2024年诺贝尔物理学奖得主:约翰·霍普菲尔德(左)和杰弗里·辛顿(右)两人获奖的原因,在于早期对人工神经网络的研究,推动了 AI 技术向前发展,才有了今天人工智能应用的爆发。不过,这也让一些网友心生疑问:今年的物理学奖为啥颁给了计算机科学领域的研究?其实此次物理学奖并非完全“跨界”,两位大神的主要成就都是基于物理学的。· 霍普菲尔德在 1982 年开发的“霍普菲尔德神经网络”(Hopfield network),使用了一种能量函数。
· 辛顿在 1985 年发明的随机神经网络模型“玻尔兹曼机”(Boltzmann machine),则借鉴了统计物理的理念。
有意思的是,辛顿在踏上学术生涯之初并没有计划成为一名计算机科学家,他从小最感兴趣的是人类大脑运作的奥秘。因此,他在剑桥大学学习了物理、化学、数学、生理学等多个学科,但都没有找到他想要的答案。1970年获得实验心理学学士学位后,心灰意冷的辛顿竟然跑去当了一名木匠,但他没有放弃思考,最终决定尝试一个新方向:人工智能。幸运的是,这一次他坚持了下来。辛顿研究的方向是人工神经网络,在那时备受冷落,甚至他的导师都数次劝他转去做符号人工智能。不过辛顿坚信自己的判断是正确的,坐了三十年冷板凳,这段时期后来被称为“人工智能的冬天”。辛顿博士在“寒冬”中一路坚持下来,培养了多位日后名震业界的技术大牛,终于看到基于人工神经网络的深度学习取得重大突破。他因此获得 2018 年度图灵奖,并被业界敬称为“AI教父”。辛顿博士也成为首位诺贝尔、图灵奖“双料”得主。在谷歌公司的盛情邀请之下,辛顿博士曾欣然加盟,但他后来看到 AI 技术跨越式的发展,又心生警惕。在从谷歌辞职之后,他呼吁业界暂缓 AI 研究的步伐,先做好 AI 的安全工作,避免 AI 对人类产生威胁。大模型的技术基础就是深度学习,它基于人工神经网络的学习算法,受到人脑结构和功能的启发。深度学习模型通过模仿人脑的神经元网络来处理数据和识别模式,从而实现各种复杂的任务。在深度学习的领域中,有着大量的相关著作,其中有两本书深受辛顿教授的推崇,我们来具体了解一下。“这是深度学习的权威教科书,由该领域的主要贡献者撰写。此书内容非常清晰、全面并且权威。阅读这本书,你可以知道深度学习的由来、它的好处以及它的未来。”。
本书因其封面上呈现的中央公园杜鹃花步道梦幻景观,而被坊间称为“花书”,是深度学习领域的“圣经”。本书深入讲解了神经网络、深度学习模型、优化算法等关键内容,同时还能学习到如何构建和训练深度学习模型,解决现实世界中的复杂问题。本书由伊恩·古德费洛(Ian Goodfellow)、约书亚·本吉奥(Yoshua Bengio)、亚伦·库维尔(Aaron Courville)三位作者合著。其中的约书亚·本吉奥和杰弗里·辛顿、杨立昆并称为“深度学习三巨头”,共同获得 2018 年度的图灵奖。《深度学习》划分为“应用数学与机器学习基础”、“深度网络:现代实践”、“深度学习研究”三大板块,为读者提供了完整的学习路线。· 第 1 部分介绍深度学习的预备知识,包括基本数学工具和机器学习的概念。
· 第 2 部分系统深入地讲解现今已成熟的深度学习方法和技术,包括卷积网络、循环和递归网络等经典的网络架构,分析正则化、深度模型优化等几乎每位学习者都会遇到的问题,并介绍深度学习在实际中的应用。
· 第 3 部分探讨深度学习未来的研究重点,这些具有前瞻性的方向和想法能够使读者在掌握深度学习技术的基础上进一步思考未来的研究方向,提升学习深度、拓宽学习广度。
深度学习在许多软件领域都发挥了重要作用,包括计算机视觉、语音和音频处理、自然语言处理、机器人技术、生物信息学和化学、电子游戏、搜索引擎网络广告和金融。本书适合正在学习机器学习的专业学生、人工智能研究者。对于没有机器学习或统计背景的软件工程师,本书也提供了充分的理论指导,可以帮助读者快速掌握知识,并在工作中应用。【Hitton推荐】:
“Christopher Bishop在1995年撰写了一本非常出色的神经网络教科书,他对这一领域及其核心思想有着深刻的了解。他在解释神经网络方面的多年经验使他非常善于以最简单的方式阐述复杂的观点,看到他将这些技能应用于该领域革命性的新发展,我们感到非常高兴。”
本书是我们继“花书”之后,深度学习领域的又一里程碑式作品。英文版一上市就获各界青睐,书中深入而系统地介绍了机器学习和深度学习领域的基本概念、数学原理和前沿的研究,并附有丰富的习题。深度学习的理论知识体系庞大,“花书”作为该领域的奠基性作品,是一个大部头,给人的感觉是“难啃”——初学者,甚至是富有经验的实践者都有好多知识点看不懂。而这本书,恰恰解决了“入门难”的问题,作者以其站在深度学习之巅的格局和学识修养,深入浅出地引导读者透彻、准确地理解深度学习的基础及相关概念,为读者进一步的学习和职业发展提供了必要的脚手架。可以说,“花书”的读者,可以先读一读这本书再回去好好琢磨“花书”,收获会更大。
此外,深度学习领域发展迅速,而掌握其核心思想、基本架构、关键概念才能以不变应万变,而该书正是这样的权威之作。
主要作者 Christopher M. Bishop 在机器学习领域深耕了四十多年时间,他从 20 世纪 90 年代就出版了教科书《Pattern Recognition and Machine Learning》,在模式识别和机器学习领域一直被广泛采用。深度学习领域正在经历快速的发展,本书的主要目标就是讲清楚那些经得起时间考验的思想,帮助读者打下坚实的知识基础。书中涵盖了与当前 AI 技术相关的关键概念,全面介绍了支撑深度学习的核心思想。本书的结构独具匠心,内容由多个小节构成,每节探讨一个独立的主题,内容按顺序推进,每一节都在前一节的基础上逐步深入。这种结构不仅适合作为专业学生的机器学习课程的教材,也适合从事人工智能的研究者学习阅读。理解机器学习需要一定的数学基础,因此本书特设一章介绍概率论。本书的重点是传达思想,强调技术在现实世界中的应用价值,对于复杂的概念则通过多种手段进行阐释,包括文本、图表、数学公式和伪代码等,帮助读者更好地理解吸收知识。读懂这本书,读者们就能掌握深度学习的精髓,具备 AI 的设计与实践能力,而不仅是一名“调参工程师”。另外,我们还为大家精选了 AI 学习的四本经典好书,一站式打通 AI 理论与实践。
这是一本基于 Apache MXNet 的深度学习实战书籍,可以帮助读者快速上手并掌握使用深度学习工具的基本技能。
本书的作者团队在机器学习领域有着非常丰富的经验。他们不仅有大量的业界实践经验,也有非常高的学术成就,对机器学习领域的前沿算法理解深刻。
作者们在提供优质代码的同时,也把最前沿的算法和概念深入浅出地介绍给读者。这本书可以帮助深度学习实践者快速提升自己的能力。
本书由 Datawhale 团队从台湾大学教授李宏毅的在线课程转化而来,他的“机器学习”视频课程在全网播放超百万次,是初学者探索 AI 领域指路“明灯”。
本书延续了原课程的风格,以生动的例子和深入浅出的语言,让读者轻松愉悦地掌握深度学习的精髓。无论是希望建立扎实的深度学习基础的读者,还是希望深化对深度学习理解的从业者,都能从本书中获得宝贵的启示和实用的技能。
这是周志华教授的经典著作《机器学习》“西瓜书”的学习好伴侣,被读者们亲切地称为“南瓜书”。本书亦是由 Datawhale 团队编著,本书以开源项目的形式,帮助读者推导重要的公式,并对知识难点进行深入探讨。
本书对“西瓜书”中除了公式以外的重、难点内容加以解析,以过来人视角给出学习建议,旨在对比较难理解的公式和重点内容扩充具体的例子说明,以及对跳步过大的公式补充具体的推导细节。
这本书是初学者进入 AI 世界的一把钥匙,被称为人工智能领域的“大百科全书”。
本书内容十分全面,全方位探讨了人工智能领域的方方面面,涵盖了从基础知识、模型方法、工具技术、社会伦理到应用专题等各个层面,是一本人工智能的理想工具书。
在留言区参与互动,并点击在看和转发活动到朋友圈,我们将选1名读者获得e读版电子书1本,截止时间10月30日。