几个月来,常有同学询问 “杨老师在做什么?接下来咱们讲什么?” 答案是:大部分时间在咳嗽。
无假无休地连续做了七年视频课,终于松口气休息几个月,结果之前被工作意志强行镇压的各种小病总算找到机会、轮流登场,直接让我的GPT从编程助手变身问诊专家。
时间充裕的好处,是终于可以放松神经,重新研读人工智能的文献和代码。然而本性难改,手还在纸上推着公式,大脑却又自动进入了教师的角色:“这个公式能不能讲透?能给谁讲透?怎样能讲透?”
想讲透的,不是怎样调用PyTorch、TensorFlow等现成框架,也不是怎样调用ChatGPT或文心一言的API,而是 “为什么一个短短几十行的程序,就能够自动从图像甚至语言中发掘知识、自动工作?”或者说,从神经网络到ChatGPT等大语言模型,它们到底怎样一步步运行、最终得到几近于人的表现?
其实在专业教材和论文里,这些原理不过是几页数学公式,严谨、精确、简洁、优雅。
但它们是为专业人士准备的。
然而还有很多想深入了解AI的朋友,其实只具备比较扎实的高中数学基础,面对专业教材中各类艰深晦涩的数学公式和矩阵符号往往望而生畏。特别是夹杂其间的“显见、易得、不难证明”等咒语,更会在不经意间一锤击碎他们的自信与问道之心,让他们把心里一堆“愚蠢的”问题生生压制下去,合卷拜别。
于是与清华大学出版社的文怡等编辑老师一拍即合 —— 写一本深入、细致、有趣、易读的入门教材,让学过高中数学的读者就能看懂从神经网络到ChatGPT等大语言模型的基本推导过程,手推公式并写出Python代码。
作为一名讲了二十几年计算机课程、从高校课堂讲到新媒体平台的“老”教师,我最大的愿望是让尽可能多的非计算机专业的朋友,体会到学习计算机和逻辑抽象思维的乐趣。熟悉我们课程的同学都会有感觉:虽然讲解的是VBA、Python、SQL、数据分析等实用工具,但杨老师在教学中真正想分享给大家的,是蕴藏在它们底层设计中的工程美感,与设计程序时感受到的逻辑与抽象之美。
所以我们讲解数据分析时会深究numpy广播为什么这样设计;讲解自动化办公时会“手撕”Excel文件、直接从xml修改单元格数据;讲解SQL时会讨论为什么如此设计各种子句的顺序、而不是让大家死记;讲解VBA时会分析为什么要引入SET这样奇怪的关键字 ……
我希望启发大家爱上这种学习方式,因为这些看似对工作无用的“非功利”的知识,往往会引领诸多有天分而不自知的初学者开启专业之路。这种例子并不罕见,比如几年来常有同学在Q群和评论区中留言,都是非计算机专业,有学习后开发软件盈利、有获取字节Offer,乃至有从车间一线转行成为程序员等等。
而相比前面讲过的各种程序设计课程,为“小白”讲通人工智能原理的难度显然高出一个量级。对我而言,这也是从教二十多年来最大的教学挑战,唯有拿出浑身解数、全力以赴。“深入、细致、有趣、易读” —— 希望这本书最终能达到我期望的水平,希望终能有读者由此悟道。
共勉!