今天讲讲为啥诺奖要发给两位 AI 教父。
先说说机器学习是啥,其实就是找数据的规律。
大多数时候,就是把数据放到坐标系里,让计算机用数学方法画条线,来划分或者模拟这些数据。不同的机器学习方法,就是用不同的数学模型来放数据和划线。
从以前到现在,有好多机器学习的流派,有几种影响很大,像线性回归、逻辑回归、k 近邻、决策术、支持向量机、贝叶斯分类还有神经网络。
咱先看看线性回归和逻辑回归。
简单说,机器学习就是干两件事,一个叫回归,一个叫分类。
回归就是预测个具体的值,比如说你身高多高、体重多重、以后能赚多少钱。
分类呢,就是分个类,像你是男是女、胖还是瘦、是粉丝还是游客。
线性回归就是找条线来预测具体的值,比如预测收入。
要是把预测的收入划条线,比如三万以上算高收入,三万以下算低收入,这就把结果分成两类了,这就是逻辑回归。
虽然名字叫回归,但它解决的是分类问题。再看看 k 近邻。k 近邻一般也用来解决分类问题。
它的基本想法就是“物以类聚,人以群分”。比如说要给网站用户分类,判断新用户喜欢啥。
先把现有的用户数据按不同维度整理好,像年龄、上网时长、看电影次数啥的,然后放到坐标系里。
要是有个新用户,就找跟他距离最近的一些用户,看看这些用户大多属于啥分类,新用户就属于啥类型。接着说决策术。
比如说想知道一个人会不会被女生喜欢,有好多因素,像爱不爱学习、帅不帅啥的。
把这些因素和结果输到系统里,让电脑自己找答案。电脑会挨个试每个节点,看哪个节点分类纯度高。
分类纯度就是用这个节点分类后,每个分类里的数据一致性高不高。最后电脑就弄出一棵决策树,以后就能用这棵树预测新数据了。再讲讲支持向量机。
比如说有一群狗和一群猫,要挖条沟把它们分开,最宽的沟最好。把猫和狗变成数据放到坐标系里,支持向量机就是用数学方法找这条最宽的沟,新数据在哪边就是啥。
这条沟叫超平面,沟边的猫和狗叫支持向量。
支持向量机还能解决线性不可分的问题,就是画条线分不了的数据,就加个维度,像加个函数把数据变到三维空间,就能切开了。
贝叶斯也常用来分类,比如说根据症状判断有没有病,或者根据关键词判断文章分类啥的。
比如说长得帅的人可能会做一些事,要是一个人也做了这些事,那他就可能是帅哥。最后说说神经网络。一开始叫感知机,现在叫深度学习。
它就是模拟大脑神经元的活动方式。单个感知机就像画条线把两种东西分开,但解决不了线性不可分的问题。
后来感知机变成多层,就成了深度神经网络,能解决更复杂的问题。比如说用两层感知机就能解决异或问题。
随着大数据和硬件条件变好,神经网络又厉害了,像在图像识别大赛和人机大战中都表现得超牛。
为什么今年的诺贝尔物理学奖要颁发给两位AI教父呢,是因为他们在机器学习这些领域做出了超级厉害的贡献。
刚才咱们讲了机器学习里这么多重要的方法,像线性回归、逻辑回归这些基础的方法是早期机器学习发展的关键。
这些方法就像是盖房子的砖头,让后来的人能在这个基础上搭建更多东西。他们在这些方法的改进、创新或者是把这些方法整合到更大的人工智能系统里发挥了巨大作用。
而且从机器学习的发展历程来看,从早期的理论探索,到后来像神经网络经历了起起落落,最后大放异彩。
在这个漫长又复杂的过程中,他们就像是领路人一样。比如说,在神经网络被打入冷宫的那十几年里,他们还在坚持研究,不断地寻找让神经网络突破困境的方法。
像发现可以通过增加层数来解决线性不可分的问题,让神经网络从一个简单的感知机变成可以处理复杂任务的深度学习模型。
还有在整个AI领域,让不同的机器学习方法相互配合,更好地解决实际问题,像利用支持向量机能处理线性不可分问题的优势,和其他方法结合起来,让AI系统更加智能。
他们在推动整个AI技术的进步,从理论到应用,让机器能更好地理解数据、做出预测和分类这些事情上功劳很大,所以才会获得诺贝尔奖。