点击下面卡片,快速关注本公众号
人工神经网络(Artificial Neural Network, ANN)是一种受生物神经系统启发的计算模型,其基本构成单元是人工神经元,就像生物大脑中的神经元一样。这些神经元被组织成多个层级,通过层间连接传递信息,按照预设的规则机械地进行计算,最终产生输出结果。ANN的关键特性包括预测能力和层级结构,通过堆叠多层神经元,可以处理更复杂的问题,而层间连接的强度决定了网络的行为。以数字识别为例,一个ANN可能包含接收图像像素的输入层、处理信息的中间隐藏层以及产生最终预测的输出层。虽然ANN可以通过训练来学习完成特定任务,展现出复杂的行为,但它本质上仍是一个按照预设规则运行的数学计算系统,而非具备真正思维能力的智能体。
这个可视化展示了一个具有50个神经元、两层结构的人工神经网络(ANN),经过训练,可以识别0到9的数字。ANN预测的复杂性随着连接数量的增加而增加。
顶部一行显示模型预测结果 中间两层是神经网络的隐藏层,由多个神经元节点组成
节点之间通过粉色和绿色的连接线相互连接,这些连接线表示神经元之间的权重关系
尽管这个网络能够通过训练来识别数字,但重要的是要明白它并不具备"思维能力"。它本质上是一个数学计算的瀑布系统 - 输入通过多层计算最终得出输出(即对所画数字的预测)。就像一堆能学习玩井字棋的火柴盒不会思考一样,神经网络能够"学习"并不意味着它能够"思考"。
卷积神经网络(Convolutional Neural Network, CNN)是一种专门设计用于处理网格结构数据(如图像)的深度神经网络架构,通过模仿人类视觉系统的工作原理,在图像识别、计算机视觉等领域取得了突破性成就。CNN主要由卷积层、池化层和全连接层组成:卷积层通过卷积操作和不同的卷积核提取图像特征,如边缘、纹理等;池化层对特征图进行降维,提高模型对位置变化的容忍度;全连接层则负责将特征图转换为最终的分类结果。CNN的主要优势在于参数共享可以减少网络参数数量,局部连接使每个神经元只需处理其感受野内的数据,以及具有平移不变性,这些特性使得CNN在处理图像识别、目标检测等计算机视觉任务时表现出色。
输入层: 28×28=784个输入
第一个卷积组(8个特征图):
卷积层(核大小5×5)
ReLU激活函数
最大池化层(核大小2×2)
第二个卷积组(5个特征图):
卷积层(核大小5×5)
ReLU激活函数
最大池化层(核大小2×2)
全连接层
Softmax输出层