深度学习 | UNet | 代码实现 | Tensorflow

文摘 2024-08-15 08:00 北京

UNet model

Ronneberger 等人(2015)[79]提出的 UNet 体系结构，整个网络结构呈字母“ U”的形状，因此命名为 UNet。U 形模型由四个主要组件组成，如上图4所示: 卷积层、池化层、上采样层和跳跃连接。左边是下采样，右边是上采样。卷积层负责识别空间特征，它们与其他组件的协调操作允许不同的卷积层捕获不同分辨率的特征。通过解码-编码的结构实现图像特征的提取.

对于输入的数据是如何进行特征提取呢？在我刚刚了解这些深度学习模型时是非常想要探究的。

下面，我试图去揭示这背后的实现过程，在此之前，需要了解卷积和池化的作用，这在之前的笔记中曾记录过，这里简单复习一下：神经网络背后的数学。

卷积 | 池化

卷积

卷积实现了对于输入数据的特征提取。下面尽可能的说清楚它对于数组的size的改变，假设我们现在有一个7x7的网格，你可以将其理解为一个图片或者一个数组。

这很容易理解，然后接着我们假设一个3x3的卷积核

实现卷积的过程，可以理解为卷积核的范围与原始数组上对应位置格点相乘再相加的过程。什么意思呢，假设我们的卷积核的移动步长为1，那么对于原始数据进行步长为1的卷积过程，就是：

最终会输出一个5x5的特征图

依次向下同理，如果移动的步长为2呢，就是下面这样：

最终会输出一个3x3的特征图

那如果步长为3呢，这时就不满足了！！他会出现下面的这样的情况：卷积覆盖的地方没有对应的数值了

总结上面的规律，其实我们可以根据对应的数据大小NxN和卷积核大小FxF得到卷积过程后的数组大小,其中stride为步长

下面是一些动图的演示：

一般情况

存在偏差的情况

但是，这里会发现有个问题，如果单纯按照上面的过程去卷积，会导致卷积后的输入的尺寸不断减小，卷积操作仅仅会在输入的数据内部进行，边界的信息会被忽略。这样会丢失很多边界的信息，那应该怎么做呢？

可以通过对于边界进行零填充，在卷积操作中平衡尺寸缩减和特征提取之间的关系

如下所示：

这样填充完之后，原本的7x7的输入数据就变成了9x9，然后使用步长为1的3x3卷积核，我们会得到还是7x7的输出特征图。这样可以得到一个新的计算公式，假设输入为N，卷积核为F，填充的边界像素为P，步长为stride，那么输出尺寸为

(N+2P-F)/stride+1

对于一般的卷积层，我们通常设置stride为1，卷积核大小为FxF，零填充为(F-1)/2,这样来保证数组大小的守恒

此外，卷积核的数量可以控制输出数据的维度，对于较大的图片，我们需要较多的层来使得每一个output来"看见"整个图片的信息。

下面对于卷积层进行一个总结

编程实现

通常在Unet中，对于输入的数据会先进行两次卷积，下面是一个简单的基于tensorflow的编程示例，

对于输入数据大小为128x128x32的数组，经过两次卷积后，空间大小仍然是128x128，但是通道数由卷积核的数量控制(filter_num),为64

池化

池化层就相对容易一点，一般包含

平均池化
最大池化

以最大池化为例：

对于一个2x2的池化层，同样覆盖到原始的数据，选择覆盖范围内最大的作为显著的特征，基本没有学习的参数

下面是池化层的一些总结

编程实现

一般Unet架构中，两次卷积层后，后面跟着一个池化，通常使用最大池化层，大小为2x2

编程就更简单了，直接调用一个参数接口即可：

可以发现，空间尺寸从128x128减小到了64x64，但是通道维度上的大小没有变换，还是64

对于后续的Unet架构也是同理，对于池化后的数据再次进行相同的过程，两次卷积-一次池化。

这就是下采样的过程。后续再通过跳跃连接和反卷积实现上采样，这里直接给出相关的Unet代码了，直接封装为函数了，可以将其拆开看一下每一步数据的大小变换，方便进一步理解各个卷积池化的作用：

import tensorflow as tf
from tensorflow.keras import models, layers, regularizers
from tensorflow.keras import backend as K


##############################################################
'''
Useful blocks to build Unet

conv - BN - Activation - conv - BN - Activation - Dropout (if enabled)

'''


def conv_block(x, filter_size, size, dropout, batch_norm=False):
    
    conv = layers.Conv2D(size, (filter_size, filter_size), padding="same")(x)
    if batch_norm is True:
        conv = layers.BatchNormalization(axis=3)(conv)
    conv = layers.Activation("relu")(conv)

    conv = layers.Conv2D(size, (filter_size, filter_size), padding="same")(conv)
    if batch_norm is True:
        conv = layers.BatchNormalization(axis=3)(conv)
    conv = layers.Activation("relu")(conv)
    
    if dropout > 0:
        conv = layers.Dropout(dropout)(conv)

    return conv




def UNet(input_shape, NUM_CLASSES=1, dropout_rate=0.0, batch_norm=True):
    '''
    U-Net: Convolutional Networks for Biomedical Image Segmentation
    https://arxiv.org/abs/1505.04597
    
    '''
    # network structure
    FILTER_NUM = 64 # number of filters for the first layer
    FILTER_SIZE = 3 # size of the convolutional filter
    UP_SAMP_SIZE = 2 # size of upsampling filters
    

    inputs = layers.Input(input_shape, dtype=tf.float32)

    # Downsampling layers
    # DownRes 1, convolution + pooling
    conv_128 = conv_block(inputs, FILTER_SIZE, FILTER_NUM, dropout_rate, batch_norm)
    pool_64 = layers.MaxPooling2D(pool_size=(2,2))(conv_128)
    # DownRes 2
    conv_64 = conv_block(pool_64, FILTER_SIZE, 2*FILTER_NUM, dropout_rate, batch_norm)
    pool_32 = layers.MaxPooling2D(pool_size=(2,2))(conv_64)
    # DownRes 3
    conv_32 = conv_block(pool_32, FILTER_SIZE, 4*FILTER_NUM, dropout_rate, batch_norm)
    pool_16 = layers.MaxPooling2D(pool_size=(2,2))(conv_32)
    # DownRes 4
    conv_16 = conv_block(pool_16, FILTER_SIZE, 8*FILTER_NUM, dropout_rate, batch_norm)
    pool_8 = layers.MaxPooling2D(pool_size=(2,2))(conv_16)
    # DownRes 5, convolution only
    conv_8 = conv_block(pool_8, FILTER_SIZE, 16*FILTER_NUM, dropout_rate, batch_norm)

    # Upsampling layers
   
    up_16 = layers.UpSampling2D(size=(UP_SAMP_SIZE, UP_SAMP_SIZE), data_format="channels_last")(conv_8)
    up_16 = layers.concatenate([up_16, conv_16], axis=3)
    up_conv_16 = conv_block(up_16, FILTER_SIZE, 8*FILTER_NUM, dropout_rate, batch_norm)
    # UpRes 7
    
    up_32 = layers.UpSampling2D(size=(UP_SAMP_SIZE, UP_SAMP_SIZE), data_format="channels_last")(up_conv_16)
    up_32 = layers.concatenate([up_32, conv_32], axis=3)
    up_conv_32 = conv_block(up_32, FILTER_SIZE, 4*FILTER_NUM, dropout_rate, batch_norm)
    # UpRes 8
    
    up_64 = layers.UpSampling2D(size=(UP_SAMP_SIZE, UP_SAMP_SIZE), data_format="channels_last")(up_conv_32)
    up_64 = layers.concatenate([up_64, conv_64], axis=3)
    up_conv_64 = conv_block(up_64, FILTER_SIZE, 2*FILTER_NUM, dropout_rate, batch_norm)
    # UpRes 9
   
    up_128 = layers.UpSampling2D(size=(UP_SAMP_SIZE, UP_SAMP_SIZE), data_format="channels_last")(up_conv_64)
    up_128 = layers.concatenate([up_128, conv_128], axis=3)
    up_conv_128 = conv_block(up_128, FILTER_SIZE, FILTER_NUM, dropout_rate, batch_norm)

    # 1*1 convolutional layers
   
    conv_final = layers.Conv2D(NUM_CLASSES, kernel_size=(1,1))(up_conv_128)
    conv_final = layers.BatchNormalization(axis=3)(conv_final)
    conv_final = layers.Activation('linear')(conv_final)  #Change to softmax for multichannel
    # linear
    # Model 
    model = models.Model(inputs, conv_final, name="UNet")
    print(model.summary())
    return model

总结

从编程的角度介绍了卷积和池化的作用，可以更好的帮助理解深度学习模型。当然，对于背后的数学公式并没有过多的介绍，可以从之前的笔记中进行复习。

★
https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/
https://arxiv.org/pdf/1505.04597
http://vision.stanford.edu/teaching/cs231n/

给我点在看的人

越来越好看

http://mp.weixin.qq.com/s?__biz=MzkzMDYxNDYzOQ==&mid=2247486599&idx=2&sn=30aa1bd8dc3e0256b05826e1475d0c06

气python风雨

主要发一些涉及大气科学的Python文章与个人学习备忘录

最新文章

雷达系列：两种方法将气象雷达数据转为易处理的格式

CMAQ 5.4 输入与输出数据整理

在Jupyter环境中创建交互式可视化地图

读者答疑：使用Matplotlib绘制带有端头的垂直线段标注数据

增强云图

回旋镖！meteva也能绘制wrfout气象要素分布

python | x-y 网格切片

悟空传、西游日记和斗战神

meteva，这可能是气象萌新最需要的python库

Python | 降水 | 批量下载GPCP日数据

Python | MJO | 位相图

笔记 | Kelvin wave | 热带气旋

读者答疑 | python怎么计算流函数

深度学习 | 机器学习 | 气候预报 | 研究综述

气象绘图加强版（二十八）—cmap、cbar

看好了，雷达剖面可以这样画

Matplotlib双变量热力等级图

雷达系列 | 如何对国产雷达数据进行衰减订正

雷达系列 | 使用Plotly生成三维CAPPI反射率图

看好了，雷达产品廓线可以这样画

气象处理技巧—时间序列处理4

读者答疑：如何简单绘制全球土地覆盖图

Python | 泰勒图

MATLAB 绘制夏季海表流场

读者答疑：使用 metpy 散度函数计算时的报错

气象绘图加强版（十三）——底图的添加

与局地极端降雨相关的对流结构以及风暴尺度涡旋

学习笔记 | 如何测试自己写的函数程序慢在哪里

Python | 批量下载NCEP2再分析数据

NeuralGCM: 一种融合机器学习与物理原理来模拟地球大气的新方法

雷达系列 | 基于 pydda 使用国产单部雷达反演 3d 风场

Python | xinvert | 气象和海洋领域中椭圆型偏微分方程如何求解？

Easyclimate: 一行代码实现气候学的快速分析

学习笔记 | 如何转换文本文件的编码格式

Python | SST | 高通滤波 | EOF | 论文复现

10个机器学习数据处理Sklearn技巧，建议收藏！

雷达系列：如何使用python进行多部雷达数据反演风

新版本的欧空局下载哨兵方便很多

天气雷达拼图系统V3.0产品数据解析

业务刚需 | meteva复现多模式降水站点值mesh图

Python | 海洋气象 | Xarray:数据读取与切片01

Python | 大气科学 | 偏相关

xarray基础之计算篇

深度学习 | UNet | 代码实现 | Tensorflow

Python | 北大西洋涛动 | NAO指数 | EOF

超长篇幅！PyCINRAD保姆级教程

ERA5数据官网下载之CDS-Beta升级方法和避坑指南！

暖区暴雨是否会受到锋面暴雨的影响？

气候统计界的瑞士军刀——sacpy

Data | 降水数据集：概述和比较

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉