焦点期刊
在线客服

著作编辑 著作编辑

咨询邮箱:568476783@qq.com

科技论文

ResNet18卷积神经网络结构图

时间:2021-11-22 20:54 所属分类:科技论文 点击次数:

利用卷积神经网络进行多光谱图像识别。
3.1建立培训集和验证集。
将所收集的多光谱图像分为0.1和2,每一级别的多光谱图像总数为800幅,以0级为例,随机选出0级图像530张(即2650张单通道图像),再次从这些图像中随机选取50个五通道图像(即250张单通道图像)作为验证集,剩下的480个五通道图像(2400个单通道图像)作为训练集。1.2训练集和验证集制作方法同上。最后制作出图6所示的玉米营养状况信息图象库,其中有1440幅图象(即7200幅单通道图像),该验证集共有150张五通道图像(即750张单通道图像),其中1590个五通道图像(即7950个单通道图像)。
与此同时,利用多光谱图像中蓝光、蓝光、蓝光等波段的图像合成为RGB图像,生成仅包含普通彩色图像的玉米营养状态图像库。
3.2响应网络模型的建立。
因为采集到的玉米株是自然俯拍状态,所以相邻图像的差别很小,因此在每一层传递之间,容易使图像之间的差别消失。为此,本研究选择ResNet18作为识别玉米植株图像的基础网络结构,该模型深度适宜,使原始输入信息直接传递到下一层,具有较强的图像识别能力。构建的ResNet18卷积神经网络结构图如图7所示,ResNet18有4组不同的ResNetmodule,输出通道数量依次是64.128.256和512。
对于Input_layer,使用公式(1),按比例将图像每个像素点的数值从[0,255]缩小为[-1,1]。
Input_layer输出的图像像素大小为224×224,彩色图像的输出通道数是3,五通道输出通道数是5。针对Input_layer输出的图像数据进行了以下处理:对于彩色图像,224×224×3的数据分别与64个7×7×3的卷积核作了步长为2的卷积运算。在五通道图像中,224×224×5的数据分别与64个7×7×5的卷积核执行了具有2步长的卷积运算。结果显示是112×112×64。到目前为止,五通道图象与彩色图象的数据形状基本一致,都是112×112×64。下一步,用2阶和3×3步的最大池化运算,将特征图象素尺寸由112×112减至56×56,通道数为64。
池层输出的数据将经过4组ResNetmodule处理。第一组ResNetmodule输出的特征图像像素尺寸为56×56,信道数是64;ResNetmodule输出的特征图像像素尺寸是28×28,通道数量是128。这时,组2中的第一个ResNetmodule将面对输入数据x的通道数为64位的输入输出维度,回卷后数据F(x)的通道数量是128,但它们不能直接叠加,此时使用128个1×1的卷积核对输入数据x进行提升,因此,x和F(x)的通道数量都变为128,接着又继续进行叠加;第三组ResNetmodule输出的特征图象素尺寸是14×14×输出量是256;第四组ResNetmodule输出的特征图象素是7×7,输出通道数是512。此时,数据通过了所有残差模块。
接着,spatial_avg处理剩余模块输出的数据(即使是使用tf.reduce_mean),也可以使用spatial_avg操作,即使使用tf.reduce_mean()来计算像素大小为7×7的特征图像,特征图象素输出是1×1,信道数目是512。
最终,利用全连接层将输出的形状和标签的类型相乘,因为图像中共有三个标签,利用512×3的矩阵和前一层输出的1×512的矩阵相乘,可以获得1×3形状的矩阵。
这些数据中,n=512,y1,y2,y3是图片识别结果,即0.1.2级概率。