焦点期刊
在线客服

著作编辑 著作编辑

咨询邮箱:568476783@qq.com

科技论文

基于改良ResNet的花球分割模型

时间:2021-11-22 20:44 所属分类:科技论文 点击次数:

图像预处理
(1)扩大数据范围。
CNN在图像分割中的性能主要取决于训练数据集的大小.质量和多样性,即训练数据集能够涵盖足够多的真实场景或相似环境[13]。但是,要获得足够多的花球图像,需要耗费大量人力、物力和时间。为了解决因样本不足而引起的过拟合问题,利用平移、缩放、旋转、加噪等数据增强技术进一步扩展数据集[16]。为了提高模型训练效率.减少GPU内存使用[17],通过PhotoshopCS6软件将240张原始图像裁剪成500×500像素的子图像样本(patch)并且将这些样品翻上、下、上、下翻、旋转、缩放、添加椒盐噪音等增广操作,最终获得2131个样本。
(2)人为标志。
利用labellmg工具对以上增广结果进行人工筛选,得到了2000个显示效果良好的样本,并利用labellmg工具对样本进行标记。
提出了一种基于改良ResNet的花球分割模型。
常规的卷积网络在传递信息时,会产生信息损失,并产生梯度消退或梯度爆炸,从而限制了训练网络的深度。为了解决这个问题,微软亚洲研究院的何凯明博士等[18]2015年提出了ResNet,该模式能在提高模型准确性和推广能力的同时加快网络培训的速度,该方法通过在网络中添加直连通道,以保持网络前一层一定比例的输出,使原始输入信息可直接传送到后一层。而传统的卷积层滤波方法只对局部进行滤波,得到的特征图彼此独立,权值相同[19]。事实上,这些特征图的重要性是不同的,采用这种方法会影响训练结果的准确性。增加Squeeze-and-Excitation(SE)模块可以根据其重要性重新调整特征[20],并使用全球信息来衡量个别特征的重要性。在ResNet中嵌入SE模块的例子中,方框右下方的维度信息表示本层输出。利用GlobalAveragePooling(GlobalAveragePooling)操作[21],然后以两个全连结层FullyConnected(FC)[22]组成Bottleneck结构[23]模拟通道之间的相关性时输出与输入特征相同的权重。首先把特征维度降至原来的1/16,然后通过ReLU激活函数[24]对模型进行激活,返回原维全连接层。最终,采用Sigmoid函数的正规化运算得到在0-1之间的权值,并使用Scale操作对每个特征图进行加权。因为象素二分图任务(分割)比较简单,本文设计了一个20层的线程网,中间的曲线是shortcut连接,虚线模块C20.C21通过包含大小1×1.步幅2的卷积验证现降维。在C1-C20中,卷积核的大小是3×3,C9和C16的卷积核步幅是2,其它模组步幅是1。该方法所需的图像经过C1-C19,最终进入softmax分类层,最终获得它的对应标签。
在改进后的ResNet模型中,迭代所需的每个像素点提取大小为18×18的方形图像块,将这些图像块输入到改进后的ResNet模型中,得到每个像素的分类标记,然后对其进行重构,最后得到分割结果。
采用PSO-Otsu算法对花球新鲜度进行了分析和分级。
鉴别并筛选出头新鲜度,对评价采收质量、提高贸易价值具有重要意义。利用机器视觉技术,可获得花球“黄绿叶菜”色域比例,并根据该区域的变化程度对花球的新鲜度进行评定。象素二分法中较经典的Otsu算法[25],其基本思想是计算目标区域和背景值5ed621fd2847c_html_980ccd9f17ec0816.gif通过将最大的灰度值确定5ed621fd28c_html_980ccd9f17ec0816.gif的最佳分割门限。但Otsu算法计算量较大,需要遍历全部的灰度级别确定阈值,因此计算量大,很难满足实时性要求。由于Otsu算法运算复杂,存在较高的时间复杂性,在传统Otsu算法的基础上,采用PSOA技术实现了最优门限搜索[26]。
(1)在一维平面上均匀投射N个粒子;
(2)计算每一粒子灰度值对应的方差,得到方差值5ed621fd2847c_html_394370e0ac395eac.gif;
(3)根据PSOA算法更新粒子的速度和位置,通过反复迭代实现阈值搜索;
(4)达到迭代次数最大时,将迭代中出现的最大方差5ed621fd2847c_html_d90bd45403b309a1.gif作为图像的最佳分割阈值。