焦点期刊
在线客服

著作编辑 著作编辑

咨询邮箱:568476783@qq.com

科技论文

基于ResNet提出的剩余网络结构

时间:2021-11-14 20:59 所属分类:科技论文 点击次数:

基于ResNet提出的剩余网络结构,使神经网络的参数更高效[35]。在ResNet残差单元中,信道尺寸的处理顺序是先缩小后扩展。由于DSC通常期望从高维输入中提取特征,因此反向残差对ResNet残差单元作了进一步改进,即先扩展通道维度,通过深度分离后再缩小通道维数,以加强模型的表达能力。经过低维度输出层后,特征信息将更集中于缩小的通道,若仍有非线性激活函数(如ReLU6等),将会出现严重的信息丢失,从而影响特征的准确性。为此,需要将通道尺寸缩小的瓶颈层中,1×1卷积去除ReLU6非线性激活函数,生成线性输出[36],形成线性瓶颈结构,保证了网络特征提取的有效性。
SE-Block的主要功能是利用结合特征之间的关系,形成让网络模型对特征进行校正的机制,使网络的有效特征权重增大;不起作用或者效用不大的特征权重较低,达到关注效果(Attention),从而提高网络学习能力[37]。图4显示了MobilenetV3中SE-Block的结构。其中,W和H分别代表特征图的宽度和高度,C表示通道数,输入特征图的大小用W×H×C来表示。先对输入特征图进行压缩(Squeeze)运算,将特征图压缩为1×1×C的向量;特征图用“快速”运算,实现了限定模型复杂性、辅助推广的目的;最后对特征图进行重新标定(Scale)运算,在Squeeze和Excitation运算之后,计算出的通道权值分别乘以原始特征图对应通道的二维矩阵,最后的结果之后输出。
MobileNetV3采用5×5尺寸的深度卷积代替网络中的部分3×3的深度卷积,它采用具有线性瓶颈的反向剩余结构代替网络中的部分3×3。通过引入SE-Block技术,大大降低了模型参数、计算开销,提高了模型的精度,在体积、速度和精度上达到了平衡。考虑到MobileNetV3在体积和速度方面的优势,它可以作为这个研究网络模型的骨干网络,用于从苹果图像中提取有效特征。MobileNetV3网络分为MobileNetV3-Large和MobileNetV3-Small两个版本,该研究利用MobileNetV3-Large建立了更深入的网络,因此模型的精确性更加突出。
为更有效地获得更有效地预测网络模型,我们在MobileNetV3网络上做了进一步的改进。通过增加3个上采样-转位卷积(TransposedConvolutional)层,以及网络中最后一个瓶颈(Bottleneck)层(Bottleneck)层,用于更好地还原图像的语义和位置信息。特征图经卷积生成后,将分别发送到CenterNet网络的三个子网络中进行关键点、偏置和尺寸预测。最后形成的网络被称为M-CenterNet,它的网络结构见图5。