iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211197945.8 (22)申请日 2022.09.29 (71)申请人 云之端网络 (江苏) 股份有限公司 地址 213023 江苏省常州市钟楼经济开发 区玉龙南路178-1号 申请人 江苏理工学院 (72)发明人 高伟 贡伟力 郭强 王奋  (74)专利代理 机构 北京市惠 诚律师事务所 11353 专利代理师 潘朋朋 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于多轴交叉注意的不良图片鉴别方 法 (57)摘要 本发明公开了一种基于多轴交叉注意的不 良图片鉴别方法, 包含构建浅层特征提取模块, 构建多轴交叉注意感知网络, 构建区域全连接卷 积识别网络, 构建多轴交叉注 意感知的不良图片 鉴别网络, 构建深度优化器, 获得深度网络的最 优参数, 根据最优网络参数, 获得不良图片 的评 估值。 本发明可有效提高不良图片 的识别率、 简 单有效, 处 理时间较短, 可以达 到实时。 权利要求书3页 说明书7页 附图3页 CN 115546541 A 2022.12.30 CN 115546541 A 1.一种基于多轴交叉注意的不良图片鉴别方法, 包括如下 所述步骤: 构建浅层特 征提取模块; 构建多轴交叉注意感知网络; 构建区域全连接卷积识别网络 构建多轴交叉注意感知的不良图片鉴别网络 构建深度优化器, 获得深度网络的最优参数, 根据最优 网络参数, 获得不良图片的评估 值。 2.根据权利要求1所述的一种基于多轴交叉注意的不良图片鉴别方法, 其特征在于: 所 述构建浅层特征提取模块(SFAM),该模块通过对不同通道的不同接受域的信息融合, 提取 不良图片和对应的梯度图片的浅层视觉特征, 为下一步多轴交叉注意模块处理提供有效的 视觉信息。 所述SFAM模块由5个带有不同核 大小的卷积模块、 3个不同核 大小的池化模块, 以 及2个级联操作, 如图2所示, 其中, 长方体侧面标注的是核的大小, pool表示池化操作, C表 示级联操作,fi表示第i个视 觉特征。 从数学上具体可表示 为: f1=ConvB(Input,5) f2=ConvB(f1,3) f3=C(f1,Po ol(f2,7)) f4=C(f2,Po ol(ConvB(f3,3),5) ) f5=Conv(Pool(ConvB(f4,3),3),1)                   (1) 其中, ConvB(fi,k)表示含有1个卷积层, 1个激活层的卷积块, k表示卷积核的大小, 在 本发明中, k取值为1, 3, 5, 7; Input表示输入图像, 在本发明中是不良图片和 对应的梯度图 像; C(,)表示两个视觉按照通道维度进行级联, Pool(fi,k)表示平均池化操作, k也表示卷 积核的大小。 3.根据权利要求1所述的一种基于多轴交叉注意的不良图片鉴别方法, 其特征在于: 所 述构建多轴交叉注 意感知网络(MACA)包括三个部分选择注 意感知网络(SA)、 全局池化通道 感知网络(GP CA)和交叉感知网络。 选择注 意网络感知通过全局平均池化层(GAP), 全 连接层 (FC), 激活函数(Softmax)以及若个操作完成 的, 其通过注意网络后获取的视觉特征Fsa可 以表示为: a=Softmax(FC(GAP(Fa))) 其中, Fi(i∈{1, 2, 3})是通过切分操作(split)切分出来的, ai(i∈{1, 2, 3})表示经过 激活函数softmax操作后获得权重a的第i个分量。 表示像素级的视觉特征求和操作.全局 池化通道感知 网络首先对两个不同的视觉特征进行级联, 然后利用卷积核为1的卷积层将 视觉特征通道数降低, 紧接着计算降低后特征 的通道相关系 数, 紧着对获取 的系数矩阵进 行行卷积操作, 接着再通过一系列的全连接和激活操作获得对应特征通道的权重, 最后通 过将这些通道权重与对应通道的视觉特征相乘得到新的视觉特征。 具体通过数学表示可以 表达为:权 利 要 求 书 1/3 页 2 CN 115546541 A 2xcat=Conv1×1(C(x1,x2)) Fgp=σ(FC(rwco nv(Cov(xcat))))×xcat                            (3) 其中, Conv1x1表示卷积 核为1的卷积操作, C(x1,x2)表示两个不同输入视觉 特征x1,x2的 级联操作, xcat表示经过卷积核为1的卷积操作后的视觉特征, Cov表示视觉特征xcat的通道 相关系数矩阵, rwco nv表示行级的卷积 操作, FC同样表示全连接操作, σ 表示sigmo id函数。 选择注意感知网络(SA)和全局池化通道感知网络(GPCA)构 建完成后, 紧接着依次利用 这两个子网络交叉提取特征, 然后分别进 行卷核为3的卷积操作, 并各自进行短链接后再级 联, 最后结合卷积核为1的卷积操作进行特征融合, 形成更加有效的视觉特征。 具体可以表 示为: FX=GPCA(SA(X),Y) FY=GPCA(SA(Y),X) Fc=Conv1x1(C(FcX,FCY))                    (4) 其中SA(.)和GPCA(.)分别表示通过注意感知网络和全局池化通道感知网络, FX和FY分 别表示经过这两个网络后的视觉特征, FcX表示FX经过卷积核为3的卷积操作后与输入 特征X 像素级求和后的视觉特征, 同样FcY表示FY经过卷积核为3的卷积操作后与输入特征Y像素级 相加的视觉特征, Fc表示将特征FcX和FcY级联后信息融合的特征。 Conv3x3表示卷积核为3的 卷积操作, Conv1x1表示卷积核为1的卷积操作, C(,)表示特征级联操作, 表示像素级 求和 操作, X和Y表示两个不同的输入视 觉特征。 4.根据权利要求1所述的一种基于多轴交叉注意的不良图片鉴别方法, 其特征在于: 所 述构建区域全连接卷积识别模块是由3个卷积模块、 全连接层和切分操作构成。 其中每个卷 积模块是由1个带有不同核大小的卷积操作、 1个激活函数(本发 明采用LRelu)和1个带有核 大小为2的最大池化操作。 首先输入 特征经过3个卷积模块, 接着利用切分操作, 将提取的视 觉特征空间切分成nxn份, 然后再利用最大池化获取视觉特征空间的每部分属于不良图片 的权重值, 再接着利用信息融合的方式获得检测图片的鉴别值。 具体表述如下: F3c=ConvB(ConvB(ConvB(X,7,2),3,2),1,2) Score=FC(MaxPo ol(splitn×n(F3c),r))                         (5) 其中, F3c是经过3个卷积模块后的视觉特征, ConvB(,Kc,Kp)是卷积模块, Kc和Kp分别 表示卷积层中的卷积核大小和最大池化中的卷积核的大小, 再本发明中, Kc取1, 3, 7, 最大 池化操作取2, r, 这里的r是视觉特征切分的n分之一。 MaxPool(,Kp)是卷积核为Kp的最大池 化操作, FC(.)是全连接操作, spl itnxn(.)表示将视 觉空间特 征切分nxn 等分的切分操作。 5.根据权利要求1所述的一种基于多轴交叉注意的不良图片鉴别方法, 其特征在于: 所 述构建多轴交叉注意感知的不良图片鉴别网络。 该网络主要由浅层特征提取模块, 多轴交 叉模块以及区域全连接卷积识别模块构成。 该识别网络主要采用两种不同特征: 彩色图像 和对应的梯度图像作为输入特征, 然后分别通过浅层特征提取模块进行浅层特征提取, 然 后经过若干个多轴交叉识别模块进一步特征提取, 最后通过区域全连接卷积识别模块进 行 检测图片识别。 具体描述如下:权 利 要 求 书 2/3 页 3 CN 115546541 A 3

PDF文档 专利 一种基于多轴交叉注意的不良图片鉴别方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多轴交叉注意的不良图片鉴别方法 第 1 页 专利 一种基于多轴交叉注意的不良图片鉴别方法 第 2 页 专利 一种基于多轴交叉注意的不良图片鉴别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:27上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。