iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211219369.2 (22)申请日 2022.09.30 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 张婉平 温圣召 田飞 杨馥魁  韩钧宇 张刚 冯浩城  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G06V 10/30(2022.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 模型训练方法、 图像分类方法、 装置、 电子设 备和介质 (57)摘要 本公开提供了一种深度学习模型的训练方 法, 涉及人工智能技术领域, 尤其涉及深度学习、 图像处理、 计算机视觉等技术领域。 具体实现方 案为: 将样 本图像输入第一深度学习模型的第一 特征提取网络, 得到样本图像的第一特征; 对第 一特征进行特征提取, 得到与 样本图像的类别无 关的噪声特征; 对噪声特征进行转换, 得到转换 后的噪声特征, 其中, 转换后的噪声特征的维度 与样本图像的第二特征的维度之间的维度差异 小于或等于预设维度差异阈值; 将转换后的噪声 特征输入第二深度学习模型, 得到噪声迁移后的 分类结果; 根据噪声迁移后的分类结果, 训练第 一深度学习模 型。 本公开还提供了一种图像分类 方法、 装置、 电子设备和存 储介质。 权利要求书5页 说明书20页 附图9页 CN 115482390 A 2022.12.16 CN 115482390 A 1.一种深度学习模型的训练方法, 包括: 将样本图像输入第 一深度学习 模型的第 一特征提取网络, 得到所述样本图像的第 一特 征; 对所述第一特 征进行特征提取, 得到与所述样本图像的类别无关的噪声特 征; 对所述噪声特征进行转换, 得到转换后的噪声特征, 其中, 所述转换后的噪声特征的维 度与所述样本图像的第二特征的维度之 间的维度差异小于或等于预设维度差异阈值, 所述 第二特征是利用第二深度学习模型的第二特 征提取网络处 理所述样本图像得到的; 将所述转换后的噪声特征输入所述第二深度学习模型, 得到噪声迁移后的分类结果; 以及 根据所述噪声迁移后的分类结果, 训练所述第一深度学习模型。 2.根据权利要求1所述的方法, 其中, 所述第 二深度学习模型的参数量大于或等于所述 第一深度学习模型的参数量, 所述将所述转换后的噪声特征输入所述第 二深度学习模型, 得到噪声迁移后的分类结 果包括: 将所述转换后的噪声特 征和所述第二特 征融合, 得到噪声迁移后的第二特 征; 以及 将所述噪声迁移后的第 二特征输入所述第 二深度学习模型的第 二分类网络, 得到所述 噪声迁移后的分类结果。 3.根据权利要求1所述的方法, 其中, 所述将样本图像输入第 一深度学习 模型的第 一特 征提取网络包括: 对所述样本图像进行 数据增强处 理, 得到增强后的样本图像; 以及 将所述增强后的样本图像输入所述第一特 征提取网络 。 4.根据权利要求1所述的方法, 其中, 所述根据所述噪声迁移后的分类结果, 训练所述 第一深度学习模型包括: 将所述第一特 征输入所述第一深度学习模型的第一分类网络, 得到第一分类结果; 确定所述噪声迁移后的分类结果和所述第一分类结果之间的第一差异值; 以及 调整所述第一深度学习模型的参数, 使得所述第一差异值收敛, 以训练所述第一深度 学习模型。 5.根据权利要求4所述的方法, 其中, 所述确定所述噪声迁移后的分类结果和所述第 一 分类结果之间的第一差异值包括: 根据所述第一分类结果和所述噪声迁移后的分类结果, 确定噪声迁移后的蒸馏子损 失; 根据所述噪声迁移后的蒸馏子损失, 确定所述第一差异值。 6.根据权利要求5所述的方法, 其中, 所述根据所述噪声迁移后的蒸馏子损 失, 确定所 述第一差异值包括: 根据所述第一分类结果和所述样本图像的标签, 确定第一分类子损失; 根据所述噪声迁移后的分类结果和所述标签, 确定噪声迁移后的分类子损失; 根据所述第 一分类子损失、 所述噪声迁移后的分类子损失和所述噪声迁移后的蒸馏子 损失, 确定所述第一差异值。 7.根据权利要求1所述的方法, 还 包括:权 利 要 求 书 1/5 页 2 CN 115482390 A 2根据所述噪声特 征和所述第一特 征, 确定与所述样本图像的类别相关的类别特 征; 将所述类别特征输入所述第一深度学习模型的第一分类网络, 得到去噪后的分类结 果; 其中, 所述 根据所述噪声迁移后的分类结果, 训练所述第一深度学习模型包括: 将所述第一特 征输入所述第一分类网络, 得到第一分类结果; 确定所述噪声迁移后的分类结果、 所述去噪后的分类结果和所述第 一分类结果之间的 第二差异值; 以及 调整所述第一深度学习模型的参数, 使得所述第二差异值收敛, 以训练所述第一深度 学习模型。 8.根据权利要求7所述的方法, 其中, 所述确定所述噪声迁移后的分类结果、 所述去噪 后的分类结果和所述第一分类结果之间的第二差异值包括: 根据所述第一分类结果和所述噪声迁移后的分类结果, 确定噪声迁移后的蒸馏子损 失; 根据所述第一分类结果和所述去噪后的分类结果, 确定去噪后的蒸馏子损失; 根据所述噪声迁移后的蒸馏子损失和所述去噪后的蒸馏子损失, 确定所述第二差异 值。 9.根据权利要求8所述的方法, 其中, 所述根据所述噪声迁移后的蒸馏子损失和所述去 噪后的蒸馏子损失, 确定所述第二差异值包括: 根据所述第一分类结果和所述样本图像的标签, 确定第一分类子损失; 根据所述噪声迁移后的分类结果和所述标签, 确定噪声迁移后的分类子损失; 根据所述去噪后的分类结果和所述标签, 确定去噪后的分类子损失; 根据所述第一分类子损失、 所述噪声迁移后的分类子损失、 所述去噪后的分类子损失、 所述噪声迁移后的蒸馏子损失和所述去噪后的蒸馏子损失, 确定所述第二差异值。 10.根据权利要求4至9任一项所述的方法, 其中, 所述对所述第一特征进行特征提取, 得到与所述样本图像的类别无关的噪声特 征包括: 利用噪声提取网络对所述第一特 征进行特征提取, 得到所述噪声特 征; 其中, 所述方法还 包括: 根据所述噪声迁移后的分类结果, 训练所述噪声提取网络 。 11.根据权利要求4至9任一项所述的方法, 其中, 所述对所述噪声特征进行转换, 得到 转换后的噪声特 征包括: 利用噪声转换网络对所述噪声特 征进行转换, 得到所述 转换后的噪声特 征; 其中, 所述方法还 包括: 根据所述噪声迁移后的分类结果, 训练所述噪声转换网络 。 12.一种图像分类方法, 包括: 将目标图像输入第一深度学习模型, 得到目标分类结果, 其中, 所述第一深度学习模型 是利用权利要求1至1 1任一项所述的方法训练的。 13.一种深度学习模型的训练方法, 包括: 将样本图像输入第 一深度学习 模型的第 一特征提取网络, 得到所述样本图像的第 一特 征;权 利 要 求 书 2/5 页 3 CN 115482390 A 3

PDF文档 专利 模型训练方法、图像分类方法、装置、电子设备和介质

文档预览
中文文档 35 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共35页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、图像分类方法、装置、电子设备和介质 第 1 页 专利 模型训练方法、图像分类方法、装置、电子设备和介质 第 2 页 专利 模型训练方法、图像分类方法、装置、电子设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:26上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。