iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211231831.0 (22)申请日 2022.09.30 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 谌强  (74)专利代理 机构 北京中博世 达专利商标代理 有限公司 1 1274 专利代理师 韩杰 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 图像识别模 型的训练方法、 图像识别方法以 及相关装置 (57)摘要 本公开提供了一种图像识别模型的训练方 法、 图像识别方法以及相关装置, 涉及人工智能 技术领域, 尤其涉及深度学习、 图像处理、 大模 型、 计算机视觉技术领域。 具体实现方案为: 获取 初始模型的骨干网络包含的模型参数, 对模型参 数进行特征分解, 得到模型参数的至少两个子参 数, 基于图像样本数据对初始模型进行迭代训 练, 以获得图像识别模型, 在任一次迭代训练的 过程中, 基于本次迭代训练的输出结果和图像样 本数据的样本标签, 调整第一子参数, 第二子参 数保持不变。 如此, 达到了对骨干网络中少量参 数进行微调的效果, 能够在 避免模型过拟合的情 况下提升骨干网络的训练效果, 能够训练得到能 力更好的模型, 从而提升 了图像识别的准确性。 权利要求书3页 说明书14页 附图4页 CN 115496916 A 2022.12.20 CN 115496916 A 1.一种图像识别模型的训练方法, 所述方法包括: 获取初始模型的骨干网络包含的模型参数, 其中, 用于训练所述初始模型的图像样本 数据的数量小于阈值; 对所述模型参数进行特征分解, 得到所述模型参数的至少两个子参数, 所述至少两个 子参数包括第一子参数和第二子参数; 基于所述图像样本数据对所述初始模型进行迭代训练, 以获得 所述图像识别模型; 在任一次迭代训练的过程中, 将所述图像样本数据输入上一 次迭代训练后得到的模型 中, 以获得本次迭代训练的输出结果, 根据所述输出结果和所述图像样本数据的样本标签, 调整所述第一子参数, 所述第二子参数保持不变; 所述样本标签用于指示所述图像样本数 据的图像信息 。 2.根据权利要求1所述的方法, 其中, 所述模型参数包括以下至少一项: 所述骨干网络中卷积层包 含的模型参数; 所述骨干网络中的网络层包 含的模型参数。 3.根据权利要求1所述的方法, 其中, 所述第一子参数包括: 权 重子参数; 所述第二子参数包括: 特 征子参数; 所述权重子参数表示所述特征子参数的权重比例, 所述特征子参数表示基于所述模型 参数所确定的语义特 征。 4.根据权利要求1所述的方法, 其中, 所述对所述模型参数进行特征分解, 得到所述模 型参数的至少两个子参数, 包括: 对所述模型参数进行奇异值分解或正交三角分解, 得到所述至少两个子参数。 5.根据权利要求1所述的方法, 其中, 所述根据所述输出结果和所述图像样本数据的样 本标签, 调整所述第一子参数, 包括: 根据所述输出结果与所述图像样本数据的样本标签, 确定本次迭代训练的模型损失 值; 根据所述模型损失值, 调整所述第一子参数。 6.根据权利要求1所述的方法, 还 包括: 获取待识别图像; 将所述待识别图像输入所述图像识别模型, 通过所述图像识别模型提取所述待识别图 像的图像特征, 基于所述图像特征对所述待识别图像进 行处理, 以获得 处理结果, 所述处理 包括分类处 理、 分割处 理或预测处 理中的任一项。 7.一种图像识别方法, 所述方法包括: 获取待识别图像; 将所述待识别图像输入图像识别模型, 通过所述图像识别模型提取所述待识别图像的 图像特征, 基于所述图像特征对 所述待识别图像进 行处理, 以获得 处理结果, 所述处理包括 分类处理、 分割处 理或预测处 理中的任一项; 其中, 所述图像识别模型是采用数量小于 阈值的图像样本数据对初始模型进行训练得 到的; 在采用所述图像样本数据对所述初始模型进行训练的过程中, 所述初始模型 的骨干 网络中包含的第一子参数被调整, 除所述第一子参数外的其他所述骨干网络的第二子参数权 利 要 求 书 1/3 页 2 CN 115496916 A 2保持不变。 8.根据权利要求7 所述的方法, 还 包括: 获取所述初始模型的骨干网络包 含的模型参数; 对所述模型参数进行特征分解, 得到所述模型参数的至少两个子参数, 所述至少两个 子参数包括所述第一子参数和所述第二子参数; 基于所述图像样本数据对所述初始模型进行迭代训练, 以获得 所述图像识别模型; 在任一次迭代训练的过程中, 将所述图像样本数据输入上一 次迭代训练后得到的模型 中, 以获得本次迭代训练的输出结果, 根据所述输出结果和所述图像样本数据的样本标签, 调整所述第一子参数, 所述第二子参数保持不变; 所述样本标签用于指示所述图像样本数 据的图像信息 。 9.一种图像识别模型的训练装置, 所述装置包括: 获取模块, 用于获取初始模型的骨干网络包含的模型参数, 其中, 用于训练所述初始模 型的图像样本数据的数量小于阈值; 分解模块, 用于对所述模型参数进行特征分解, 得到所述模型参数的至少两个子参数, 所述至少两个子参数包括第一子参数和第二子参数; 训练模块, 用于基于所述图像样本数据对所述初始模型进行迭代训练, 以获得所述图 像识别模型; 调整模块, 用于在任一次迭代训练的过程中, 将所述图像样本数据输入上一次迭代训 练后得到的模型中, 以获得本次迭代训练的输出结果, 根据所述输出结果和所述图像样本 数据的样本标签, 调整 所述第一子参数, 所述第二子参数保持不变; 所述样 本标签用于指示 所述图像样本数据的图像信息 。 10.根据权利要求9所述的装置, 其中, 所述模型参数包括以下至少一项: 所述骨干网络中卷积层包 含的模型参数; 所述骨干网络中的网络层包 含的模型参数。 11.根据权利要求9所述的装置, 其中, 所述第一子参数包括: 权 重子参数; 所述第二子参数包括: 特 征子参数; 所述权重子参数表示所述特征子参数的权重比例, 所述特征子参数表示基于所述模型 参数所确定的语义特 征。 12.根据权利要求9所述的装置, 其中, 所述分解模块, 用于: 对所述模型参数进行奇异值分解或正交三角分解, 得到所述至少两个子参数。 13.根据权利要求9所述的装置, 其中, 所述调整模块, 用于: 根据所述输出结果与所述图像样本数据的样本标签, 确定本次迭代训练的模型损失 值; 根据所述模型损失值, 调整所述第一子参数。 14.根据权利要求9所述的装置, 所述获取模块, 还用于获取待识别图像; 所述装置还包括处理模块, 用于将所述待识别图像输入所述图像识别模型, 通过所述 图像识别模型提取所述待识别图像的图像特征, 基于所述图像特征对所述待识别图像进 行 处理, 以获得处 理结果, 所述处 理包括分类处 理、 分割处 理或预测处 理中的任一项。权 利 要 求 书 2/3 页 3 CN 115496916 A 3

PDF文档 专利 图像识别模型的训练方法、图像识别方法以及相关装置

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像识别模型的训练方法、图像识别方法以及相关装置 第 1 页 专利 图像识别模型的训练方法、图像识别方法以及相关装置 第 2 页 专利 图像识别模型的训练方法、图像识别方法以及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:26上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。