iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211222031.2 (22)申请日 2022.10.08 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 倪子涵 安容巧 孙逸鹏 姚锟  (74)专利代理 机构 北京市通商律师事务所 11951 专利代理师 姜莹丽 许念如 (51)Int.Cl. G06V 30/19(2022.01) G06V 10/764(2022.01) G06N 7/00(2006.01) (54)发明名称 目标检测模型的训练、 目标检测方法、 装置 及电子设备 (57)摘要 本公开提供了目标检测模型的训练、 目标检 测方法、 装置及电子设备, 涉及人工智 能技术领 域, 具体涉及深度学习、 图像处理、 计算机视觉技 术领域, 可应用于OCR等场景。 具体方案为: 获取 目标检测模 型以及训练样本集, 训练样本集包括 第一样本图像以及第二样本图像; 第一样本被标 注有第一目标框以及第一目标类别, 第二样本被 标注有第二目标框以及第二目标类别, 第一目标 类别不同于第二目标类别, 目标检测模 型包括第 一检测头网络以及第二检测头网络, 第一检测头 网络基于第一样本图像集预训练; 对第二检测头 网络进行模 型训练, 以更新第二检测头的模型参 数, 模型训练包括基于第二样 本图像进行的第一 子模型训练。 本方案能使模型快速具备对新类别 的识别能力。 权利要求书4页 说明书17页 附图5页 CN 115512365 A 2022.12.23 CN 115512365 A 1.一种目标检测模型的训练方法, 包括: 获取目标检测模型以及训练样本集, 所述训练样本集包括第 一样本图像以及第 二样本 图像; 所述第一样本被标注有第一 目标框以及第一 目标类别, 第二样本被标注有第二 目标 框以及第二 目标类别, 所述第一 目标类别不同于所述第二 目标类别, 所述 目标检测模型包 括第一检测头网络以及第二检测头网络, 所述第一检测头网络基于所述第一样本图像集预 训练; 对所述第二检测头网络进行模型训练, 以更新所述第二检测头的模型参数, 所述模型 训练包括基于所述第二样本图像进行的第一子模型训练; 所述第一子模型训练包括: 基于所述第 一检测头网络对所述第 二样本图像进行目标检测, 得到第 一预测框以及所 述第一预测框对应的第一类别概 率; 基于所述第 二检测头网络对所述第 二样本图像进行目标检测, 得到第 二预测框以及所 述第二预测框对应的第二类别概 率; 对所述第二类别概 率的数值进行调小处 理, 得到调小后的所述第二类别概 率; 采用非极大值抑制NMS算法, 基于调小后的所述第二类别概率以及所述第一类别概率, 从所述第一预测框以及所述第二预测框中确定出第一 最终预测框; 基于所述第 一最终预测框 中包含的第 二预测框, 以及所述第 一最终预测框 中包含的第 二预测框对应的第二类别概率, 并基于第二 目标框以及第二 目标类别, 对所述第二检测头 网络的模型参数进行 更新。 2.根据权利要求1所述的方法, 其中, 所述模型训练还包括基于所述第 一样本图像进行 的第二子模型训练, 所述第二子模型训练包括: 基于所述第 一检测头网络对所述第 一样本图像进行目标检测, 得到第 三预测框以及所 述第三预测框对应的第三类别概 率; 基于所述第 二检测头网络对所述第 一样本图像进行目标检测, 得到第四预测框以及所 述第四预测框对应的第四类别概 率; 对所述第四类别概 率的数值进行调大处 理, 得到调大后的所述第四类别概 率; 采用NMS算法, 基于调大后的所述第四类别概率以及所述第三类别概率, 从第三预测框 以及第四预测框中确定出第二 最终预测框; 基于所述第 二最终预测框 中包含的第四预测框, 以及所述第 二最终预测框 中包含的第 四预测框对应的第四类别概率, 并基于第二 目标框以及第二 目标类别, 对所述第二检测头 网络的模型参数进行 更新。 3.根据权利要求2所述的方法, 其中, 所述基于所述第 二检测头网络对所述第 一样本图 像进行目标检测, 包括: 基于第一子模型训练后的所述第二检测头网络对所述第一样本图像进行目标检测; 所述基于所述第二最终预测框 中包含的第四预测框, 以及所述第 二最终预测框 中包含 的第四预测框对应的第四类别概率, 并基于第二 目标框以及第二 目标类别, 对所述第二检 测头网络的模型参数进行 更新, 包括: 基于所述第 二最终预测框 中包含的第四预测框, 以及所述第 二最终预测框 中包含的第 四预测框对应的第四类别概率, 并基于第二 目标框以及第二 目标类别, 对所述第一子模型权 利 要 求 书 1/4 页 2 CN 115512365 A 2训练后的所述第二检测头网络的模型参数进行 更新。 4.根据权利要求2或3所述的方法, 其中, 所述对所述第 四类别概率的数值进行调大处 理, 包括: 基于预置的调大系数, 对所述第四类别概 率的数值进行调大处 理。 5.根据权利要求1 ‑4中任一项所述的方法, 其中, 所述对所述第二类别概率的数值进行 调小处理, 包括: 基于预置的调小系数, 对所述第二类别概 率的数值进行调小处 理。 6.根据权利要求1 ‑5中任一项所述的方法, 还 包括: 重复执行所述模型训练的步骤, 直至 达到预设的训练终止条件。 7.根据权利要求1 ‑6中任一项所述的方法, 其中, 所述第 二检测头网络的网络架构是基 于神经架构搜索NAS确定的。 8.一种目标检测方法, 包括: 将待检测图像输入至根据权利要求1 ‑7中任一项所述的目标检测模型的训练方法得到 的目标检测模型; 获得所述目标检测模型输出的目标检测框以及所述目标检测框对应的目标类别概 率。 9.根据权利要求8所述的方法, 其中, 还 包括: 采用NMS算法, 基于所述目标类别概率分别从各类别的所述目标检测框中确定出最终 目标检测框 。 10.一种目标检测模型的训练装置, 包括: 数据获取模块, 用于获取目标检测模型以及训练样本集, 所述训练样本集包括第一样 本图像以及第二样本图像; 所述第一样本被标注有第一 目标框以及第一 目标类别, 第二样 本被标注有第二目标框以及第二 目标类别, 所述第一 目标类别不同于所述第二目标类别, 所述目标检测模型包括第一检测头网络以及第二检测头网络, 所述第一检测头网络基于所 述第一样本图像集预训练; 模型训练模块, 用于对所述第二检测头网络进行模型训练, 以更新所述第二检测头的 模型参数, 所述模型训练包括基于所述第二样本图像进行的第一子模型训练; 所述第一子模型训练包括: 基于所述第 一检测头网络对所述第 二样本图像进行目标检测, 得到第 一预测框以及所 述第一预测框对应的第一类别概 率; 基于所述第 二检测头网络对所述第 二样本图像进行目标检测, 得到第 二预测框以及所 述第二预测框对应的第二类别概 率; 对所述第二类别概 率的数值进行调小处 理, 得到调小后的所述第二类别概 率; 采用MS算法, 基于调小后的所述第二类别概率以及所述第一类别概率, 从所述第一预 测框以及所述第二预测框中确定出第一 最终预测框; 基于所述第 一最终预测框 中包含的第 二预测框, 以及所述第 一最终预测框 中包含的第 二预测框对应的第二类别概率, 并基于第二 目标框以及第二 目标类别, 对所述第二检测头 网络的模型参数进行 更新。 11.根据权利要求10所述的装置, 其中, 所述模型训练模块还用于基于所述第 一样本图 像进行的第二子模型训练, 所述第二子模型训练包括:权 利 要 求 书 2/4 页 3 CN 115512365 A 3

PDF文档 专利 目标检测模型的训练、目标检测方法、装置及电子设备

文档预览
中文文档 27 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 目标检测模型的训练、目标检测方法、装置及电子设备 第 1 页 专利 目标检测模型的训练、目标检测方法、装置及电子设备 第 2 页 专利 目标检测模型的训练、目标检测方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:23上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。