iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211261405.1 (22)申请日 2022.10.14 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 邹智康 叶晓青  (74)专利代理 机构 北京银龙知识产权代理有限 公司 11243 专利代理师 尹倩 (51)Int.Cl. G06V 20/64(2022.01) G06V 10/764(2022.01) G06N 20/00(2019.01) (54)发明名称 模型训练方法、 图像检测方法、 装置及电子 设备 (57)摘要 本公开提供了一种模 型训练方法、 图像检测 方法、 装置及电子设备, 涉及人工智能技术领域, 尤其涉及计算机视觉、 图像处理、 增强现实、 深度 学习等技术领域, 可应用于增强现实、 自动驾驶、 元宇宙等场景。 具体实现方案为: 基于有标签图 像数据对第一初始模型进行训练, 得到第二初始 模型; 获取无标签图像数据, 并对所述无标签图 像数据进行数据增强处理, 得到第一增强图像数 据和第二增强图像数据; 基于所述第一增强图像 数据和所述第二增强图像数据对所述第二初始 模型进行迭代式的增强训练, 得到目标模型; 其 中, 所述目标模型用于根据输入的待检测图像, 输出所述待检测图像中物体的3D信息 。 权利要求书3页 说明书10页 附图2页 CN 115512347 A 2022.12.23 CN 115512347 A 1.一种模型训练方法, 包括: 基于有标签图像数据对第一初始模型进行训练, 得到第二初始模型; 获取无标签图像数据, 并对所述无标签图像数据进行数据增强处理, 得到第一增强图 像数据和第二增强图像数据; 基于所述第一增强图像数据和所述第二增强图像数据对所述第二初始模型进行迭代 式的增强训练, 得到目标模型; 其中, 所述目标模型用于根据输入的待检测图像, 输出所述待检测图像中物体的3D信 息。 2.根据权利要求1所述的方法, 其中, 所述增强训练, 包括: 将所述第一增强图像数据输入所述第二初始模型, 获取所述第二初始模型的第一输 出, 将所述第一输出作为伪标签; 将所述第二增强图像数据输入所述第二初始模型, 获取所述第二初始模型的第二输 出; 基于所述第二输出和所述伪标签对所述第二初始模型进行自监 督训练。 3.根据权利要求2所述的方法, 其中, 所述第一增强图像数据包括N种增强图像数据, 一 种所述增强图像数据对应一种增强处 理方式, N 为正整数; 所述将所述第 一增强图像数据输入所述第 二初始模型, 获取所述第 二初始模型的第 一 输出, 将所述第一输出作为伪标签, 包括: 将所述N种增强图像数据输入所述第二初始模型, 获取所述第二初始模型输出的每种 增强图像数据各自对应的3D信息和各自对应的置信度; 基于所述每种增强图像数据各自对应的3D信息及所述每种增强图像数据各自对应的 置信度, 获取 所述第一增强图像数据的第一输出; 基于所述第一增强图像数据的第一输出确定所述伪标签。 4.根据权利要求3所述的方法, 其中, 所述基于所述每种增强图像数据 各自对应的3D信 息及所述每种增强 图像数据各自对应的置信度, 获取所述第一增强 图像数据的第一输出, 包括: 对所述N种增强图像数据中置信度低于预设置信度的增强图像数据进行过滤处理, 得 到过滤后的增强图像数据; 基于所述过滤后的增强图像数据各自对应的3D信息及所述过滤后的增强图像数据各 自对应的置信度, 获取所述第一增强 图像数据的第一输出, 所述第一增强 图像数据为所述 过滤后的增强图像数据。 5.根据权利要求1所述的方法, 其中, 所述获取无标签图像数据, 并对所述无标签图像 数据进行 数据增强处 理, 得到第一增强图像数据和第二增强图像数据, 包括: 获取无标签图像数据; 对所述无 标签图像数据进行第一增强处 理, 得到第一增强图像数据; 对所述无 标签图像数据进行第二增强处 理, 得到第二增强图像数据; 其中, 所述第一增强处理为不改变所述无标签图像数据形状、 尺寸和角度中任一者的 处理, 所述第二增强处 理为改变所述无 标签图像数据形状、 尺寸和角度中至少一 者的处理。 6.根据权利要求1所述的方法, 其中, 所述基于所述第 一增强图像数据和所述第 二增强权 利 要 求 书 1/3 页 2 CN 115512347 A 2图像数据对所述第二初始模型进行迭代式增强训练, 得到目标模型, 包括: 基于所述第一增强图像数据和所述第二增强图像数据对所述第二初始模型进行迭代 式增强训练, 以及基于所述有标签图像数据对所述第二初始模型进行监督训练, 得到所述 目标模型。 7.一种图像 检测方法, 包括: 获取待检测图像; 将所述待检测图像输入目标模型, 获取所述目标模型输出的所述待检测图像中物体的 3D信息; 其中, 所述目标模型为根据权利要求1 ‑6中任一项所述的模型训练方法训练得到的模 型。 8.一种模型训练装置, 包括: 第一训练模块, 用于基于有标签图像数据对第一初始模型进行训练, 得到第二初始模 型; 处理模块, 用于获取无标签图像数据, 并对所述无标签图像数据进行数据增强处理, 得 到第一增强图像数据和第二增强图像数据; 第二训练模块, 用于基于所述第 一增强图像数据和所述第 二增强图像数据对所述第 二 初始模型进行迭代式的增强训练, 得到目标模型; 其中, 所述目标模型用于根据输入的待检测图像, 输出所述待检测图像中物体的3D信 息。 9.根据权利要求8所述的装置, 其中, 所述第二训练模块包括: 第一获取单元, 用于将所述第一增强图像数据输入所述第二初始模型, 获取所述第二 初始模型的第一输出, 将所述第一输出作为伪标签; 第二获取单元, 用于将所述第二增强图像数据输入所述第二初始模型, 获取所述第二 初始模型的第二输出; 训练单元, 用于基于所述第二输出和所述伪标签对所述第二初始模型进行自监督训 练。 10.根据权利要求9所述的装置, 其中, 所述第一增强图像数据包括N种增强图像数据, 一种所述增强图像数据对应一种增强处 理方式, N 为正整数; 所述第一获取 单元还用于: 将所述N种增强图像数据输入所述第二初始模型, 获取所述第二初始模型输出的每种 增强图像数据各自对应的3D信息和各自对应的置信度; 基于所述每种增强图像数据各自对应的3D信息及所述每种增强图像数据各自对应的 置信度, 获取 所述第一增强图像数据的第一输出; 基于所述第一增强图像数据的第一输出确定所述伪标签。 11.根据权利要求10所述的装置, 其中, 所述第一获取 单元还用于: 对所述N种增强图像数据中置信度低于预设置信度的增强图像数据进行过滤处理, 得 到过滤后的增强图像数据; 基于所述过滤后的增强图像数据各自对应的3D信息及所述过滤后的增强图像数据各 自对应的置信度, 获取所述第一增强 图像数据的第一输出, 所述第一增强 图像数据为所述权 利 要 求 书 2/3 页 3 CN 115512347 A 3

PDF文档 专利 模型训练方法、图像检测方法、装置及电子设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、图像检测方法、装置及电子设备 第 1 页 专利 模型训练方法、图像检测方法、装置及电子设备 第 2 页 专利 模型训练方法、图像检测方法、装置及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:15上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。