iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211242782.0 (22)申请日 2022.10.11 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 杨馥魁  (74)专利代理 机构 北京市汉坤律师事务所 11602 专利代理师 姜浩然 吴丽丽 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/764(2022.01) G06N 20/00(2019.01) (54)发明名称 图像检测方法和图像 检测模型的训练方法 (57)摘要 本公开提供了一种图像检测方法和图像检 测模型的训练方法, 涉及人工智 能技术领域, 具 体为深度学习、 图像处理、 计算机视觉技术领域, 可应用于人脸识别等场景。 实现方案为: 获得目 标图像, 目标图像包含有目标对象; 基于目标图 像的至少两个边中的每一个边的长度, 获得该边 对应的多个目标序列值; 基于目标图像, 获得目 标图像的目标定位特征, 目标定位特征指示至少 两个边对应的多个目标序列值中的每一个目标 序列值与 目标对象的检测框在目标图像中的位 置相应的概率; 以及基于目标定位特征, 获得目 标对象的检测框的位置 。 权利要求书4页 说明书13页 附图4页 CN 115512131 A 2022.12.23 CN 115512131 A 1.一种图像 检测方法, 包括: 获得目标图像, 所述目标图像包 含有目标对象; 基于所述目标图像的至少两个边中的每一个边的长度, 获得该边对应的多个目标序列 值; 基于所述目标图像, 获得所述目标图像的目标定位特征, 所述目标定位特征指示所述 至少两个边对应的多个目标序列值中的每一个目标序列值与所述目标对 象的检测框在所 述目标图像中的位置相应的概 率; 以及 基于所述目标定位特 征, 获得所述目标对象的检测框的位置 。 2.根据权利要求1所述的方法, 其中, 所述基于所述目标图像, 获得所述目标图像的目 标定位特 征包括: 通过将所述目标图像输入图像检测模型, 以获得所述定位特征, 其中, 所述图像检测模 型是采用训练图像基于经训练的教师模型训练学生模型获得的, 所述训练图像包括与所述 目标对象相应的训练对 象, 在训练所述学生模型 的过程中, 通过将所述训练图像分别输入 所述教师模型和所述学生模型, 获得所述教师模型输出的第一定位特征和所述学生模型输 出的第二定位特征, 并且基于所述第一定位特征和所述第二定位特征获得的损失调整 所述 学生模型的参数; 其中, 所述第一定位特征和所述第二定位特征分别指示多个训练序列值中的每一个训练序 列值与所述训练对象的检测框在所述训练图像中的位置相应的概率, 所述多个训练序列值 包括基于所述训练图像的至少两个边中的每一个边的长度获得 的该边对应的多个训练序 列值。 3.根据权利要求1所述的方法, 其中, 所述目标定位特征包括维度为4 ×n的矩阵, n为正 整数; 其中, 所述矩阵中的多个行与所述目标图像的四个边分别对应, 所述矩阵中的每一个行的多 个元素与所述目标图像中的相应边所对应的多个目标序列值分别对应。 4.根据权利要求1所述的方法, 其中, 所述至少两个边中的每一个边对应的多个目标序 列值中的任意两个相邻目标序列值之差为预设值。 5.根据权利要求1所述的方法, 其中, 所述至少两个边中的每一个边对应的多个目标序 列值的数量与所述目标图像的多个边中较长的边相应。 6.一种图像检测模型的训练方法, 其中, 所述数据处理模型包括学生模型, 所述方法包 括: 获得训练图像, 所述训练图像包括训练对象; 基于所述训练图像的至少两个边中的每一个边的长度, 获得该边对应的多个训练序列 值; 获得所述学生模型基于所述训练数据获得的第 一定位特征, 并且获得经训练 的教师模 型于所述训练数据获得的第二定位特征, 所述第一定位特征和所述第二定位特征分别指示 所述至少两个边对应的多个训练序列值中的每一个训练序列值与所述训练对 象的检测框 在所述训练图像中的位置相应的概 率; 基于所述第一定位特 征所述第二定位特 征, 获得第一损失; 以及 基于所述第一损失, 调整所述学生模型的参数。权 利 要 求 书 1/4 页 2 CN 115512131 A 27.根据权利要求6所述的方法, 还 包括: 获得所述学生模型基于所述训练图像获得的第 一分类特征, 并且获得所述教师模型基 于所述训练图像基于所述训练图像获得的第二分类特征, 所述第一分类特征和所述第二分 类特征分别指示所述训练对象对应于目标分类的概 率; 以及 将所述第一分类特征和所述第二分类特征获得第二损 失, 并且其中, 所述基于第一损 失, 调整所述学生模型的参数包括: 基于所述第一损失和所述第二损失, 调整所述学生模型的参数。 8.根据权利要求6所述的方法, 其中, 第 一定位特征和所述第 二定位特征分别包括维度 为4×n的矩阵, n 为正整数; 其中, 所述矩阵中的多个行与所述训练图像的四个边分别对应, 所述矩阵中的每一个行的多 个元素与所述训练图像中的相应边所对应的多个训练序列值分别对应。 9.根据权利要求6所述的方法, 其中, 所述至少两个边中的每一个边对应的多个训练序 列值中的任意两个相邻训练序列值之差为预设值。 10.根据权利要求6所述的方法, 其中, 所述至少两个边中的每一个边对应的多个训练 序列值的数量与所述至少两个边中较长的边相应。 11.一种图像 检测装置, 包括: 目标图像获取 单元, 被配置用于获得目标图像, 所述目标图像包 含有目标对象; 目标序列值获取单元, 被配置用于基于所述目标图像的至少两个边中的每一个边的长 度, 获得该边对应的多个目标序列值; 目标定位特征获取单元, 被配置用于基于所述目标图像, 获得所述目标图像的目标定 位特征, 所述目标定位特征指示所述至少两个边对应的多个目标序列值中的每一个目标序 列值与所述目标对象的检测框在所述目标图像中的位置相应的概 率; 以及 检测框位置获取单元, 被配置用于基于所述目标定位特征, 获得所述目标对象的检测 框的位置 。 12.根据权利要求1 1所述的装置, 其中, 所述目标定位特 征获取单元包括: 图像输入单元, 被配置用于通过将所述目标图像输入图像检测模型, 以获得所述定位 特征, 其中, 所述图像检测模型是采用训练图像基于经训练的教师模型训练学生模型获得 的, 所述训练图像包括与所述目标对象相应的训练对象, 在训练所述学生模型的过程中, 通 过将所述训练图像分别输入所述教师模型和所述学生模型, 获得所述教师模型输出的第一 定位特征和所述学生模型输出的第二定位特征, 并且基于所述第一定位特征和所述第二定 位特征获得的损失调整所述学生模型的参数; 其中, 所述第一定位特征和所述第二定位特征分别指示多个训练序列值中的每一个训练序 列值与所述训练对象的检测框在所述训练图像中的位置相应的概率, 所述多个训练序列值 包括基于所述训练图像的至少两个边中的每一个边的长度获得 的该边对应的多个训练序 列值。 13.根据权利要求11所述的装置, 其中, 所述目标定位特征包括维度为4 ×n的矩阵, n为 正整数; 其中, 所述矩阵中的多个行与所述目标图像的四个边分别对应, 所述矩阵中的每一个行的多 个元素与所述目标图像中的相应边所对应的多个目标序列值分别对应。权 利 要 求 书 2/4 页 3 CN 115512131 A 3

PDF文档 专利 图像检测方法和图像检测模型的训练方法

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像检测方法和图像检测模型的训练方法 第 1 页 专利 图像检测方法和图像检测模型的训练方法 第 2 页 专利 图像检测方法和图像检测模型的训练方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:18上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。