iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211201800.0 (22)申请日 2022.09.29 (71)申请人 珠海视熙科技有限公司 地址 519080 广东省珠海市高新区唐家湾 镇金唐路1号港湾1号科创园4栋6层 601-1 (72)发明人 陈瑞斌 肖兵 李正国  (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 付伟丽 (51)Int.Cl. G06V 40/10(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 数据自适应重采样的目标检测模型训练方 法、 装置及设备 (57)摘要 本发明提供了数据自适应重采样的目标检 测模型训练方法、 装置及设备, 所述方法包括: 获 取与预先根据业务场景建立的目标检测模型的 基础样本数据集; 从所述基础样 本数据集中进行 样本随机筛选得到第一训练数据集, 利用所述第 一训练数据集训练所述目标检测模 型; 基于所述 基础样本数据集进行模型先验自适应采样得到 第二训练数据集, 利用所述第二训练数据集训练 所述目标检测模 型。 本发明通过将目标检测模型 的模型训练分为两个阶段, 能够根据当前模型的 预测效果自适应采样对其有益的训练数据, 既能 减少冗余训练数据, 提升训练效率, 又能保证训 练精度, 提升模型鲁棒 性。 权利要求书2页 说明书10页 附图3页 CN 115512391 A 2022.12.23 CN 115512391 A 1.一种数据自适应重采样的目标检测模型训练方法, 其特 征在于, 所述方法包括: 获取与预 先根据业 务场景建立的目标检测模型的基础样本数据集; 从所述基础样本数据集中进行样本随机筛选得到第 一训练数据集, 利用所述第 一训练 数据集训练所述目标检测模型; 基于所述基础样本数据集进行模型先验自适应采样得到第 二训练数据集, 利用所述第 二训练数据集训练所述目标检测模型。 2.根据权利要求1所述的方法, 其特征在于, 所述利用所述第 一训练数据集训练所述目 标检测模型之后, 所述方法还 包括: 统计利用所述第一训练数据集训练所述目标检测模型的训练次数, 若所述训练次数大 于预先设置的固定迭代次数, 则停止利用所述第一训练数据集训练所述目标检测模型; 或, 获取所述目标检测模型的训练精度, 若所述训练精度达到预先设置的目标精度, 则停 止利用所述第一训练数据集训练所述目标检测模型。 3.根据权利要求1所述的方法, 其特征在于, 所述基于所述基础样本数据集进行模型先 验自适应采样得到第二训练数据集, 利用所述第二训练数据集训练所述目标检测模型包 括: 利用经由所述第一训练数据集训练后的目标检测模型对所述基础样本数据集中各样 本数据进行目标检测, 并根据检测结果进行 数据筛选得到第二训练数据集; 利用所述第二训练数据集训练所述目标检测模型; 依据所述目标检测模型的模型训练数据判断所述目标检测模型是否符合预设重采样 条件; 若判断所述目标检测模型符合预设重采样条件, 则基于所述基础样本数据集进行重采 样以更新所述第二训练数据集; 利用更新后的所述第二训练数据集训练所述目标检测模型。 4.根据权利要求3所述的方法, 其特征在于, 所述依据所述目标检测模型的模型训练数 据判断所述目标检测模型 是否符合预设重采样条件 包括: 判断所述目标检测模型的训练轮数是否满足预设重采样周期, 若是, 则判断所述目标 检测模型符合预设重采样条件; 若否, 则判断所述目标检测模型不符合预设重采样条件; 或, 依据所述目标检测模型的精度波动程度是否稳定, 若稳定, 则判断所述目标检测模型 符合预设重采样条件; 若不稳定, 则判断所述目标检测模型不符合预设重采样条件。 5.根据权利要求3所述的方法, 其特征在于, 所述基于所述基础样本数据集进行重采样 以更新所述第二训练数据集包括: 计算所述基础样本数据集中各样本数据对应的数据采样概 率; 基于各样本数据对应的数据采样概率在所述基于所述基础样本数据集进行重采样以 更新第二训练数据集。 6.根据权利要求5所述的方法, 其特征在于, 所述计算所述基础样本数据集中各样本数 据对应的数据采样概 率包括: 获取所述目标检测模型对所述基础样本数据集中任一样本数据的预测结果; 计算各所述样本数据对应的数据采样概 率的超参数;权 利 要 求 书 1/2 页 2 CN 115512391 A 2基于所述预测结果和所述超参数计算各 所述样本数据对应的数据采样概 率。 7.根据权利要求6所述的方法, 其特征在于, 基于所述预测结果和所述超参数计算各所 述样本数据对应的数据采样概 率包括: 获取所述基础样本数据集中各样本数据的预测结果; 获取采样总数的数 学期望; 基于所述各样本数据的预测结果和所述采样总数的数学期望计算各所述样本数据对 应的数据采样概 率。 8.根据权利要求6所述的方法, 其特征在于, 通过以下方式计算所述基础样本数据集中 各样本数据对应的数据采样概 率: S=(1‑P)γ 其中, S为样本的采样概 率; P为样本的预测结果; γ为采样概 率的超参数。 9.根据权利要求8所述的方法, 其特征在于, 通过以下方式计算各所述样本数据对应的 数据采样概 率: 其中, Pi为第i个样本的采样概 率, 原样本总数为 n, 则Nexp(Nexp≤n)为数 学期望。 10.根据权利要求8所述的方法, 其特征在于, 所述获取所述基础样本数据集中各样本 数据的预测结果包括: 获取所述基础样本数据集的样本总数, 并将所述样本总数划分为多个样本组, 计算各 所述样本组对应的参 考预测结果。 11.根据权利要求10所述的方法, 其特征在于, 所述基于所述各样本数据的预测结果和 所述采样总数的数 学期望计算各 所述样本数据对应的数据采样概 率包括: 基于所述各所述样本组对应的参考预测结果和所述采样总数的数学期望计算各所述 样本数据对应的数据采样概 率。 12.一种数据自适应重采样的目标检测模型训练装置, 其特 征在于, 所述装置包括: 数据集获取模块, 用于获取与预先根据业务需求建立的目标检测模型的基础样本数据 集; 第一训练模块, 用于从所述基础样本数据集中进行样本随机筛选得到第一训练数据 集, 利用所述第一训练数据集训练所述目标检测模型; 第二训练模块, 用于基于所述第一训练数据集进行自适应采样得到第二训练数据集, 利用所述第二训练数据集训练所述目标检测模型。 13.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质用于存储程序代 码, 所述程序代码用于执 行权利要求1 ‑11任一项所述的方法。 14.一种图像采集设备, 其特征在于, 所述图像采集设备执行权利要求1 ‑11中任一项所 述的方法, 或包括权利要求12所述的数据自适应重采样的目标检测模型训练装置, 或具有 根据权利要求13所述的非暂时性计算机可读存 储介质。权 利 要 求 书 2/2 页 3 CN 115512391 A 3

PDF文档 专利 数据自适应重采样的目标检测模型训练方法、装置及设备

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据自适应重采样的目标检测模型训练方法、装置及设备 第 1 页 专利 数据自适应重采样的目标检测模型训练方法、装置及设备 第 2 页 专利 数据自适应重采样的目标检测模型训练方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:29上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。