iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211232414.8 (22)申请日 2022.10.09 (71)申请人 宁波大学 地址 315000 浙江省宁波市江北区风 华路 818号 (72)发明人 徐昊 彭成斌 陈传梓 邱晓杰 肖辉 严迪群 董理 (74)专利代理 机构 南京利丰知识产权代理事务 所(特殊普通 合伙) 32256 专利代理师 王锋 (51)Int.Cl. G06V 10/764(2022.01) G06N 20/00(2019.01) (54)发明名称 基于伪负标签的半监督模型训练方法、 系统 及应用 (57)摘要 本发明公开了一种针对半监督图像分类任 务下基于伪负标签的模型训练方法、 系统及应 用。 所述训练方法包括: 获取结构相同的两个基 础模型及训练集; 计算有监督损失值; 将无标签 数据分别进行弱增强和强增强操作; 分别输入基 础模型获得伪标签和预测结果; 基于伪标签生成 伪负标签, 负标签代表图片不属于的类别, 并基 于模型预测和对方提供的伪负标签计算无监督 损失值; 基于有监督和无监督损失值, 迭代更新 参数。 本发 明所提供的训练方法通过生成伪负标 签, 避免了对伪标签进行筛选, 有效提高了无标 签数据利用率, 并降低两个基础模 型参数之间的 耦合程度; 通过伪负标签选择生成更高效的伪负 标签供对 方基础模型学习, 从而显著提高了训练 效率和模型分类准确性。 权利要求书3页 说明书11页 附图2页 CN 115482418 A 2022.12.16 CN 115482418 A 1.一种基于伪负标签的半监 督模型训练方法, 其特 征在于, 包括: 1)获取结构相同的第一基础模型和第二基础模型以及训练集, 所述训练集包括有标签 数据及其对应的真值标签, 以及无 标签数据; 2)将任一所述有标签数据分别进行两次不同的弱增强操作, 获得有标签第 一结果和有 标签第二结果, 基于所述有标签第一结果和有标签第二结果及其对应的真值标签分别计算 所述第一基础模型的第一有监 督损失值和第二基础模型的第二有监 督损失值; 3)将任一所述无标签数据分别进行弱增强操作和强增强操作, 获得无标签弱增强结果 和无标签强增强结果; 4)将所述无标签弱增强结果分别输入所述第 一基础模型和第二基础模型中进行分类, 获得第一伪标签和 第二伪标签; 将所述无标签强增强结果分别输入所述第一基础模型和 第 二基础模型中进行分类, 获得第一分类结果和第二分类结果; 5)基于所述第一伪标签和第二伪标签生成第一伪负标签和第二伪负标签, 其中, 伪负 标签代表不同于对应的伪标签的其余类别标签, 并基于所述第一分类结果和 第二伪负标签 计算第一无监 督损失值, 基于所述第二分类结果和第一伪负标签 计算第二无监 督损失值; 6)基于所述第 一有监督损失值和第 一无监督损失值, 迭代更新所述第 一基础模型的参 数, 基于所述第二有监 督损失值和第二无监 督损失值, 迭代更新所述第二基础模型的参数。 2.根据权利要求1所述的训练方法, 其特 征在于, 步骤2)具体包括: 将任一所述有标签数据分别进行两次不同的弱增强操作, 获得有标签第 一结果和有标 签第二结果, 并分别输入所述第一基础 模型和第二基础 模型, 获得两个有标签分类结果, 并 结合对应的所述真值标签计算所述第一基础模型的第一有监督损失值和第二基础模型的 第二有监 督损失值。 3.根据权利要求2所述的训练方法, 其特征在于, 步骤5)中, 所述伪负标签的生成方法 具体包括: 基于所述有标签分类结果, 统计所述真值标签所指示的类别之外的其余各个类别的分 类概率; 基于所述分类概率, 从所述伪标签所指示的类别之外的其余各个类别中随机抽取若干 类别作为所述伪负标签。 4.根据权利要求3所述的训练方法, 其特征在于, 通过使用有标签数据计算基础模型误 分类到其 余各个类别的分类分数, 所述分类分数代 表所述分类概 率; 所述分类分数的计算公式为: Rk=Softmax(Prk) 其中, Prk表示基础模型对第k类别数据误分到其余类别的分数向量, Prk[j]代表所述基 础模型对第k类别数据误分到第j类上的概率分数; Nk代表模型对于本次迭代中 的多个有标 签数据中第k类数据误分类的总个数; pij表示基础模 型对第i个样 本第j类的预测概率; Rk代 表标准化过后的所述 概率分数, 并作为所述分类分数使用; 且在迭代过程中, 采用指数移动平均的方法更新Prk[j]。权 利 要 求 书 1/3 页 2 CN 115482418 A 25.根据权利要求1所述的训练方法, 其特 征在于, 步骤4)中, 所述伪标签的计算公式为: 其中, Y(p)代表所述伪标签; OneHot代表热编码操作; 代表所述无标签弱增强结果; 代表基础模型对所述无 标签弱增强结果进行分类获得的分类概 率分布。 6.根据权利要求5所述的训练方法, 其特征在于, 步骤5)中, 所述伪负标签的计算公式 为: Y(c)∈z(Y(p), m) 其中, Y(c)代表所述伪负标签, 从集合z(Y(p), m)中随机选择; K代表总类别个数; m为一个 大于等于1小于K的正整数, 代表随机选择的伪负标签的个数; v代表一个包含K个特征的一 维向量。 7.根据权利要求2所述的训练方法, 其特征在于, 所述第 一有监督损失值和第 二有监督 损失值的损失函数分别为: 上述公式 中, 其中, 代表所述第一有监督损失值; 代表所述第二有监督损失值; 和 代表 两次不同的弱增强操作获得的两个有标签弱增强结果; fθ代表所述第一基础模型, 代表 所述第二基础模型; Y(t)代表所述真值标签编码之后的热向量, Y(1)代表所述有标签分类结 果; 所述第一无监 督损失值和第二无监 督损失值的损失函数分别为: 上述公式 中, 其中, 代表所述第一无监督损失值, 代表所述第二无监督损失值; 代表所 述无标签弱增强结果; Y(c)代表所述伪负标签编码后的热向量; Y(2)代表所述第一分类结果 或第二分类结果。 8.根据权利要求7所述的训练方法, 其特征在于, 将有监督损失值与 无监督损失值的线 型加和值作为总损失值对相应的基础模型的参数进行 更新; 所述总损失值的计算公式分别为: 其中, λ代表有监督损失和无监督损失之间的平衡系数, 其取值范围为0.5~1之间; l(1) 和l(2)分别代表所述第一基础模型和第二基础模型对应的总损失值。 9.一种基于伪负标签的图像分类模型训练系统, 其特 征在于, 包括: 模型数据模块, 用于获取结构相同的第一基础模型和第二基础模型以及训练集, 所述 训练集包括有标签数据及其对应的真值标签, 以及无 标签数据; 有标签增强模块, 用于将任一所述有标签数据分别进行两次不同的弱增强操作, 获得权 利 要 求 书 2/3 页 3 CN 115482418 A 3
专利 基于伪负标签的半监督模型训练方法、系统及应用
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-03-03 12:04:21
上传分享
举报
下载
原文档
(769.4 KB)
分享
友情链接
POS终端 银行卡受理终端安全规范 第1部分销售点.pdf
GB-T 16814-2008 同步数字体系 (SDH) 光缆线路系统测试方法.pdf
GB-T 32658-2016 业余无线电设备射频技术要求及测试方法.pdf
SN-T 0987.7-2013 出口危险货物中型散装容器检验规程 第7部分:纤维板中型散装容器.pdf
GB-T 406-2018 棉本色布.pdf
电信研究院 游耀东 DevSecOps在云网融合环境下的实践 2021.pdf
SN-T 2952-2011 进出口煤炭检验规程.pdf
GB-T 12971.1-2023 电力牵引用接触线 第1部分:铜及铜合金接触线.pdf
GB-T 2440-2017 尿素.pdf
GB T 42446-2023 信息安全技术 网络安全从业人员能力基本要求.pdf
GB-T 4423-2020 铜及铜合金拉制棒.pdf
GM-T 0072-2019 远程移动支付密码应用技术要求.pdf
DL-T 294.3-2019 发电机灭磁及转子过电压保护装置技术条件 第3部分 转子过电压保护.pdf
GB-T 16902.3-2013 设备用图形符号表示规则 第3部分:应用导则.pdf
GB-T 41630-2022 智能泊车辅助系统性能要求及试验方法.pdf
GB-T 37966-2019 纳米技术 氧化铁纳米颗粒类过氧化物酶活性测量方法.pdf
思度安全-DSMM-004 数据采集安全管理规范V1.0.pdf
专利 黑产设备的确定方法、装置及服务器.PDF
GB-T 8013.1-2018 铝及铝合金阳极氧化膜与有机聚合物膜 第1部分:阳极氧化膜.pdf
GB-T 17872-2009 江海直达货船船型尺度系列.pdf
1
/
17
评价文档
赞助3元 点击下载(769.4 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。