(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211274774.4
(22)申请日 2022.10.18
(71)申请人 壹沓科技 (上海) 有限公司
地址 200040 上海市 静安区万 荣路666、 670
号1101室
(72)发明人 卞晓瑜 肖鸣林 周浩然
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 郑华丽
(51)Int.Cl.
G06V 10/764(2022.01)
G06V 10/74(2022.01)
G06V 10/82(2022.01)
(54)发明名称
文档图像分类方法、 装置、 存储介质及计算
机设备
(57)摘要
本申请提供的文档图像分类方法、 装置、 存
储介质及计算机设备, 所述方法包括: 接收多个
待分类文档图像; 获取每个所述待分类文档图像
的文本信息; 利用已设置的文本二分类模型, 识
别并标记每个所述文本信息中的各个目标关键
词; 确定每个所述文本信息中任意两个所述目标
关键词在该文本信息所属待分类文档图像中的
空间关系; 依据各个所述目标关键词以及各个所
述空间关系, 确定与各个所述待分类文档图像对
应的二维关键词序列; 依据所述二维关键词序列
对各个所述待分类文档图像进行分类, 得到分类
结果。 应用本申请提供的方法, 在同类文档图像
经过已设置的模型后可以提取出相同的二维关
键词序列, 从而能够针对文字密集的文档图像做
出较好的分类结果。
权利要求书2页 说明书9页 附图2页
CN 115496952 A
2022.12.20
CN 115496952 A
1.一种文档图像分类方法, 其特 征在于, 所述方法包括:
接收多个待分类文档图像;
获取每个所述待分类文档图像的文本信息;
利用已设置的文本二分类模型, 识别并标记每 个所述文本信息中的各个目标关键词;
确定每个所述文本信息中任意两个所述目标关键词在该文本信息所属待分类文档图
像中的空间关系;
依据各个所述目标关键词以及各个所述空间关系, 确定与各个所述待分类文档图像对
应的二维关键词序列;
依据所述 二维关键词序列对各个所述待分类文档图像进行分类, 得到分类结果。
2.根据权利要求1所述的文档图像分类方法, 其特征在于, 所述获取每个所述待分类文
档图像的文本信息的步骤, 包括:
扫描每个所述待分类文档图像, 确定每 个所述待分类文档图像中包 含的各个字符;
对各个所述字符进行初始化, 以校正各个所述字符的字符格式;
依据经过初始化的各个字符, 确定每 个所述待分类文档图像的文本信息 。
3.根据权利要求1所述的文档图像分类方法, 其特征在于, 所述确定每个所述文本信 息
中任意两个所述目标关键词在该文本信息所属待分类文档图像中的空间关系的步骤, 包
括:
在每个所述待分类文档图像 中, 确定每两个所述目标关键词的X方向距离值和Y方向距
离值;
确定第一距离值与第二距离值, 所述第一距离值为各个所述X方向距离值中数值最大
的X方向距离值, 所述第二距离值 为各个所述Y方向距离值中数值 最大的Y方向距离值;
计算每两个所述目标关键词的X方向距离与所述第一距离值的第一距离比例, 以及每
两个所述目标关键词的Y方向距离与所述第二距离值的第二距离比例;
依据所述第一距离比例与所述第二距离比例确定每两个所述目标关键词之间的空间
关系。
4.根据权利要求1所述的文档图像分类方法, 其特征在于, 所述依据各个所述目标关键
词以及各个所述空间关系, 确定与各个所述待分类文档图像对应的二维关键词序列 的步
骤, 包括:
在每个所述待分类文档图像中, 依据各个所述目标关键词的文本信息, 以及每两个所
述目标关键词之间的所述空间关系, 得到每两个所述目标关键词对应的子序列;
由各个所述子序列组成各个所述待分类文档图像对应的二维关键词序列。
5.根据权利要求1所述的文档图像分类方法, 其特征在于, 在属于同一类的各个所述待
文档图像中, 每两个所述待分类文档图像对应的二维关键词 序列之间的相似度大于预设阈
值。
6.一种文档图像分类装置, 其特 征在于, 包括:
文档图像接收模块, 用于 接收多个待分类文档图像;
文本信息获取模块, 用于获取每 个所述待分类文档图像的文本信息;
目标关键词标记模块, 用于利用已设置的文本二分类模型, 识别并标记每个所述文本
信息中的各个目标关键词;权 利 要 求 书 1/2 页
2
CN 115496952 A
2空间关系确定模块, 用于确定每个所述文本信 息中任意两个所述目标关键词在该文本
信息所属待分类文档图像中的空间关系;
二维关键词序列确定模块, 用于依据各个所述目标关键词以及各个所述空间关系, 确
定与各个所述待分类文档图像对应的二维关键词序列;
文档图像分类模块, 用于依据 所述二维关键词序列对各个所述待分类文档图像进行分
类, 得到分类结果。
7.根据权利要求6所述的文档图像分类装置, 其特征在于, 所述文本信息获取模块包
括:
文档图像扫描单元, 用于扫描每个所述待分类文档图像, 确定每个所述待分类文档图
像中包含的各个字符;
字符初始化单 元, 用于对各个所述字符进行初始化, 以校正各个所述字符的字符格式;
文本信息确定单元, 用于依据经过初始化的各个字符, 确定每个所述待分类文档图像
的文本信息 。
8.根据权利要求6所述的文档图像分类装置, 其特征在于, 所述空间关系确定模块包
括:
距离值确定单元, 用于在每个所述待分类文档图像 中, 确定每两个所述目标关键词的X
方向距离值和Y方向距离值;
最大距离值确定单元, 用于确定第一距离值与第二距离值, 所述第一距离值为各个所
述X方向距离值中数值最大 的X方向距离值, 所述第二距离值为各个所述Y方向距离值中数
值最大的Y方向距离值;
距离比例计算单元, 用于计算每两个所述目标关键词的X方向距离与所述第一距离值
的第一距离比例, 以及每两个所述 目标关键词的Y方向距离与所述第二距离值的第二距离
比例;
空间关系确定单元, 用于依据 所述第一距离比例与所述第 二距离比例确定每两个所述
目标关键词之间的空间关系。
9.一种存储介质, 其特征在于: 所述存储介质中存储有计算机可读指令, 所述计算机可
读指令被一个或多个处理器执行时, 使得一个或多个处理器执行如权利要求 1至5中任一项
所述文档图像分类方法的步骤。
10.一种计算机设备, 其特 征在于, 包括: 一个或多个处 理器, 以及存 储器;
所述存储器中存储有计算机可读指令, 所述计算机可读指令被所述一个或多个处理器
执行时, 执行如权利要求1至 5中任一项所述文档图像分类方法的步骤。权 利 要 求 书 2/2 页
3
CN 115496952 A
3
专利 文档图像分类方法、装置、存储介质及计算机设备
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:04:13上传分享