iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211388208.6 (22)申请日 2022.11.08 (71)申请人 广州信安数据有限公司 地址 511457 广东省广州市南沙区南沙街 进港大道8号23 01房A74 (72)发明人 高伟 李劲松 王攀峰 周宇  何庆华 丘志新  (74)专利代理 机构 广州永华专利代理有限公司 44478 专利代理师 梁国锐 (51)Int.Cl. G06F 40/194(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 一种信息化项目相似度分析方法、 存储介质 及系统 (57)摘要 本发明提供一种信息化项目相似度分析方 法、 存储介质及系统, 该方法根据重要性权重、 语 义相似度计算得到第一信息化项目相对于第二 信息化项目的第一项目相似度均值, 以及第二信 息化项目相对于第一信息化项目的第二项目相 似度均值, 然后进行均值计算得到第一信息化项 目与第二信息化项目之间的相似度。 在此过程中 进行了项目功能的重要性权重和语义相似度的 结合, 并进行了第一信息化项目相对于第二信息 化项目的正向相似度均值计算, 以及第二信息化 项目相对于第一信息化项目的反向相似度均值 计算, 且计算过程不涉及项目文档的文本相似度 计算, 不受项目文档的文本不完整、 缺失、 频繁变 更等情况影响, 准确性高。 权利要求书2页 说明书9页 附图1页 CN 115438644 A 2022.12.06 CN 115438644 A 1.一种信息化项目相似度分析 方法, 其特 征是, 包括如下步骤: A.选取第一信息化项目和第二信息化项目; B.获取所述第一信息化项目的所有第一项目功能和所述第二信息化项目的所有第二 项目功能; C.对每个第一项目功能执行如下步骤C1~C3, 得到所有第一项目功能各自在所述第二 信息化项目中的相似度值: C1.计算第一项目功能在所述第一信息化项目中的重要性权 重; C2.基于语义从所述第 二信息化项目中找出与该第 一项目功能语义相似度最高的第二 项目功能, 并计算出语义相似度; C3.根据该第 一项目功能的重要性权重与语义相似度最高的第二项目功能的语义相似 度, 计算出 该第一项目功能在所述第二信息化项目中的相似度值; D.对所有第 一项目功能各自在所述第二信 息化项目中的相似度值进行均值计算, 得到 所述第一信息化项目相对于所述第二信息化项目的第一项目相似度均值; E.对每个第二项目功能执行如下步骤E1~E3, 得到所有第二项目功能各自在所述第一 信息化项目中的相似度值: E1.计算第二项目功能在所述第二信息化项目中的重要性权 重; E2.基于语义从所述第 一信息化项目中找出与该第 二项目功能语义相似度最高的第一 项目功能, 并计算出语义相似度; E3.根据该第 二项目功能的重要性权重与语义相似度最高的第一项目功能的语义相似 度, 计算出 该第二项目功能在所述第一信息化项目中的相似度值; F.对所有第 二项目功能各自在所述第一信 息化项目中的相似度值进行均值计算, 得到 所述第二信息化项目相对于所述第一信息化项目的第二项目相似度均值; G.对所述第 一项目相似度均值与所述第二项目相似度均值进行均值计算, 得到所述第 一信息化项目与所述第二信息化项目之间的相似度。 2.根据权利要求1所述的信息化项目相似度分析方法, 其特征是, 所述步骤C1中, 将所 有第一项目功能进行聚类分析, 得到与待计算重要性权重的第一项目功能同质类的功能数 量, 其中, 与待计算重要性权重的第一项目功能同质类的功能数量越 大, 该待计算重要性权 重的第一项目功能的重要性权 重越低。 3.根据权利要求2所述的信息化项目相似度分析方法, 其特征是, 所述步骤C1中, 重要 性权重的计算公式为: 其中, 为第一项目功能的重要性权重, 为所有第一项目功能总数, 为与待计算重 要性权重的第一项目功能同质类的功能数量。 4.根据权利要求1至3任一项所述的信息化项目相似度分析方法, 其特征是, 所述步骤 E1中, 将所有第二项目功能进行聚类分析, 得到与待计算重要性权重的第二项目功能同质 类的功能数量, 其中, 与待计算重要性权重的第二项目功能同质类的功能数量越 大, 该待计 算重要性权 重的第二项目功能的重要性权 重越低。权 利 要 求 书 1/2 页 2 CN 115438644 A 25.根据权利要求4所述的信息化项目相似度分析方法, 其特征是, 所述步骤E1中, 重要 性权重的计算公式为: 其中, 为第二项目功能的重要性权重, 为所有第二项目功能总数, 为与待计算重 要性权重的第二项目功能同质类的功能数量。 6.根据权利要求1所述的信息化项目相似度分析方法, 其特征是, 所述步骤C3中, 将该 第一项目功能的重要性权重与语义相似度最高的第二项目功能的语义相似度相乘, 得到该 第一项目功能在所述第二信息化项目中的相似度值。 7.根据权利要求1或6所述的信息化项目相似度分析方法, 其特征是, 所述步骤E3 中, 将 该第二项目功能的重要性权重与语义相似度最高的第一项目功能的语义相似度相乘, 得到 该第二项目功能在所述第一信息化项目中的相似度值。 8.根据权利要求1所述的信 息化项目相似度分析方法, 其特征是: 所述步骤B中, 获取第 一项目功能具体是获取第一项目功能对应的第一描述文本, 获取第二项目功能具体是获取 第二项目功能对应的第二描述文本; 所述步骤C2和步骤E2中, 根据第一描述文本的语义和 第二描述文本的语义, 计算第一项目功能和第二项目功能的语义相似度。 9.计算机可读存储介质, 其上存储有计算机程序, 其特征是, 所述计算机程序被处理器 执行时实现如权利要求1至8任一项所述的信息化项目相似度分析 方法中的步骤。 10.一种信息化项目相似度分析系统, 其特征是, 包括相互连接的处理器和如权利要求 9所述的计算机可读存 储介质。权 利 要 求 书 2/2 页 3 CN 115438644 A 3

PDF文档 专利 一种信息化项目相似度分析方法、存储介质及系统

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种信息化项目相似度分析方法、存储介质及系统 第 1 页 专利 一种信息化项目相似度分析方法、存储介质及系统 第 2 页 专利 一种信息化项目相似度分析方法、存储介质及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。