(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210977978.8
(22)申请日 2022.08.16
(71)申请人 无锡江南计算 技术研究所
地址 214100 江苏省无锡市滨湖区山水东
路188号
(72)发明人 吴铁彬 唐勇 陈芳园 刘骁
陈正博 郝子宇
(74)专利代理 机构 浙江千克知识产权代理有限
公司 33246
专利代理师 邵捷
(51)Int.Cl.
G06F 9/50(2006.01)
G06F 16/23(2019.01)
G06F 3/06(2006.01)
(54)发明名称
一种支持cac he更新的一 致性加速处 理方法
(57)摘要
本发明涉及计算机数据计算领域, 具体处理
器多核处理的加速方法。 本发明是通过以下技术
方案得以实现的: 一种支持cache更新的一致性
加速处理方法,包含如下步骤: S01、 生产核心数
据生产步骤; 生产核心生产出批量数据; S02、 完
成通知即时发送步骤; 所述生产核心给一致性串
行点发送完成通知; S03、 串行点取数据步骤; 所
述一致性串行点从所述生产核心处获得刚处理
完的数据, 且将数据转存到主存中, 在转存结束
之前, 该生产核心不生产新的数据; S04、 消费核
心获得数据步骤。 本发明的目的是提供一种支持
cache更新的一致性加速处理方法, 在保证cach e
一致性的基础上, 解决一致性操作的延迟开销,
避免生产核心的多任务竞争, 减少数据处理的延
迟, 提升效率。
权利要求书1页 说明书4页
CN 115269200 A
2022.11.01
CN 115269200 A
1.一种支持cache更新的一致性加速处理方法, 其特征在于, 包含如 下步骤: S01、 生产
核心数据生产步骤; 生产核心生产出批量数据; S02、 完成通知即时发送步骤; 所述生产
核心给一致性串行点发送完成通知; S03、 串行点取数据步骤; 所述一致性串行点从所述
生产核心处获得刚处理完的数据, 且将数据转存到主存中, 在转存结束之前, 该生产核心 不
生产新的数据; S04、 消费核心获得数据步骤; 当所述消费核心需要获得数据时, 发送数据
请求给所述一致性串 行点, 所述一致性串 行点从所述主存中获得对应的数据给所述消费核
心。
2.根据权利 要求1所述的一种支持cache更新的一致性加速处理方法, 其特征在于: 在
所述S01之前, 还包含硬件数量设置步骤, 在本步骤中, 设置所述生产核心和所述消费核心
均为多个, 但所述一致性串行点仅为一个, 多个所述生产核心和多个所述消费核心共享一
个所述一致性串行点。
3.根据权利 要求1所述的一种支持cache更新的一致性加速处理方法, 其特征在于: 在
所述S02中, 所述 生产核心发送给 所述一致性串行点的完成通知的形式为总的描述符。
4.根据权利 要求3所述的一种支持cache更新的一致性加速处理方法, 其特征在于: 在
所述S03中, 包含拆包步骤; 所述一致性串 行点将一个总的描述符中涉及到的数据拆包成多
个数据传输任务, 每 个数据传输任务以一个数据单位 为操作密度。
5.根据权利 要求4所述的一种支持cache更新的一致性加速处理方法, 其特征在于: 所
述一个数据单位 为一个cache行。
6.根据权利 要求1所述的一种支持cache更新的一致性加速处理方法, 其特征在于: 在
所述S03中, 所述一致性串行点在对所述生产核心的数据操作包含置共享操作和置无效操
作, 所述置共享操作是数据不仅进入了对应的内存中, 数据同时也保留在生产核心处, 用于
生产核心的下一批数据计算; 所述置无效操作是数据仅仅进入对应的内存中, 生产核心处
不保留该 数据。
7.根据权利 要求1所述的一种支持cache更新的一致性加速处理方法, 其特征在于: 所
述一致性串行点的数据操作依靠软件编程实现, 编程语言为汇编语言。权 利 要 求 书 1/1 页
2
CN 115269200 A
2一种支持cache更新的一致性加速 处理方法
技术领域
[0001]本发明涉及计算机数据计算领域, 具体处 理器多核处理的加速方法。
背景技术
[0002]随着处理器制造工艺的不断进步及实际应用需要, 多核结构已成为当前高性能微
处理器的发展趋势。 相比单核处理器而言, 多核处理器支持多线程, 在一个时钟周期内能处
理更多的任务, 也支持多任务处理, 其计算能力和运行效率 都有着明显的优势。 如公开号为
CN201380009921.8公开了一种用于多核处理器中的核心间通信的方法和装置, 再如公开号
为CN201110452294.8公开了一种多核处理器的核间通信方法, 在这两个专利文件所记载的
技术方案中, 都涉及到了多核处理器的数据计算方式, 其包含生产核心和消费核心。 在某 一
个程序任务中, 生产核心负责产生相应的数据, 而消费核心需要使用到生产核心所产生的
数据。
[0003]而, 多核处理器系统中出现的cache一致性问题是当今计算机体系结构中研究的
热点问题。 即, 消费核心在数据处理过程中所拿到的数据需要保证是最新的数据版本, 这才
能保证各个消费核心在运算过程中的一致性。 如CN201210544976.6 一种具有多cache一致
性域的多处理器节 点系统构建方法, 通过二级节点控制器来组成一个单一cache一致性域,
(或称为一致性串 行点) , 该一致性串 行点在实际应用中为处理器芯片中的一个单独的硬件
形式, 负责消费核心和生产核心之 间的数据交互, 且保证交互过程中的数据一致性。 具体方
式为, 消费核心取数据时向一致性串行点发送取数据的请求, 一致性串行点在查找到最新
版本的数据所在的地址后, 向生产核心发送数据请求, 取 得数据。
[0004]然而这个技术方案存在一定 的缺陷, 当消费核心发送数据请求后, 一致性串行点
再向对应的生产核心去 取数据。 而此时, 很有可能该生产核心 正在生产其他数据, 则对于该
生产核心而言, 为一致性串行点提供数据任务和生产下一数据任务, 这两个任务之间就存
在着任务竞争, 影响了该生产核心的数据生产效率, 而这些任务竞争进而产生了额外的时
间开销和延迟。
发明内容
[0005]本发明的目的是提供一种支持cache更新的一致性加速处理方法, 在保证cache一
致性的基础上, 解决一致性操作的延迟开销, 避免生产核心的多任务竞争, 减少数据处理的
延迟, 提升效率。
[0006]本发明是按照如下技术方案来实现的: 一种支持cache更新的一致性加速处理方
法, 其特征在于, 包 含如下步骤:
S01、 生产核心数据生产步骤;
生产核心生产出批量数据;
S02、 完成通知即时发送步骤;
所述生产核心给一 致性串行点发送完成通知;说 明 书 1/4 页
3
CN 115269200 A
3
专利 一种支持cache更新的一致性加速处理方法
文档预览
中文文档
6 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思考人生 于 2024-02-07 20:38:16上传分享