iso file download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211268922.1 (22)申请日 2022.10.17 (71)申请人 珠海普罗米修 斯视觉技术有限公司 地址 519000 广东省珠海市香洲区旅游路 168号(梅溪商业广场B座)云溪谷数字 产业园5层5 -196(集中办公区) (72)发明人 张煜 江宇骄 孙伟 邵志兢 (74)专利代理 机构 深圳紫藤知识产权代理有限 公司 44570 专利代理师 秦志权 (51)Int.Cl. G06V 20/40(2022.01) G06V 20/64(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01)G06T 7/80(2017.01) G06N 3/04(2006.01) G06N 3/08(2006.01) H04N 13/275(2018.01) H04N 13/282(2018.01) (54)发明名称 视频处理方法、 装置及计算机可读存 储介质 (57)摘要 本申请公开了一种视频处理方法、 装置及计 算机可读存储介质, 方法通过 获取目标对象多视 角同步视频, 并对多视角同步视频中每一视频帧 进行关节 点识别; 根据关节点识别结果确定每一 视频帧中的目标对象三维模型参数, 三维模型参 数包括姿态参数、 体型参数、 顶点位移数据以及 纹理数据; 基于多个视频帧以及对应的三维模型 参数构成的训练数据集训练以姿态参数为变量 的条件变分自编码器; 获取目标姿态参数, 并基 于条件变分自编码器和目标姿态参数生成驱动 视频。 该方法可以提升对视频中角色进行驱动的 效果。 权利要求书2页 说明书15页 附图2页 CN 115497029 A 2022.12.20 CN 115497029 A 1.一种视频处 理方法, 其特 征在于, 所述方法包括: 获取目标对象多视角同步视频, 并对所述多视角同步视频中每一视频帧进行关节点识 别; 根据关节点识别结果确定每一视频帧中的所述目标对象三维模型参数, 所述三维模型 参数包括姿态参数、 体型参数、 顶点 位移数据以及纹 理数据; 基于多个视频帧以及对应的三维模型参数构成的训练数据集训练以姿态参数为变量 的条件变分自编码器; 获取目标姿态参数, 并基于所述条件变分自编码器和所述目标姿态参数生成驱动视 频。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述多视角同步视频中每一视频帧 进行关节点识别, 包括: 对所述多视角同步视频的每一视角对应的视频进行切帧, 得到多帧视频帧; 对每一视频帧进行关节点检测, 得到每一视频帧的关节点识别结果。 3.根据权利要求2所述的方法, 其特征在于, 所述对每一视频帧进行关节点检测, 得到 每一视频帧的关节点识别结果, 包括: 对每一视频帧进行姿态检测, 得到每一视频帧的二维关节点数据; 对所述二维关节点数据进行三角化处 理, 得到每一视频帧的三维关节点数据; 根据所述 二维关节点数据与所述 三维关节点数据确定每一视频帧的关节点识别结果。 4.根据权利要求1所述的方法, 其特征在于, 所述根据关节点识别结果确定每一视频帧 中的所述目标对象三维模型参数, 包括: 根据每一视频帧的关节点识别结果拟合所述目标对象的三维模型, 得到所述三维模型 的体型参数和姿态参数; 将所述三维模型的顶点进行位移拟合, 得到所述 三维模型的顶点 位移数据; 根据每一视频帧确定所述三维模型的纹理数据, 并根据所述体型参数、 所述姿态参数、 所述顶点 位移数据和所述纹 理数据确定所述目标对象三维模型参数。 5.根据权利要求4所述的方法, 其特征在于, 所述将所述三维模型的顶点进行位移拟 合, 得到所述 三维模型的顶点 位移数据, 包括: 确定所述三维模型中每一顶点对应的目标关节点, 所述目标关节点为与顶点距离最近 的关节点; 计算每一顶点与对应的目标关节点之间的位移数据, 得到所述三维模型的顶点位移数 据。 6.根据权利要求1所述的方法, 其特征在于, 所述基于多个视频帧 以及对应的三维模型 参数构成的训练数据集训练以姿态参数为变量的条件变分自编码器, 包括: 将三维模型的姿态参数为输入, 得到条件变分自编码器输出的输出模型 数据; 基于所述输出模型数据与 所述三维模型参数中所述体型参数、 顶点位移数据以及纹理 数据的差异对所述条件变分自编码器的参数进行调整。 7.根据权利要求1所述的方法, 其特征在于, 所述获取目标姿态参数, 并基于所述条件 变分自编码器和所述目标姿态参数生成 驱动视频, 包括: 接收输入的目标姿态参数;权 利 要 求 书 1/2 页 2 CN 115497029 A 2将所述目标姿态参数输入至所述条件变分自编码器中, 得到 输出的目标模型 数据; 对所述目标模型 数据进行渲染, 得到多视角同步图像; 根据所述多视角同步图像生成 驱动视频。 8.一种视频处 理装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取目标对象多视角同步视频, 并对所述多视角同步视频中每一视频 帧进行关节点识别; 确定单元, 用于根据关节点识别结果确定每一视频帧中的所述目标对象三维模型参 数, 所述三维模型参数包括姿态参数、 体型参数、 顶点 位移数据以及纹 理数据; 训练单元, 用于基于多个视频帧 以及对应的三维模型参数构 成的训练数据集训练以姿 态参数为变量的条件变分自编码器; 生成单元, 用于获取目标姿态参数, 并基于所述条件变分自编码器和所述目标姿态参 数生成驱动视频。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有多条指令, 所述指令适于处理器进 行加载, 以执行权利要求 1至7中任一项 所述的视频处理方法中的步 骤。 10.一种计算机设备, 其特征在于, 包括存储器、 处理器以及存储在所述存储器中并可 以在所述处理器上运行 的计算机程序, 所述处理器执行所述计算机程序时实现权利要求1 至7中任一项所述的视频处 理方法中的步骤。 11.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 所述计算机程序/指令 被处理器执行时实现权利要求1至7中任一项所述的视频处 理方法中的步骤。权 利 要 求 书 2/2 页 3 CN 115497029 A 3
专利 视频处理方法、装置及计算机可读存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助3元下载(无需注册)
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助3元下载
本文档由 SC 于
2024-02-18 22:24:34
上传分享
举报
下载
原文档
(565.1 KB)
分享
友情链接
GB-T 14227-2006 城市轨道交通车站站台声学要求和测量方法.pdf
信通院 - 2022年上半年电子行业运行数据报告.pdf
DB22-T 3555-2023 眩晕综合征针刺治疗规范 吉林省.pdf
CSA 量子时代的区块链.pdf
GB-T 31595-2015 公共安全 业务连续性管理体系 指南.pdf
数据分级分类实施参考案例集.PDF
GB-T 4356-2016 不锈钢盘条.pdf
GB-T 38318-2019 电力监控系统网络安全评估指南.pdf
ISO 13119 2022 Health informatics — Clinical knowledge resources — Metadata.pdf
GB-T 16665-2017 空气压缩机组及供气系统节能监测.pdf
NB-T 10607—2021 水力发电厂门禁系统设计导则.pdf
GB-T 43709-2024 资产管理信息化 数据质量管理要求.pdf
IPC-A-610 电子组件的可接受性.pdf
GB-T 40060-2021 液氢贮存和运输技术要求.pdf
GB-T 17872-2009 江海直达货船船型尺度系列.pdf
GB-T 16632-2019 水处理剂阻垢性能的测定 碳酸钙沉积法.pdf
GB-T 20257.2-2017 国家基本比例尺地图图式 第2部分:15 000 110 000地形图图式.pdf
GB-T 6820-2016 工业用乙醇.pdf
GB-T 34078.3-2021 基于云计算的电子政务公共平台总体规范 第3部分:服务管理.pdf
GB-T 34690.6-2017 印刷技术 胶印数字化过程控制 第6部分:数字硬打样.pdf
1
/
20
评价文档
赞助3元 点击下载(565.1 KB)
回到顶部
×
微信扫码支付
3
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。