(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211211698.2
(22)申请日 2022.09.30
(71)申请人 上海交通大 学
地址 200240 上海市闵行区东川路80 0号
(72)发明人 谢憬
(74)专利代理 机构 上海汉声知识产权代理有限
公司 3123 6
专利代理师 胡晶
(51)Int.Cl.
G06T 7/70(2017.01)
G06V 10/764(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06V 20/40(2022.01)
(54)发明名称
用于展馆观众的2.5D全局定位方法、 系统、
设备及介质
(57)摘要
本发明提供的一种用于展馆观众的2.5D全
局定位方法、 系统、 设备及介质, 涉及元宇宙以及
人工智能技术领域, 包括: 步骤S1: 将 全局坐标系
的零Z轴平面置于定位域中, 对整个场景划分全
局网格点, 并将所述全局网格点投影到每个相机
中获得视频图像的图像网格点; 步骤S2: 根据所
述图像网格点获取最近邻点; 步骤S3: 取多个相
机获取所述邻点的均值, 作为目标的全局位置。
本发明能够调节定位的精度, 并避免三维重建带
来的算法复杂度。
权利要求书1页 说明书4页 附图3页
CN 115546288 A
2022.12.30
CN 115546288 A
1.一种用于展馆观众的2.5D全局定位方法, 其特 征在于, 包括:
步骤S1: 将全局坐标系的零Z轴平面置于定位域中, 对整个场景划分全局网格点, 并将
所述全局网格点投影到每 个相机中获得视频图像的图像网格点;
步骤S2: 根据所述图像网格点获取最近邻点;
步骤S3: 取多个相机获取 所述邻点的均值, 作为目标的全局位置 。
2.根据权利 要求1所述的用于展馆观众的2.5D全局定位方法, 其特征在于, 所述步骤S2
包括: 在每一组相机中, 用二 维的行人检测分类算法测出观众在每个相机中的边界框位置,
获取视频图像中边界框的下边界左右两点坐标值(bx3,by3), (bx4,by4), 并在所述图像网格
点中找到最近邻点(Ixbm,Iybm), 相当于下边界的中点, 下 标m为相机标号。
3.根据权利 要求2所述的用于展馆观众的2.5D全局定位方法, 其特征在于, 所述步骤S3
包括: 对于每一帧视频图像 中每个目标, 取m个相机获取邻点(Ixbm,Iybm)的均值作为目标的
全局位置, 遮挡时, m小于组内相机的个数; 对于多个目标, 则需通过最动态近邻法先进 行目
标关联, 关联后再 取均值。
4.根据权利要求1所述的用于展馆观众的2.5D全局定位方法, 其特征在于, 所述方法还
包括: 若连续的视频图像中检测缺失, 则通过最近邻匹配方法进行帧间数据关联。
5.一种用于展馆观众的2.5D全局定位系统, 其特 征在于, 包括:
模块M1: 将全局坐标系的零Z轴平面置于定位域中, 对整个场景划分全局网格点, 并将
所述全局网格点投影到每 个相机中获得视频图像的图像网格点;
模块M2: 根据所述图像网格点获取最近邻点;
模块M3: 取多个相机获取 所述邻点的均值, 作为目标的全局位置 。
6.根据权利 要求5所述的用于展馆观众的2.5D全局定位系统, 其特征在于, 所述模块M2
包括: 在每一组相机中, 用二 维的行人检测分类算法测出观众在每个相机中的边界框位置,
获取视频图像中边界框的下边界左右两点坐标值(bx3,by3), (bx4,by4), 并在所述图像网格
点中找到最近邻点(Ixbm,Iybm), 相当于下边界的中点, 下 标m为相机标号。
7.根据权利 要求6所述的用于展馆观众的2.5D全局定位系统, 其特征在于, 所述模块M3
包括: 对于每一帧视频图像 中每个目标, 取m个相机获取邻点(Ixbm,Iybm)的均值作为目标的
全局位置, 遮挡时, m小于组内相机的个数; 对于多个目标, 则需通过最近邻法先进 行目标关
联, 关联后再 取均值。
8.根据权利要求5所述的用于展馆观众的2.5D全局定位系统, 其特征在于, 所述系统还
包括: 若连续的视频图像中检测缺失, 则通过最近邻方法进行帧间数据关联。
9.一种设备, 其特 征在于, 所述设备包括:
一个或多个处 理器;
存储装置, 用于存 储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实
现如权利要求1至4中任一项所述的方法的步骤。
10.一种存储有计算机程序的计算机可读存储介质, 其特征在于, 所述计算机程序被处
理器执行时实现权利要求1至4中任一项所述的方法的步骤。权 利 要 求 书 1/1 页
2
CN 115546288 A
2用于展馆观众的2.5D全局定位方 法、 系统、 设 备及介质
技术领域
[0001]本发明涉及元宇宙以及人工智能技术领域, 具体地, 涉及一种用于展馆观众的
2.5D全局定位方法、 系统、 设备及 介质。
背景技术
[0002]目前文博展馆元宇宙为了实现展览数字化网络化智能化, 文玩物品及展柜很容易
通过数字化扫描技术得到精准重 现, 而场景中观众位置情况复杂多变, 难以精确化描述。 观
众的准确定位能够在人群聚集时给予自动预警, 进入禁区时能够及时通知安保部门。 在文
博展馆中传统的监控系统只能检测人在图像中的位置, 无法定位在场景中的全局位置 。
[0003]现有技术Kutulakos,K.N.,Seitz,S.M.A Theory of Shape by Space
Carving.International Journal of Computer Vision38,199 –218(2000).中可知, 空间
切割体素(space carving)方法在良好背景分割的假设下, 通过体素重建整个场景包括人
体来描述人的位置, 该方法计算量大, 需要背景单一的场景, 很难应用到实际的展馆场景
中。 3D Yolo等类似的方法, 缺乏摄 像机参数信息, 很难解析的融合多相机的信息 。
发明内容
[0004]针对现有技术中的缺陷, 本发明提供一种用于展馆观众的2.5D全局定位方法、 系
统、 设备及 介质。
[0005]根据本发明提供的一种用于展馆观众的2.5D全局定位方法、 系统、 设备及介质, 所
述方案如下:
[0006]第一方面, 提供了一种用于展馆观众的2.5D全局定位方法, 所述方法包括:
[0007]步骤S1: 将全局坐标系的零Z轴平面置于定位域中, 对整个场景划分全局网格点,
并将所述全局网格点投影到每 个相机中获得视频图像的图像网格点;
[0008]步骤S2: 根据所述图像网格点获取最近邻点;
[0009]步骤S3: 取多个相机获取 所述邻点的均值, 作为目标的全局位置 。
[0010]优选地, 所述步骤S2包括: 在 每一组相机中, 用二维的行人检测分类算法测出观众
在每个相机中的边界框位置, 获取视频图像中边界框的下边界左右两点坐标值(bx3,by3),
(bx4,by4), 并在所述图像网格 点中找到最近邻点(Ixbm,Iybm), 相当于下边界的中点, 下标m为
相机标号。
[0011]优选地, 所述步骤S3包括: 对于每一帧视频图像中每个目标, 取m个相机获取邻点
(Ixbm,Iybm)的均值作为目标的全局位置, 遮挡时, m小于组内相机的个数; 对于多个目标, 则
需通过最动态近邻法先进行目标关联, 关联后再 取均值。
[0012]优选地, 所述方法还包括: 若连续的视频图像中检测缺失, 则通过最近邻匹配方法
进行帧间数据关联。
[0013]第二方面, 提供了一种用于展馆观众的2.5D全局定位系统, 所述系统包括:
[0014]模块M1: 将全局坐标系的零Z轴平面置于定位域中, 对整个场景划分全局网格点,说 明 书 1/4 页
3
CN 115546288 A
3
专利 用于展馆观众的2.5D全局定位方法、系统、设备及介质
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:04:25上传分享