iso file download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211211698.2 (22)申请日 2022.09.30 (71)申请人 上海交通大 学 地址 200240 上海市闵行区东川路80 0号 (72)发明人 谢憬  (74)专利代理 机构 上海汉声知识产权代理有限 公司 3123 6 专利代理师 胡晶 (51)Int.Cl. G06T 7/70(2017.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 20/40(2022.01) (54)发明名称 用于展馆观众的2.5D全局定位方法、 系统、 设备及介质 (57)摘要 本发明提供的一种用于展馆观众的2.5D全 局定位方法、 系统、 设备及介质, 涉及元宇宙以及 人工智能技术领域, 包括: 步骤S1: 将 全局坐标系 的零Z轴平面置于定位域中, 对整个场景划分全 局网格点, 并将所述全局网格点投影到每个相机 中获得视频图像的图像网格点; 步骤S2: 根据所 述图像网格点获取最近邻点; 步骤S3: 取多个相 机获取所述邻点的均值, 作为目标的全局位置。 本发明能够调节定位的精度, 并避免三维重建带 来的算法复杂度。 权利要求书1页 说明书4页 附图3页 CN 115546288 A 2022.12.30 CN 115546288 A 1.一种用于展馆观众的2.5D全局定位方法, 其特 征在于, 包括: 步骤S1: 将全局坐标系的零Z轴平面置于定位域中, 对整个场景划分全局网格点, 并将 所述全局网格点投影到每 个相机中获得视频图像的图像网格点; 步骤S2: 根据所述图像网格点获取最近邻点; 步骤S3: 取多个相机获取 所述邻点的均值, 作为目标的全局位置 。 2.根据权利 要求1所述的用于展馆观众的2.5D全局定位方法, 其特征在于, 所述步骤S2 包括: 在每一组相机中, 用二 维的行人检测分类算法测出观众在每个相机中的边界框位置, 获取视频图像中边界框的下边界左右两点坐标值(bx3,by3), (bx4,by4), 并在所述图像网格 点中找到最近邻点(Ixbm,Iybm), 相当于下边界的中点, 下 标m为相机标号。 3.根据权利 要求2所述的用于展馆观众的2.5D全局定位方法, 其特征在于, 所述步骤S3 包括: 对于每一帧视频图像 中每个目标, 取m个相机获取邻点(Ixbm,Iybm)的均值作为目标的 全局位置, 遮挡时, m小于组内相机的个数; 对于多个目标, 则需通过最动态近邻法先进 行目 标关联, 关联后再 取均值。 4.根据权利要求1所述的用于展馆观众的2.5D全局定位方法, 其特征在于, 所述方法还 包括: 若连续的视频图像中检测缺失, 则通过最近邻匹配方法进行帧间数据关联。 5.一种用于展馆观众的2.5D全局定位系统, 其特 征在于, 包括: 模块M1: 将全局坐标系的零Z轴平面置于定位域中, 对整个场景划分全局网格点, 并将 所述全局网格点投影到每 个相机中获得视频图像的图像网格点; 模块M2: 根据所述图像网格点获取最近邻点; 模块M3: 取多个相机获取 所述邻点的均值, 作为目标的全局位置 。 6.根据权利 要求5所述的用于展馆观众的2.5D全局定位系统, 其特征在于, 所述模块M2 包括: 在每一组相机中, 用二 维的行人检测分类算法测出观众在每个相机中的边界框位置, 获取视频图像中边界框的下边界左右两点坐标值(bx3,by3), (bx4,by4), 并在所述图像网格 点中找到最近邻点(Ixbm,Iybm), 相当于下边界的中点, 下 标m为相机标号。 7.根据权利 要求6所述的用于展馆观众的2.5D全局定位系统, 其特征在于, 所述模块M3 包括: 对于每一帧视频图像 中每个目标, 取m个相机获取邻点(Ixbm,Iybm)的均值作为目标的 全局位置, 遮挡时, m小于组内相机的个数; 对于多个目标, 则需通过最近邻法先进 行目标关 联, 关联后再 取均值。 8.根据权利要求5所述的用于展馆观众的2.5D全局定位系统, 其特征在于, 所述系统还 包括: 若连续的视频图像中检测缺失, 则通过最近邻方法进行帧间数据关联。 9.一种设备, 其特 征在于, 所述设备包括: 一个或多个处 理器; 存储装置, 用于存 储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行, 使得所述一个或多个处理器实 现如权利要求1至4中任一项所述的方法的步骤。 10.一种存储有计算机程序的计算机可读存储介质, 其特征在于, 所述计算机程序被处 理器执行时实现权利要求1至4中任一项所述的方法的步骤。权 利 要 求 书 1/1 页 2 CN 115546288 A 2用于展馆观众的2.5D全局定位方 法、 系统、 设 备及介质 技术领域 [0001]本发明涉及元宇宙以及人工智能技术领域, 具体地, 涉及一种用于展馆观众的 2.5D全局定位方法、 系统、 设备及 介质。 背景技术 [0002]目前文博展馆元宇宙为了实现展览数字化网络化智能化, 文玩物品及展柜很容易 通过数字化扫描技术得到精准重 现, 而场景中观众位置情况复杂多变, 难以精确化描述。 观 众的准确定位能够在人群聚集时给予自动预警, 进入禁区时能够及时通知安保部门。 在文 博展馆中传统的监控系统只能检测人在图像中的位置, 无法定位在场景中的全局位置 。 [0003]现有技术Kutulakos,K.N.,Seitz,S.M.A  Theory of Shape by Space  Carving.International  Journal of Computer  Vision38,199 –218(2000).中可知, 空间 切割体素(space  carving)方法在良好背景分割的假设下, 通过体素重建整个场景包括人 体来描述人的位置, 该方法计算量大, 需要背景单一的场景, 很难应用到实际的展馆场景 中。 3D Yolo等类似的方法, 缺乏摄 像机参数信息, 很难解析的融合多相机的信息 。 发明内容 [0004]针对现有技术中的缺陷, 本发明提供一种用于展馆观众的2.5D全局定位方法、 系 统、 设备及 介质。 [0005]根据本发明提供的一种用于展馆观众的2.5D全局定位方法、 系统、 设备及介质, 所 述方案如下: [0006]第一方面, 提供了一种用于展馆观众的2.5D全局定位方法, 所述方法包括: [0007]步骤S1: 将全局坐标系的零Z轴平面置于定位域中, 对整个场景划分全局网格点, 并将所述全局网格点投影到每 个相机中获得视频图像的图像网格点; [0008]步骤S2: 根据所述图像网格点获取最近邻点; [0009]步骤S3: 取多个相机获取 所述邻点的均值, 作为目标的全局位置 。 [0010]优选地, 所述步骤S2包括: 在 每一组相机中, 用二维的行人检测分类算法测出观众 在每个相机中的边界框位置, 获取视频图像中边界框的下边界左右两点坐标值(bx3,by3), (bx4,by4), 并在所述图像网格 点中找到最近邻点(Ixbm,Iybm), 相当于下边界的中点, 下标m为 相机标号。 [0011]优选地, 所述步骤S3包括: 对于每一帧视频图像中每个目标, 取m个相机获取邻点 (Ixbm,Iybm)的均值作为目标的全局位置, 遮挡时, m小于组内相机的个数; 对于多个目标, 则 需通过最动态近邻法先进行目标关联, 关联后再 取均值。 [0012]优选地, 所述方法还包括: 若连续的视频图像中检测缺失, 则通过最近邻匹配方法 进行帧间数据关联。 [0013]第二方面, 提供了一种用于展馆观众的2.5D全局定位系统, 所述系统包括: [0014]模块M1: 将全局坐标系的零Z轴平面置于定位域中, 对整个场景划分全局网格点,说 明 书 1/4 页 3 CN 115546288 A 3

PDF文档 专利 用于展馆观众的2.5D全局定位方法、系统、设备及介质

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于展馆观众的2.5D全局定位方法、系统、设备及介质 第 1 页 专利 用于展馆观众的2.5D全局定位方法、系统、设备及介质 第 2 页 专利 用于展馆观众的2.5D全局定位方法、系统、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。