专利 用于展馆观众的2.5D全局定位方法、系统、设备及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211211698.2 (22)申请日 2022.09.30 (71)申请人上海交通大学地址 200240 上海市闵行区东川路80 0号 (72)发明人谢憬　 (74)专利代理机构上海汉声知识产权代理有限公司 3123 6 专利代理师胡晶 (51)Int.Cl. G06T 7/70(2017.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 20/40(2022.01) (54)发明名称用于展馆观众的2.5D全局定位方法、系统、设备及介质 (57)摘要本发明提供的一种用于展馆观众的2.5D全局定位方法、系统、设备及介质，涉及元宇宙以及人工智能技术领域，包括：步骤S1：将全局坐标系的零Z轴平面置于定位域中，对整个场景划分全局网格点，并将所述全局网格点投影到每个相机中获得视频图像的图像网格点；步骤S2：根据所述图像网格点获取最近邻点；步骤S3：取多个相机获取所述邻点的均值，作为目标的全局位置。本发明能够调节定位的精度，并避免三维重建带来的算法复杂度。权利要求书1页说明书4页附图3页 CN 115546288 A 2022.12.30 CN 115546288 A 1.一种用于展馆观众的2.5D全局定位方法，其特征在于，包括：步骤S1：将全局坐标系的零Z轴平面置于定位域中，对整个场景划分全局网格点，并将所述全局网格点投影到每个相机中获得视频图像的图像网格点；步骤S2：根据所述图像网格点获取最近邻点；步骤S3：取多个相机获取所述邻点的均值，作为目标的全局位置。 2.根据权利要求1所述的用于展馆观众的2.5D全局定位方法，其特征在于，所述步骤S2 包括：在每一组相机中，用二维的行人检测分类算法测出观众在每个相机中的边界框位置，获取视频图像中边界框的下边界左右两点坐标值(bx3,by3)， (bx4,by4)，并在所述图像网格点中找到最近邻点(Ixbm,Iybm)，相当于下边界的中点，下标m为相机标号。 3.根据权利要求2所述的用于展馆观众的2.5D全局定位方法，其特征在于，所述步骤S3 包括：对于每一帧视频图像中每个目标，取m个相机获取邻点(Ixbm,Iybm)的均值作为目标的全局位置，遮挡时， m小于组内相机的个数；对于多个目标，则需通过最动态近邻法先进行目标关联，关联后再取均值。 4.根据权利要求1所述的用于展馆观众的2.5D全局定位方法，其特征在于，所述方法还包括：若连续的视频图像中检测缺失，则通过最近邻匹配方法进行帧间数据关联。 5.一种用于展馆观众的2.5D全局定位系统，其特征在于，包括：模块M1：将全局坐标系的零Z轴平面置于定位域中，对整个场景划分全局网格点，并将所述全局网格点投影到每个相机中获得视频图像的图像网格点；模块M2：根据所述图像网格点获取最近邻点；模块M3：取多个相机获取所述邻点的均值，作为目标的全局位置。 6.根据权利要求5所述的用于展馆观众的2.5D全局定位系统，其特征在于，所述模块M2 包括：在每一组相机中，用二维的行人检测分类算法测出观众在每个相机中的边界框位置，获取视频图像中边界框的下边界左右两点坐标值(bx3,by3)， (bx4,by4)，并在所述图像网格点中找到最近邻点(Ixbm,Iybm)，相当于下边界的中点，下标m为相机标号。 7.根据权利要求6所述的用于展馆观众的2.5D全局定位系统，其特征在于，所述模块M3 包括：对于每一帧视频图像中每个目标，取m个相机获取邻点(Ixbm,Iybm)的均值作为目标的全局位置，遮挡时， m小于组内相机的个数；对于多个目标，则需通过最近邻法先进行目标关联，关联后再取均值。 8.根据权利要求5所述的用于展馆观众的2.5D全局定位系统，其特征在于，所述系统还包括：若连续的视频图像中检测缺失，则通过最近邻方法进行帧间数据关联。 9.一种设备，其特征在于，所述设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1至4中任一项所述的方法的步骤。 10.一种存储有计算机程序的计算机可读存储介质，其特征在于，所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。权　利　要　求　书 1/1 页 2 CN 115546288 A 2用于展馆观众的2.5D全局定位方法、系统、设备及介质技术领域 [0001]本发明涉及元宇宙以及人工智能技术领域，具体地，涉及一种用于展馆观众的 2.5D全局定位方法、系统、设备及介质。背景技术 [0002]目前文博展馆元宇宙为了实现展览数字化网络化智能化，文玩物品及展柜很容易通过数字化扫描技术得到精准重现，而场景中观众位置情况复杂多变，难以精确化描述。观众的准确定位能够在人群聚集时给予自动预警，进入禁区时能够及时通知安保部门。在文博展馆中传统的监控系统只能检测人在图像中的位置，无法定位在场景中的全局位置。 [0003]现有技术Kutulakos,K.N.,Seitz,S.M.A Theory of Shape by Space Carving.International Journal of Computer Vision38,199 –218(2000).中可知，空间切割体素(space carving)方法在良好背景分割的假设下，通过体素重建整个场景包括人体来描述人的位置，该方法计算量大，需要背景单一的场景，很难应用到实际的展馆场景中。 3D Yolo等类似的方法，缺乏摄像机参数信息，很难解析的融合多相机的信息。发明内容 [0004]针对现有技术中的缺陷，本发明提供一种用于展馆观众的2.5D全局定位方法、系统、设备及介质。 [0005]根据本发明提供的一种用于展馆观众的2.5D全局定位方法、系统、设备及介质，所述方案如下： [0006]第一方面，提供了一种用于展馆观众的2.5D全局定位方法，所述方法包括： [0007]步骤S1：将全局坐标系的零Z轴平面置于定位域中，对整个场景划分全局网格点，并将所述全局网格点投影到每个相机中获得视频图像的图像网格点； [0008]步骤S2：根据所述图像网格点获取最近邻点； [0009]步骤S3：取多个相机获取所述邻点的均值，作为目标的全局位置。 [0010]优选地，所述步骤S2包括：在每一组相机中，用二维的行人检测分类算法测出观众在每个相机中的边界框位置，获取视频图像中边界框的下边界左右两点坐标值(bx3,by3)， (bx4,by4)，并在所述图像网格点中找到最近邻点(Ixbm,Iybm)，相当于下边界的中点，下标m为相机标号。 [0011]优选地，所述步骤S3包括：对于每一帧视频图像中每个目标，取m个相机获取邻点 (Ixbm,Iybm)的均值作为目标的全局位置，遮挡时， m小于组内相机的个数；对于多个目标，则需通过最动态近邻法先进行目标关联，关联后再取均值。 [0012]优选地，所述方法还包括：若连续的视频图像中检测缺失，则通过最近邻匹配方法进行帧间数据关联。 [0013]第二方面，提供了一种用于展馆观众的2.5D全局定位系统，所述系统包括： [0014]模块M1：将全局坐标系的零Z轴平面置于定位域中，对整个场景划分全局网格点，说　明　书 1/4 页 3 CN 115546288 A 3

专利 用于展馆观众的2.5D全局定位方法、系统、设备及介质

专利用于展馆观众的2.5D全局定位方法、系统、设备及介质