我想搜索…
热门搜索
一、专利名称及专利号
名称:《一种序列模式挖掘方法、装置及存储介质》
专利号:ZL 2021 1 1123686.X
二、应用领域
本发明涉及序列模式挖掘领域,尤其涉及的是一种序列模式挖掘方法、装置及存储介质。
三、专利说明
1、摘要:
本发明公开了一种序列模式挖掘方法、装置及存储介质,所述方法通过计算各候选序列模式的实际频率和期望频率,筛选出实际频率大于期望频率的高兴趣度序列模式。由于实际频率和期望频率可以分别反映各候选序列模式的实际发生人次数和基于出行成本考量得到的理论发生人次数,当实际频率大于期望频率时,表示该候选序列模式在出行成本较高的情况下,仍然有远高于理论值的发生人次数,则将其作为高兴趣度序列模式。本发明通过实际频率和期望频率综合挖掘出高兴趣度序列模式,可以真实地反映人群的出行偏好信息。解决了目前挖掘出的高兴趣度序列模式通常为访问距离较近、出行成本较低的高频序列模式,难以反映人群对目的地的真实偏好的问题。
2、背景:
人群移动时产生的轨迹数据是一类重要的城市大数据。由于轨迹数据通常具有空间维度和 时间维度,因此可以用于反映人群行为在时间和空间上的活动规律,从而支持人们对感兴趣的 区域进行分析。序列模式挖掘是最常见的轨迹数据分析任务之一,旨在从轨迹数据中发现有价 值的序列模式,如“办公区a→购物中心b→住宅区c”。序列模式挖掘的结果被广泛应用于交 通规划、城市设施分配、基于地点的广告推送和旅游景点推荐等领域中。
然而,现有的序列模式挖掘方法挖掘出的高兴趣度序列模式通常为频率较高但访问距离较 近、出行成本较低的序列模式,在排除出行成本因素之后,人群未必对挖掘出的序列模式中的 地点有所偏好。例如,如果序列模式挖掘任务的目的是分析居民的购物偏好,按照现有的序列 模式挖掘方法,所得的高兴趣度序列模式往往存在于住宅区及其周边的商铺之间。某些较远商 铺提供的商品可能更符合居民的偏好,但由于出行成本较高,客流较小,这些商铺与住宅区之 间的序列模式的频率较低,可能无法被挖掘出来。因此,现有的挖掘出的高兴趣度序列模式难 以反映人群对目的地的真实偏好。
因此,现有技术还有待改进和发展。
四、相关文件下载
专利证书:1755758910404522.pdf
专利详情:1755758928387387.pdf
快速导航
联系我们
合作电话:0755-22673562
联系地址:深圳市南山区高新技术产业园南区粤兴一道18号香港理工大学产学研大楼
关注我们