β

【NO.12】出租车GPS数据挖掘

朴石 278 阅读

一、研究主题

(1)项目名称:出租车GPS数据挖掘

(2)研究主题:基于GPS点位数据的时空大数据挖掘

二、团队成员名单

指导教师:晁怡

团队成员:

(1)王长硕,项目负责人,现保研至南京大学。曾获两次国家励志奖学金、蓝桥杯编程大赛省三等奖、Esri杯中国大学生GIS软件二次开发Web与移动开发组优胜奖、国际地理信息科学与技术大会优秀志愿者、高数竞赛三等奖、大物竞赛三等奖、校级优秀学生标兵、校级优秀共青团干部及校级优秀共青团员等荣誉及称号。

(2)谢文俊,准备出国。曾获国家励志奖学金、地大英才奖学金、全国大学生英语竞赛C组全国一等奖、湖北省大学生优秀科研成果三等奖、Esri杯中国大学生GIS软件二次开发Web与移动开发组优胜奖、校级优秀学生标兵、校级优秀共青团干等荣誉及称号。

(3)张春阳,工作于北京数慧时空科技有限公司,方向为数据分析。曾连续三年获得百好班长称号。

三、研究方向 主题简介

了解与时空数据挖掘、空间分析相关的前沿理念与建模方法,对海量武汉市出租车GPS点位数据进行处理与分析,探究武汉市出租车载客与运维状况、武汉市出租车时空分布情况,武汉市居民出行时空分布规律、并利用GPS点位数据进行轨迹挖掘研究,提取出租车运行轨迹,分析出租车轨迹分布形态,并更新武汉市路网状态,判断交通拥挤时空变化情况,为合理分配交通资源提供决策依据,以此缓解城市拥堵现象。

四、研究成果展示与总结

(1)对海量GPS点位数据进行数据清洗与数据预处理

将文本文件格式的GPS点位数据导入数据库中,对2015年5月14日武汉市出租车GPS点位数据进行数据清洗与数据预处理,剔除经纬度越界、载客状况异常、行车方向异常的行车记录。经数据清洗与预处理,共剔除14%异常数据,剩余可用GPS点位数据共计9390773行,来源于6393辆出租车。

(2)路网匹配

对预处理后的数据,编写相关算法,根据点位数据的经纬度与方向信息,结合武汉市路网经纬度编码,设置阈值以消除点位数据的GPS漂移现象,并将其匹配至现有的武汉市路网。

(3)武汉市出租车载客状况与时空分布情况探究

对预处理后的海量GPS点位数据进行分析,计算出租车载客率分布情况,建立出租车载客率时间变化折线图,建立出租车空载数时间变化折线图。利用核密度分析等手段,分析2015年5月14日一天内武汉市出租车载客状况时空分布情况,探索聚集热点。

研究发现,一天内,载客率波动较大,最大载客率不超过60%,凌晨载客率最低。空载出租车在凌晨4~5时数量最多,超过100辆车,上下班时刻空载出租车数量明显减少。出租车多分布在武昌、汉口火车站周边,以及办公、住宅区。上下班时刻出租车明显聚集在办公区及住宅区,上午9~12时,游乐场、购物及旅游景点处居民聚集明显;夜晚及凌晨出租车聚集分布在火车站周边。

(4)武汉市居民时空分布规律探究

根据预处理后的GPS点位数据,通过出租车随时间变化的重车属性,提取出租车乘客分布的OD点,以此模拟武汉市居民出行分布情况。利用空间聚类、密度分析及可视化技术,探究武汉市居民出行分布热点与时间变化情况。

研究发现,武汉市居民分布随时间推移在空间上有着显著的变化,但在固定时间段存在居民聚集热点,如武昌火车站等为出行起始热点区域,江汉路,同济医院,江滩,香港路,汉口火车站等为下车终止点热点区域。

五、研究成果照片

(1)2015年5月14日,武汉市出租车载客率波动情况

(2)2015年5月14日,武汉市出租车运维时间变化情况

(3)2015年5月14日,武汉市出租车时空分布情况(依次为:7、9、12、21时)

(4)2015年5月14日,武汉市居民出行时空分布

作者:朴石
地大信息工程学院门户 Because of Youth
原文地址:【NO.12】出租车GPS数据挖掘, 感谢原作者分享。

发表评论