1.一种出租车数据集的轨迹预处理方法,其特征在于,包括如下步骤: 步骤一:对轨迹数据进行获取,采样轨迹点包括经度、纬度和时间戳信息; 步骤二:对轨迹数据进行解析并抽象存储在实体对象中,然后对轨迹进行编号,加入轨迹点ID; 步骤三:对解析后的轨迹数据进行预处理,先进行补缺阶段分析,查找轨迹缺失值,利用线性插值法或...
出租车轨迹数据是典型的大数据,传统的数据处理技术无法解决大规模出租车轨迹数据误差分析和处理问题,文章在分析轨迹数据误差来源和误差类型的基础上,提出基于Hadoop的海量出租车轨迹数据预处理模型,使用Hive实现轨迹数据误差统计分析,设计MapReduce并行处理程序实现轨迹数据预处理。实验结果表明,该模型可以有效解决大规模出租车...