交通预见未来(12) 基于深度时空残差网络ResNet的城市交通流预测
1、文章信息
《Deep Spatio-Temporal Residual Networks for Citywide Crowd Flows Prediction》。
2017年AAAI大会的一篇会议论文,作者微软研究院的张钧波,会后文章发在爱斯维尔旗下期刊Artificial Intelligence(IF:3.034),目前被引257次。
2、摘要
我们提出了一种基于深度学习的方法,称为时空残差网络ST-ResNet,来同时预测城市中每个区域的流入和流出客流量。更具体地说,我们使用残差神经网络框架来对拥堵流的时间临近性、周期和趋势特性建模(closeness, period, trend,暂且这样翻译吧)。针对每个属性,我们设计了一个残差卷积单元的分支,每个残差卷积单元对拥堵流的空间特性进行建模,ST-ResNet动态整合三个残差神经网络分支的输出,为不同的分支和区域分配不同的权重。将整合结果进一步结合外部因素(external),如天气和一周中的哪一天,来预测每个地区最终流量。北京和纽约市(NYC)的实验表明,提出的ST-ResNet优于六种著名的方法。
3、简介
简介部分用了北京和纽约的两个拥堵踩踏案例引出,第一次见。然后强调介绍了本文同时预测inflow和outflow。同时预测流入流和流出流由于以下因素的影响极具挑战性:
空间依赖性spatial dependency:邻近区域的流入流和流出流相互影响。
时间依赖性temporal dependency:临近时刻的影响,前一天,上一周,季节性等周期特性。
外部因素的影响external factors:天气和突发事件等。
本文的四点主要内容:
1、ST-ResNet采用基于卷积的残差网络对城市中任意两个区域之间的远近空间依赖关系进行建模,同时保证模型的预测精度不受神经网络深度结构的影响。
2、我们将人群流动的时间特性归纳为三类,即时间邻近性、周期性和趋势性。ST-ResNet使用三个残差网络分支分别对这些特性进行建模。
3、ST-ResNet动态地聚合上述三个网络的输出,为不同的分支和区域分配不同的权重。这种聚集进一步与外部因素(如天气)相结合。
4、我们使用北京出租车的轨迹和气象数据,以及纽约自行车的轨迹数据来评估我们的方法。
4、模型介绍
在本研究中,我们根据经纬度将一个城市划分为I×J网格地图,其中网格表示一个区域,如图2(a)所示。设P为第t个时间区间的轨迹集合。网格(i,j)位于第i行和第j列。和既有研究类似,也是将流入流和流出流叠在一起看成一个2×I×J的张量(2个channel,每个channel为I行J列)
网络结构示意图
该网络结构主要由4部分组成,分别提取时间邻近性、周期性、趋势性以及外部因素的影响。
上图右上角,首先将一个城市在每个时间间隔内的流入流和流出流分别转化为一个2通道的类图矩阵,然后我们将时间轴划分为三个片段,表示最近的时间、稍远的时间和遥远的时间(其实文章中这块就是考虑了邻近时间段,前一天相同时间段,上一周相同时间段)。每一个片段分别被输入到三个ResNet分支中用来提取提取时间邻近性、周期性、趋势性。前三个部分与卷积神经网络共享相同的网络结构,然后是残差单元序列。这种结构捕捉了附近和远处区域之间的空间依赖关系。在外部因素的处理上,我们手动从外部数据集中提取一些特征,例如天气条件和事件,并将它们输入一个两层全连接的神经网络。前三部分的输出与外部因素的输出进行融合,然后利用tanh激活函数映射到(-1,1)区间内作为输出。
前三部分的网络结构:
外部因素:
交通流量可以受到许多复杂的外部因素的影响,如天气和事件。图5(a)显示节假日(中国春节)的人流与平时的人流有很大的不同。图5(b)显示,与后一周的同一天相比,暴雨使得办公区域的人流急剧减少。
设Et为表示这些外部因素在预测时间区间t的特征向量。在本文中,我们主要考虑天气、假日事件和元数据(即工作日、工作日/周末)。为了预测t时段的流量,可以直接获取假日事件和元数据。然而,未来时间间隔t的天气是未知的,可以使用时间间隔t的天气预报或时间间隔t – 1的近似天气预报。在形式上,我们将两个全连接层叠加在Et上,第一层可以看作是每个子因子的带激活函数的嵌入层。第二层用于将上一层的输出映射成与Xt相同形状便于融合。
融合:
对于前三部分的融合,由于不同区域都受时间邻近性、周期性、趋势性的影响,但影响程度可能不同。在此基础上,提出了一种基于参数矩阵的融合方法:
对于前三部分和外部因素的融合,直接相加再激活:
损失函数:MSE。
5、模型超参数
在ST-ResNet的输出中,使用tanh作为最后的激活函数,其范围在-1到1之间。使用Min-Max归一化方法将数据缩放到[- 1;1]。在评估中,我们将预测值重新缩放到正常值,并与ground truth进行比较。对于外部因素,我们使用one hot编码来转换元数据(即, Day Of Week, Weekend/Weekday),节假日和天气条件为二元向量,利用Min-Max归一化将温度和风速等缩放为[0;1]。
使用Python中的 Theano和Keras构建模型。Conv1和所有剩余单元使用64个尺寸为3×3的滤波器,Conv2使用2个尺寸为3×3的滤波器进行卷积。批次大小为32。90%的训练集,剩下的10%作为验证集。在固定数量的epoch(例如10,100个epoch)的完整训练数据上训练模型。考虑前一天和上一周的数据。评价指标RMSE。
6、实验部分
本文采用了两个案例,北京的出租车轨迹数据和纽约的共享单车轨迹数据,数据量和数据范围都很大,实验部分比较复杂,不再赘述。
7、思考
该篇论文也用到了前面共享过的纽约公开的共享单车轨迹数据集。
此外,该类复杂结构模型的一个鸡肋点是如何选择基准进行比较,输入因素这么多,其他基准模型输入是什么,模型配置是什么样的,这在既有文献中大多是直接给出结果,过程基本是一个黑箱子,目前也没有统一的解决办法。
关注微信公众号《当交通遇上机器学习》,
后台回复“数据”即可获取高达175G的四个月的滴滴GPS数据和滴滴订单数据的获取方式,以及从数据处理(Oracle数据库)、模型构建(机器学习)、编程实现(python)到可视化(ArcGIS)等一系列视频教程。
后台回复“纽约”获取美国纽约10年的出租车轨迹数据以及7年的共享单车轨迹数据下载地址。
公众号以交通大数据为主线,专注于人工智能、机器学习、深度学习在道路交通和轨道交通领域内的科研前沿与应用,在交通大数据与机器学习的道路上越走越远!
今天的文章深度残差网络结构_大数据下的城市规划分享到此就结束了,感谢您的阅读。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/83962.html