一種城市計程車需求預測系統及方法
2023-05-24 21:52:07 3
1.本發明涉及時空需求預測,尤其涉及一種城市計程車需求預測系統及方法。
背景技術:
2.計程車需求預測作為智能交通系統中的一項重要任務,引起了廣泛的研究興趣,它具有複雜的空間和時間依賴性,要實現對計程車需求的準確預測,需要充分考慮交通需求的時間相關性和空間相關性。
3.時空網絡的需求預測問題是構建智慧城市高效交通運輸系統的關鍵。準確的計程車需求預測可以指導車輛調度,提高車輛利用率,緩解交通擁堵,改善乘客乘車體驗。時空網絡中的節點根據路網的拓撲結構具有空間相關性,計程車的請求數據在不同時間間隔內具有時間相關性,因此計程車使用需求具有複雜的空間和時間依賴性,要實現對交通需求的準確預測,需要充分考慮交通需求的時間相關性和空間相關性。傳統的神經網絡模型不能很好的反應複雜的拓撲結構相關性,並且不針對區域間的功能相似性進行建模,仍存在以下局限性:
4.(1)傳統的卷積神經網絡主要通過卷積核從整個數據集中提取局部特徵,卷積算子的定義取決於平移不變性和局部連結性,然而城市路網是以圖的形式出現的,路網節點不固定且無次序。
5.(2)傳統的圖神經網絡模型更多關注的是建立空間和時間相關性模型,沒有充分考慮到時間周期性以及區域間功能相似性對計程車使用需求的影響。
技術實現要素:
6.發明目的:本發明的目的是提供一種城市計程車需求預測系統及方法,從時間相關性和空間相關性角度出發,將譜域圖卷積神經網絡與門控循環單元相結合,考慮時間周期性與區域間的功能相似性對計程車使用需求的影響,實現對未來時間戳中某個區域的計程車需求預測;使用門控循環單元來捕捉時間相關性,解決了經典循環神經網絡在訓練中梯度爆炸或消失的問題,也對長短期記憶網絡內部網絡進行了簡化,提高了計程車使用需求預測的準確度。
7.技術方案:本發明城市計程車需求預測系統包括:
8.數據預處理模塊,用於對數據集進行清洗去除冗餘數據,其次對數據進行整合重構;
9.數據轉換模塊,用於將計程車歷史訂單數據轉換為具有相同時間間隔的需求數據;
10.計程車需求預測模塊,用於對目標區域未來一段時間內的計程車使用需求進行預測;
11.結果處理模塊,用於對預測結果進行數據可視化。
12.本發明城市計程車需求預測方法,根據特定區域的計程車歷史訂單數據,預測目
標區域未來一段時間的計程車需求。使用目標區域過去一段時間的需求數據作為計程車需求預測數據源,預測模型訓練之前先對數據進行清洗,對數據中無效欄位進行刪除,清除數據集中殘缺訂單以及異常訂單等無關數據,之後對數據進行特徵分析,得到計程車需求呈現出一定周期性變化的結論,將此特性融入預測模型中。本發明採用了圖卷積門控循環網絡需求預測模型,通過使用譜域圖卷積神經網絡對城市路網的拓撲結構進行分析,處理計程車使用需求的空間特徵並且考慮區域間的功能相似性特徵,再將它與時間信號進行特徵融合後引入門控循環單元來處理計程車需求的時間特徵,最後通過全連接層處理空間特徵與時間特徵,完成計程車使用需求的預測。
13.本發明城市計程車需求預測方法包括以下步驟:
14.(1)獲取目標區域的歷史計程車需求數據;人們出行受工作日、節假日的影響,出行需求的數量呈現出一定周期性變化。
15.(2)使用譜域圖卷積網絡對計程車使用需求的拓撲結構進行編碼,從而獲得拓撲空間相關性,同時參考該區域功能相似性的其他區域的使用需求來建模空間相關性,使用門控循環單元對時間相關性進行建模,將空間相關性與時間相關性相結合,完成對計程車使用需求時空相關性的分析。
16.(3)根據輸入的歷史計程車需求數據對目標區域某一時間段的計程車需求進行預測。
17.其中,計程車需求數據的周期性是指,計程車的需求和時間存在一定聯繫,同一區域內的計程車使用需求呈現出周期性的漲落,一段時間內的需求數據劃分為多個近似的片段,每個片段具有相同的漲落特徵。
18.計程車需求時間相關性特徵是指,從整體的出行需求趨勢、周期變化規律、不同日期屬性下的變化特點等方面進行分析。
19.計程車需求空間相關性特徵是指,計程車使用需求不僅與人們的出行規律有關,而且與城市區域的功能屬性、地理特徵、行政規劃、商業化程度等空間特徵有著密切的關係。
20.步驟(2)中,使用門控循環單元來捕捉計程車歷史訂單數據的動態變化,對時間相關性進行建模。
21.步驟(2)中的拓撲空間相關性公式為:
[0022][0023]
其中,x
l
表示第l層的特徵,βk是可訓練參數,σ是激活函數。
[0024]
步驟(3)中,對一個區域進行計程車使用需求預測時,參考該區域功能相似性的其他區域的使用需求,兩個區域之間的poi相似性定義為:
[0025][0026]
其中,是區域vi的poi向量,是區域vj的poi向量,向量的維數等於poi類別的數量。
[0027]
步驟(2)中,建模空間相關性的公式如下:
[0028]
f(x,c)=γ(f(x),γ(c))
[0029]
其中,γ表示聚合函數。
[0030]
步驟(2)中,使用門控循環單元捕獲時間相關性,公式如下:
[0031][0032]
其中,r
t
為重置門用來控制前一狀態有多少歷史信息被寫入到當前的候選集上,z
t
為更新門用於控制前一時刻的狀態信息被帶入到當前狀態中的程度。
[0033]
步驟(2)的時空相關性建模為:
[0034][0035]zt
=σ(wz[f(x
t
,c),h
t-1
]+bz)
[0036]rt
=σ(wr[f(x
t
,c),h
t-1
]+br)
[0037][0038]
其中,f(x,a)表示建模空間相關性的過程,w表示訓練過程中的權重,b表示訓練過程中的偏差。
[0039]
工作原理:本發明根據特定區域的計程車需求歷史數據,預測目標區域未來一段時間的計程車使用需求。使用計程車歷史訂單數據作為計程車使用需求數據源,預測模型訓練之前先對數據進行預處理,將數據中無效欄位進行刪除,清除數據集中殘缺訂單以及異常訂單等無關數據。之後對數據進行特徵分析,得到計程車需求呈現出一定周期性變化的結論,將此特性融入預測模型中。
[0040]
本發明採用了圖卷積門控循環網絡需求預測模型,使用譜域圖卷積神經網絡對城市路網的拓撲結構進行分析,處理計程車使用需求的空間特徵並且考慮區域間的功能相似性特徵,再將它與時間信號進行特徵融合後引入門控循環單元來處理計程車需求的時間特徵,最後通過全連接層處理空間特徵與時間特徵,完成計程車使用需求的預測。
[0041]
有益效果:與現有技術相比,本發明具有以下優點:
[0042]
(1)本發明從計程車歷史訂單數據中進行數據清洗和數據轉化,並對其進行特徵提取來進行預測,將數據周期性引入神經網絡模型的訓練相當程度上緩解了傳統方法面對大規模數據樣本時模型訓練的時間長的問題。
[0043]
(2)本發明使用譜域圖卷積網絡捕獲路網的空間相關性,解決了傳統卷積神經網絡不能處理路網複雜拓撲結構的問題,並且解決了空域圖卷積網絡過平滑的問題。
[0044]
(3)考慮區域間功能相似性的特徵,提高計程車使用需求預測的準確度,本發明使用門控循環單元來捕捉時間相關性,解決了經典循環神經網絡在訓練中梯度爆炸或消失的問題,也對長短期記憶網絡內部網絡進行了簡化,提高了準確率。
[0045]
(4)本發明基於譜域圖卷積網絡和門控循環單元相結合的計程車需求預測方法從預測結果出發,結合不同模型的預測結果進一步降低了預測結果的誤差。
具體實施方式
[0046]
本發明實施例中的方法通過使用譜域圖卷積神經網絡對城市路網的拓撲結構進行分析,處理計程車使用需求的空間特徵並且考慮區域間的功能相似性特徵,再將它與時間信號進行特徵融合後引入門控循環單元來處理計程車需求的時間特徵,最後通過全連接層處理空間特徵與時間特徵,預測計程車的使用需求。具體過程為:
[0047]
(1)在實際應用中,路網結構具有複雜的拓撲結構,圖卷積神經網絡能夠很好的處理複雜拓撲結構數據,然而譜域圖卷積網絡在進行數據處理時,只需要對各個譜域上的分量進行放大和縮小,不需要考慮信號在空域上存在的問題,因此本發明使用譜域圖卷積網絡對路網的拓撲結構和道路屬性進行編碼,從而獲得路網拓撲空間相關性,公式如下:
[0048][0049]
其中,x
l
表示第l層的特徵,βk是可訓練參數,σ是激活函數。
[0050]
(2)在實際應用中,對一個區域進行計程車使用需求預測時,本發明參考該區域功能相似的其他區域的使用需求,使用每個區域周圍的poi來描述區域的功能,兩個頂點(區域)之間的邊定義為poi相似性:
[0051][0052]
其中,是區域vi的poi向量,是vj的poi向量,向量的維數等於poi類別的數量。
[0053]
(3)在考慮路網拓撲結構與區域間功能相似性的同時,來建模空間相關性。具體公式如下:
[0054]
f(x,c)=γ(f(x),f(c))
[0055]
其中,γ表示聚合函數,例如max,sum,average。
[0056]
(4)在實際應用中,計程車需求預測問題為一個時間序列預測問題。門控循環單元捕捉時序數據中間隔較大的依賴關係,解決了經典循環神經網絡在訓練中梯度爆炸或消失的問題,也對長短期記憶網絡內部網絡進行了簡化,提高了準確率。因此,本發明使用門控循環單元捕獲時間相關性,公式如下:
[0057][0058]
(5)本發明考慮到路網的複雜拓撲結構,採用譜域圖卷積網絡並考慮區域之間的功能相似性來獲取計程車需求的空間相關性。其次,利用門控遞歸單元捕捉計程車需求的動態變化,獲取計程車需求的時間相關性,從而完成對計程車需求的預測。時空相關性具體建模如下:
[0059][0060]zt
=σ(wz[f(x
t
,c),h
t-1
]+bz)
[0061]rt
=σ(wr[f(x
t
,c),h
t-1
]+br)
[0062][0063]
其中,f(x,a)表示建模空間相關性的過程。w和b表示訓練過程中的權重和偏差。