基於時空融合與自注意力機制的交通流量修複方法及系統

2023-10-05 14:37:35

1.本發明屬於數據挖掘、深度學習領域，涉及一種基於時空融合與自注意力機制的交通流量修複方法及系統。

背景技術：

2.進入21世紀以來，隨著國民經濟的穩定增長，私人汽車擁有量屢創新高。由於人們出行頻率的增加以及汽車數量的快速增長，對城市交通的壓力越來越大。卡口設備可以獲得道路的車流量、車速等信息。海量的卡口數據具有重要的研究價值，藉助這些數據的研究可以為城市的交通建設、出行軟體的規劃推薦提供有效支持。例如對道路車流量的分析，可以挖掘出每條道路各個時刻的擁擠程度。城市建設可以對長時間擁擠的道路進行拓寬，出行服務商可以向用戶提供該時刻擁擠程序較低的路線方案。但是由於網絡波動、空氣品質及設備故障造成的數據缺失，會對數據分析產生較大的影響。因此交通數據的車流量、車速的修復對於智慧城市交通建設具有重要意義。
3.目前對於交通數據修復的解決方案主要是基於傳統的修復模型。傳統修複方法常用的是多元線性插值法，該方法模型簡單、計算速度快、但是魯棒性差，僅適用於交通狀況穩定路段。人們也常常將深度學習的預測方法用在修復上，例如基於transformer架構的深度學習預測模型，利用對大量的歷史數據的學習，來預測缺失數據的值。但該方法應用在修復上，未利用起缺失數據段之後的信息，在交通數據的修復中，數據信息提取不足。

技術實現要素：

4.本發明的一個目的是針對上述問題，提出了一種基於深度學習的車流量修複方法，一種基於時空融合與自注意力機制的車流量修復模型stmar。該模型一方面能夠充分學習同一道路的歷史信息，另一方面能提取不同道路之間的車流量的相互影響。
5.本發明所採用的技術方案如下：
6.步驟1：時空數據融合；
7.1-1生成空間嵌入向量：
8.將交通地圖信息代入node2vec算法，計算出交通地圖中各個傳感器的空間嵌入向量es。
9.所述交通地圖信息包括傳感器間的道路連通關係和距離，所述道路連通關係包括可通行和不可通行兩種狀態。
10.1-2生成時間嵌入向量：
11.假設一天分為t個時間步長，使用獨熱編碼(one-hot)將每個時間步長的星期幾和一天中的時間編碼轉化為r7和r
t
，並將r7、r
t
連接成一個向量r
t+7
，即為時間特徵；使用全連接神經網絡將時間特徵r
t+7
轉換為時間嵌入向量e
t
。
12.e
t
＝wdconcat(r
t
,r7)+bd13.其中wd和bd分別是全連接層的權重、偏置；
14.1-3融合時空嵌入向量：
15.根據以下公式將空間嵌入向量es和時間嵌入向量e
t
融合為時空嵌入向量。
16.e
st
＝add(tan(es),tan(e
t
))
17.其中add(
·
,
·
)為矩陣相加操作。
18.1-4拆分時空嵌入向量
19.將e
st
的時間維度拆分，將e
st
拆分為
20.其中分別代表t
1-t
p
、t
p+1-t
2p
、t
2p+1-t
3p
時間段對應的時空嵌入向量。
21.步驟2：通過傳感器獲取待修補交通數據以缺失數據為中心，將x中前面t
p
個數據以正序形式構成以x中最後t
p
個數據逆序形式構成其中交通數據包括車流量、車速中的一種或兩種；
22.步驟3：利用搭建好的基於時空融合與自注意力機制的車流量修復模型stmar，實現交通流量修復。
23.所述基於時空融合與自注意力機制的車流量修復模型stmar包括兩個並行網絡、融合層。
24.所述兩個並行網絡的輸入分別為正序序列數據xf和逆序序列數據xr，其結構相同，均包括時空融合塊、時空自注意力塊、時空剔除塊；
25.1)所述時空融合塊，用於將時空嵌入向量融入交通數據，具體是：
26.通過全連接層對xf、xr進行編碼轉換為嵌入向量表示：
27.e
τ
＝relu(w
τ
x
τ
+b
τ
)
28.其中relu是激活函數，w
τ
和b
τ
是全連接層的權重、偏置，τ＝f或r；
29.將時空嵌入向量e
st
和數值嵌入向量e
τ
融合成時空數值嵌入向量e
τ』：
[0030][0031]
2)所述時空自注意力塊，包括時間自注意力、空間自注意力和門控融合；其輸入為e
τ』，利用時間自注意力機制和空間自注意力機制，分別得到輸出h
τ,s
、h
τ,t
，再將h
τ,s
、h
τ,t
經過融合後的輸出h
τ
即為時空自注意力塊的輸出。具體是：
[0032]
①
通過對矩陣e
τ』做維度交換得到和分別對和通過自注意力機制提取重要特徵。自注意力機制計算公式如下：
[0033][0034][0035][0036]hτ,θ
＝softmax(query
·
key
t
)
·
value
[0037]
其中θ＝s或t。
[0038]
②
使用全連接層融合上述得到的h
τ,s
和h
τ,t
生成時空自注意力塊的輸出h
τ
，具體公式如下：
[0039]hτ
＝wh(h
τ,s
||h
τ,t
)+bh[0040]
其中wh和bh是全連接層的權重、偏置，τ＝f或r；
[0041]
3)所述時空剔除塊，用於對所述時空自注意力塊輸出的h
τ
排除其中包含的時空信息，得到修補後數值數據。具體是：
[0042]
對於時空自注意力塊的輸入e
τ』，表示t個時刻所有傳感器的時空數據融合向量的集合。其不但存儲了t個時刻所有傳感器記錄的數值的嵌入向量，還包含t個時刻所有傳感器的時空嵌入向量。時空自注意力的輸出h
τ
，表示t個時刻所有傳感器的時空數據融合向量的集合，其相比於需要修復的數據多了時空嵌入向量，故在時空剔除塊剔除修復時間段即t個時刻所有傳感器的時空嵌入向量，如公式所示：
[0043][0044]
其中sub(
·
,
·
),表示相減，為步驟1得到的修復時間段(t
p+1-t
2p
)的時空嵌入向量。
[0045]
所述融合層，用於將所述兩個並行網絡輸出的根據以下公式進行融合，得到最終輸出y。
[0046]
對於正序與逆序數據xf和xr，經過各自的訓練到的修復結果，兩個修復結果在不同時刻上的準確度是不同的，可能是大於亦可能是小於。為了融合兩個重構值，使他們變成一個準確度更高的修復序列數據，本方法使用一個全連接層來提取兩段序列的重要程度。
[0047]
計算公式如下：
[0048][0049]
其中||為向量間的連接操作，wy和by是全連接層的權重、偏置。
[0050]
本發明的另一個目的是提供實現上述方法的基於時空融合與自注意力機制的交通流量修復系統，包括基於時空融合與自注意力機制的車流量修復模型stmar、時空數據融合模塊。
[0051]
本發明的再一個目的是提供一種電子設備，包括處理器和存儲器，所述存儲器存儲有能夠被所述處理器執行的機器可執行指令，所述處理器執行所述機器可執行指令以實現所述的方法。
[0052]
本發明的又一個目的是提供一種機器可讀存儲介質，該機器可讀存儲介質存儲有機器可執行指令，該機器可執行指令在被處理器調用和執行時，機器可執行指令促使處理器實現所述的方法。
[0053]
本發明的有益效果具體是：
[0054]
(1)本發明提出了時空結合及時空剔除的交通流修複方法。時空結合使得模型在使用自注意力機制時，將空間信息、時間信息及數值相加並看為一個整體，充分利用了道路中的路網的空間信息及時間的前後關係，提高了道路圖信息的利用率。
[0055]
(2)本發明提出了用於交通流量修復的時空融合與自注意力機制。時空融合與自注意力機制通過結合空間與時間信息，使得模型能夠提取到不同道路之間車流量的隱含關係，學習道路圖的歷史流量特徵。在網絡道路流量修復中提高了修復的準確率。
[0056]
(3)本發明提出了正序逆序兩種序列數據修復融合的方法。通過正序逆序兩種遍
歷方法得到兩種序列，提取不同序列的多種信息，提高修復準確率。
附圖說明
[0057]
圖1為本發明的時空融合圖；
[0058]
圖2為本發明的時空自注意力圖；
[0059]
圖3為本發明的時空剔除圖；
[0060]
圖4為本發明的融合層圖；
[0061]
圖5為本發明提出的模型結構圖。
具體實施方式
[0062]
下面結合附圖對本發明的具體實施方案作進一步詳細描述。
[0063]
基於時空融合與自注意力機制的交通流量修複方法，圖5包括以下步驟：
[0064]
步驟1：時空數據融合：
[0065]
1-1生成空間嵌入向量：
[0066]
如圖1所示，圖信息由地圖上各個傳感器的路線關係構成，使用node2vec方法學習傳感器表示，生成傳感器的空間嵌入向量/編碼es，向量長度為8。
[0067]
1-2生成時間嵌入向量：
[0068]
時間信息輸入主要提取時間信息中的星期、時、分信息進行編碼。例如(2017-4-112:20:00，星期六)的信息，將此信息的12時、20分及星期六信息提取。將每日的時間按5分鐘一段分割並編號，則12時20分的編號為(12*60+20)/5即1444，轉化為一位有效編碼(獨熱編碼)r
t
為[0 0 0
ꢀ…ꢀ
1 0
ꢀ…
],其中1的下標為1444.將星期六轉化為一位有效編碼r7[0 0 0 0 0 1 0]。
[0069]
將兩個向量按如下公式映射成一個向量e
t
，即為時空向量。其中wd為可學習的全連接層參數。時間嵌入向量/編碼e
t
的長度為8。
[0070]et
＝wdconcat(r
t
,r7)+bd[0071]
其中wd和bd分別是全連接層的權重、偏置；
[0072]
1-3融合時空嵌入向量：
[0073]
對於上述的時間嵌入向量es和空間嵌入向量e
t
，本方法先對es和e
t
使用tanh激活函數，後向量相加的方法融合它們變成時空嵌入向量e
st
(嵌入向量長度為8)，公式如下：
[0074]est
＝add(tan(es),tan(e
t
))
[0075]
其中add(
·
,
·
)為矩陣相加操作。
[0076]
1-4拆分時空嵌入向量：
[0077]
對於1-3得到的時空嵌入向量，其涵蓋t
1-t
3p
時間段3p個時間點的時空嵌入向量，將其分為2塊：
[0078]
其中分別代表t
1-t
p
、t
p+1-t
2p
、t
2p+1-t
3p
時間段對應的時空嵌入向量。
[0079]
步驟2：通過傳感器獲取待修補交通數據其中缺失部分為以缺失數據為中心，將x的前面部分以正序形式構成
以x的後面部分逆序形式構成其中交通數據包括車流量、車速中的一種或兩種。
[0080]
步驟:3：利用搭建好的基於時空融合與自注意力機制的車流量修復模型stmar，實現交通流量修復。
[0081]
所述基於時空融合與自注意力機制的車流量修復模型stmar包括兩個並行網絡、融合層。
[0082]
所述兩個並行網絡的輸入分別為正序序列數據xf和逆序序列數據xr，其結構相同，均包括時空融合塊、時空自注意力塊、時空剔除塊；
[0083]
1)所述時空融合塊，用於將時空嵌入向量融入交通數據，具體是：
[0084]
將xf和xr經過全連接層編碼轉換為長度為8的嵌入向量e
τ
，相加公式如下。
[0085]eτ
＝relu(w
τ
x
τ
+b
τ
)
[0086]
其中relu是激活函數，w
τ
和b
τ
是全連接層的權重、偏置，τ＝f或r；
[0087]
將時空嵌入向量e
st
(矩陣大小為[1,325,8])和數值嵌入向量e
τ
(矩陣大小為[12,1,8])融合成時空數值嵌入向量e
τ』：
[0088][0089]
得到的e
τ』的矩陣大小為[12,325,8]
[0090]
2)所述時空自注意力塊，包括時間自注意力、空間自注意力和門控融合；其輸入為e
τ』，利用時間自注意力機制和空間自注意力機制，分別得到輸出h
τ,s
、h
τ,t
，再將h
τ,s
、h
τ,t
經過融合後的輸出h
τ
即為時空自注意力塊的輸出。圖2具體是：
[0091]
2-1通過對矩陣e
τ』(矩陣大小為[12,325,8])做維度交換得到矩陣大小為[12,325,8])和矩陣大小為[325,12,8])。
[0092]
其中12、325、8分別代表時間維度長度、空間維度長度、嵌入向量長度。
[0093]
並對和通過自注意力機制提取重要特徵。自注意力機制計算公式如下：
[0094][0095][0096][0097]hτ,θ
＝softmax(query
·
key
t
)
·
value
[0098]
其中θ＝s或t。
[0099]
2-2使用全連接層融合上述得到的h
τ,s
和h
τ,t
生成時空自注意力塊的輸出h
τ
，具體公式如下：
[0100]hτ
＝wh(h
τ,
s||h
τ,t
)+bh[0101]
其中wh和bh是全連接層的權重、偏置，τ＝f或r；
[0102]
3)所述時空剔除塊，用於對所述時空自注意力塊輸出的h
τ
排除其中包含的時空信息，得到修補後數值數據。圖3具體是：
[0103]
對於時空自注意力塊的輸入e
τ』，表示t個時刻所有傳感器的時空數據融合向量的集合。其不但存儲了t個時刻所有傳感器記錄的數值的嵌入向量，還包含t個時刻所有傳感
器的時空嵌入向量。時空自注意力的輸出h
τ
，表示t個時刻所有傳感器的時空數據融合向量的集合，其相比於需要修復的數據多了時空嵌入向量，故在時空剔除塊剔除修復時間段即t個時刻所有傳感器的時空嵌入向量，如公式所示：
[0104][0105]
其中sub(
·
,
·
),表示相減，步驟1得到的修復時間段(t
p+1-t
2p
)的時空嵌入向量。
[0106]
所述融合層，用於將所述兩個並行網絡輸出的根據以下公式進行融合，得到最終輸出y，見圖4。
[0107]
對於正序與逆序數據xf和xr，經過各自的訓練到的修復結果，兩個修復結果在不同時刻上的準確度是不同的，可能是大於亦可能是小於。為了融合兩個重構值，使他們變成一個準確度更高的修復序列數據，本方法使用一個全連接層來提取兩段序列的重要程度。
[0108]
計算公式如下：
[0109][0110]
其中||為向量間的連接操作，wy和by是全連接層的權重、偏置。
[0111]
本發明實驗在兩個個數據集上進行，分部是灣區高速路數據集(pems)和洛杉磯高速路數據集(metr)。灣區高速路數據集中包含灣區2017年1月1日至2017年6月30日期間325個交通傳感器記錄的6個月數據，共52116條數據。洛杉磯高速路數據集包含從洛杉磯縣高速公路的環路檢測器收集的交通信息。我們選擇了207個傳感器並收集了2012年3月1日至2012年6月30日4個月的數據，共37272條數據。
[0112][0113]
本發明所採用的效果指標是mae、rmse、mape。計算公式如下
[0114][0115][0116][0117]
且我們分別對數據集缺失15分鐘、30分鐘、60分鐘進行修復，且與其他三種方法進
行對比。修復結果如下：
[0118]
表1：灣區高速路數據集(pems)實驗結果
[0119][0120]
表2：洛杉磯高速路數據集(metr)實驗結果
[0121][0122][0123]
本發明提出的模型是stmar模型，對比linear模型、cpi模型和gman模型。linear利用缺失數據附近的數據進行插值修復。cpi複製具有相似特徵的數據塊並將它們粘貼到時間序列的間隙中，gman利用圖自注意力進行數據補全。可以看到本發明提出的模型在兩個數據集上相比它們均有提升。

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

基於時空融合與自注意力機制的交通流量修複方法及系統

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法