一種基於多維數據的交通異常點檢測方法
2023-04-26 17:39:41 2
一種基於多維數據的交通異常點檢測方法
【專利摘要】本發明涉及一種基於多維數據的交通異常點檢測方法,該方法對微波設備獲取的每條路段連續一段時間內的流量、速度和車道佔有率數據,先根據速度數據計算路段的歷史擁堵概率,通過對比最近時間的交通狀態指標值定義路段的正、負異常,再從負異常的路段中用基於密度的局部異常因子方法計算異常度,並結合正負異常因子計算加權異常度並排序。本發明方法採用多指標數據,考慮了樣本空間數據分布不均勻的情況,通過結合交通數據本身特性,避免了基於密度的局部異常因子方法的局部有限性,能有效檢測出道路異常點,幫助交管部門指揮道路交通,調節優化道路的使用效率,具有通用性強、可行性強、可靠性高、適用性強的特點。
【專利說明】一種基於多維數據的交通異常點檢測方法
【技術領域】
[0001] 本發明涉及智能交通領域,尤其涉及一種基於多維數據的交通異常點檢測方法。【背景技術】
[0002] 隨著城市經濟的快速發展,城市交通中機動車數量不斷增加,如何有效調控交通 流量,優化道路的使用效率,疏導道路的交通狀況,成為城市智能交通領域研究的重點。而 其中的一個關鍵技術就是對城市交通的異常進行檢測,即通過一定的技術手段檢測出城市 交通中出現異常的路段。異常點的檢測是城市交通公共信息服務的主要內容,也是交通管 理部門部署警力、疏導道路交通的必要手段。交通異常點的檢測一般是採用車流量數據進 行分析,但該做法沒有考慮交通數據本身特性,會將正常數據檢測為異常,如出現紅燈的時 間不固定而導致的某時段某路段流量出現變化的情況。因此採用多指標數據檢測交通道路 異常點來克服單個指標的片面性和較大誤差。在異常點檢測中,通過採用技術手段對多指 標數據進行分析計算,得出交通異常的路段,包括正異常和負異常,正異常指好的異常,即 交通狀態相比以前變好了;負異常指壞的異常,即交通狀態相比以前變壞了,負異常的路段 是交通管理部門重點關注的路段,因此本發明主要考慮負異常的情況。
[0003] 目前對交通異常點檢測的研究較少,一般只是單純的擁堵檢測。異常點檢測可採 用離群點檢測的方法,主要有基於模型的方法,基於鄰近度的方法,基於聚類的方法以及基 於密度的方法。基於模型的方法要求事先知道數據服從什麼分布,對多維數據的檢測性較 差;基於鄰近度的方法不適用於交通大數據集,對參數選擇較敏感,且無法滿足交通數據分 布不均勻的需求;基於聚類的方法其檢測結果與簇類個數的選取有關,會出現誤判現象,即 使是不需預先選擇簇類個數的DBSCAN方法對於簇的邊界樣本同樣會出現誤判,且不能較 好反映多維數據;基於密度的方法能有效適用於分布不均勻的多維交通數據,且在交通異 常點檢測中對參數的選擇不敏感。為了定量給出交通異常點,設計一種基於多維數據的交 通異常點檢測方法是十分有必要的。
【發明內容】
[0004] 本發明為克服上述的不足之處,目的在於提供一種基於多維數據的交通異常點檢 測方法,該方法對微波設備獲取的每條路段連續一段時間內的流量、速度和車道佔有率數 據,先根據速度數據計算路段的歷史擁堵概率,通過對比最近時間的交通狀態指標值定義 路段的正、負異常,再從負異常的路段中用基於密度的局部異常因子方法計算異常度,並結 合正負異常因子計算加權異常度。本發明方法採用多指標數據,考慮了樣本空間數據分布 不均勻的情況,通過結合交通數據本身特性,避免了基於密度的局部異常因子方法的局部 有限性,能有效檢測出道路異常點,幫助交管部門指揮道路交通,調節優化道路的使用效 率。
[0005] 本發明是通過以下技術方案達到上述目的:一種基於多維數據的交通異常點檢測 方法,包括如下步驟:
[0006] (1)採集微波監控路段的交通特徵數據;
[0007] (2)計算每條路段的歷史擁堵概率;
[0008] (3)根據每條路段的交通特徵數據來判斷並定義路段的正負異常;
[0009] (4)採用基於密度的局部離群因子算法計算異常度;
[0010] (5)通過步驟(2)與步驟(4)得到的結果計算加權異常度;
[0011] (6)對步驟(5)得到的結果進行排序,得到前T個加權異常度最大的路段,T為預 先設置的閾值;
[0012] (7)輸出前T個加權異常度最大的路段。
[0013] 作為優選,所述步驟(1)所述的交通特徵數據包括微波監測路段的車流量、車輛 速度、車道佔有率三類數據。
[0014] 作為優選,所述步驟(2)計算每條路段的歷史擁堵概率是以車輛速度數據為對 象,計算速度小於V的數據佔有率;歷史擁堵概率的計算式子如下所示:
[0015]
【權利要求】
1. 一種基於多維數據的交通異常點檢測方法,其特徵在於包括如下步驟: (1) 採集微波監控路段的交通特徵數據; (2) 計算每條路段的歷史擁堵概率; (3) 根據每條路段的交通特徵數據來判斷並定義路段的正負異常; (4) 採用基於密度的局部離群因子算法計算異常度; (5) 通過步驟(2)與步驟(4)得到的結果計算加權異常度; (6) 對步驟(5)得到的結果進行排序,得到前T個加權異常度最大的路段,T為預先設 置的閾值; (7) 輸出前T個加權異常度最大的路段。
2. 根據權利要求1所述的一種基於多維數據的交通異常點檢測方法,其特徵在於:所 述步驟(1)所述的交通特徵數據包括微波監測路段的車流量、車輛速度、車道佔有率三類 數據。
3. 根據權利要求1或2所述的一種基於多維數據的交通異常點檢測方法,其特徵在於: 所述步驟(2)計算每條路段的歷史擁堵概率是以車輛速度數據為對象,計算速度小於V的 數據佔有率;歷史擁堵概率的計算式子如下所示:
其中,P(i)為第i條路段的歷史擁堵概率,v(i)為第i條路段的微波速度數據,sum為 求個數函數。
4. 根據權利要求1或2所述的一種基於多維數據的交通異常點檢測方法,其特徵在於: 所述步驟(3)判斷並定義路段的正負異常的規則為若交通狀態為暢通,則正負異常因子為 flag= 0-p;若交通狀態為非暢通,則正負異常因子為flag= 1-p;flag>O為負異常, flag彡0為正異常。
5. 根據權利要求1所述的一種基於多維數據的交通異常點檢測方法,其特徵在於:所 述步驟(4)計算異常度的基於密度的局部離群因子算法包括如下步驟: 1) 對輸入的m*n數據D計算D中所有對象的K距離鄰域,其中m為數據對象的個數,n 為維度; 2) 計算對象p與其K距離鄰域對象的可達距離,其中可達距離是該對象的K距離與該 對象和對象P的距離之間的較大值: reach_dist_k(p,〇) =max{K_distance(o),dist(p,o)}; 3) 計算對象p的局部可達密度: lrd_k(p) = |N_k(p)I/E〇eN-k(p)reach_dist_k(p,〇) 其中局部可達密度是對象的K距離鄰域內所有對象的可達距離之和與K距離鄰域內的 對象個數之比的倒數; 4) 計算對象p的局部離群因子:
5) 重複步驟1)至4),求出所有輸入數據的局部離群因子,若有r條路段,每條路段有 m,個數據對象,則可得到!個m,維的LOF序列,LOF值就是所求的異常度。
6. 根據權利要求5所述的一種基於多維數據的交通異常點檢測方法,其特徵在於:所 述步驟1)計算D中對象的K距離鄰域的方法如下: a) 採用歐式距離或曼哈頓距離,數據D的距離矩陣為dist:m*m的對稱矩陣,計算每兩 個對象間的距離; b) 對每個對象與其他對象的距離進行排序,第K個最小距離即為K距離[distance; c) 得到每個對象的K距離鄰域: N_k(p) ={pIdist(p,q) ^K_distance(p)} 其中每個對象的K距離鄰域即為與其的距離不大於其K距離的對象的集合。
7. 根據權利要求1所述的一種基於多維數據的交通異常點檢測方法,其特徵在於:所 述步驟(5)計算加權異常度是以負異常路段的LOF異常度乘以代表歷史擁堵概率的正負異 常因子flag得到路段的加權異常度,計算式子如下: WLOF(i) =L0F(i)lastXflag(i) 其中,LOF(i)last是第i條負異常路段的最後一個LOF值,flag(i)是第i條路段的負 異常因子,WLOF(i)是第i條路段的加權異常度。
8. 根據權利要求3所述的一種基於多維數據的交通異常點檢測方法,其特徵在於:所 述的速度V為0km/h-20km/h中的任意一個速度值。
9. 根據權利要求1所述的一種基於多維數據的交通異常點檢測方法,其特徵在於:所 述的閾值T設置為5。
【文檔編號】G08G1/01GK104504901SQ201410837207
【公開日】2015年4月8日 申請日期:2014年12月29日 優先權日:2014年12月29日
【發明者】李丹, 李建元, 王浩, 張麒, 顧超 申請人:浙江銀江研究院有限公司