一種基於浮動車數據預測多時段行程時間分布的方法
2023-05-26 03:46:46 1
一種基於浮動車數據預測多時段行程時間分布的方法
【專利摘要】本發明公開了一種基於浮動車數據預測多時段行程時間分布的方法,本發明在傳統KNN算法的基礎上,利用貝葉斯模型的學習能力,提高了行程時間預測的魯棒性和準確性。通過歷史數據和實時數據的有效融合,實現了連續多個時段的行程時間均值和方差預測,構建行程時間浮動的置信區間。本發明在各種複雜的城市網絡中都能有效預測連續半小時的行程時間分布信息,相比於傳統的KNN模型,結果更可靠準確。
【專利說明】一種基於浮動車數據預測多時段行程時間分布的方法
【技術領域】
[0001]本發明屬於交通行程時間估計和預測領域,一種基於浮動車數據預測多時段行程時間分布的方法,尤其涉及一種基於低採樣頻率浮動車數據預測多時段行程時間分布的方法,屬於一種帶有學習能力的改進KNN多時段行程時間分布預測方法。
【背景技術】
[0002]隨著我國城市化進程的加快和汽車保有量的提高,城市交通擁堵日益加劇,而先進的交通信息服務系統(ATIS)是緩解交通擁堵的一種有效途徑。作為ATIS應用的一個基本因素,準確可靠的行程時間信息引起了極大的關注。作為衡量交通狀況的一個重要指標,行程時間信息為交通管理者提供一種有效的衡量交通網絡運行狀態的量化指標,同時,準確的交通信息更是先進的交通信息服務系統應用的基礎和關鍵。多時段行程時間的預測不僅可以幫助出行者在多方出行中制定合理的出行計劃,減少出行時間和旅行延誤,降低能耗,還可以提高交通系統的運行效率,有效的緩解交通擁堵。
[0003]當前國內外關於行程時間預測的研究可分為兩大類:高速公路和城市交通網絡。對於高速路上行程時間預測的研究是非常豐富的,然而關於城市道路網絡行程時間預測的研究是相當有限。相比於高速路上相對簡單的交通環境,城市道路的行程時間預測更具有挑戰性。在城市交通網絡中,行程時間有極大的不確定性,主要由以下幾個原因造成的:(I)交通需求的波動性;(2)交通控制,各交叉路口信號燈的影響;(3)交通事故及管制等交通事件的影響;(4)城市交通網絡中,車種多,駕駛行為差異化。由於行程時間的不確定性,導致預測的行程時間均值往往嚴重偏離實際的行程時間,失去了出行參考的價值。因此,很有必要研發城市環境下的行程時間分布預測方法,提供城市行程時間均值和不確定性。
[0004]近年來,浮動車技術成為獲取道路交通信息的先進技術手段之一,所謂的浮動車是一般是指安裝了車載GPS定位設備並行使在城市主幹道上的公共汽車和計程車,可以記錄車輛位置,方向和速度等信息。與傳統的靜態收集手段不同,GPS浮動車可以全天候的,動態實時地收集道路交通信息。雖然GPS浮動車具有低成本,易安裝和維護,覆蓋範圍廣不受環境影響等優點。浮動車數據有可能在成本相對較低的情況下提供高品質的實時交通監控與管理和移動性服務的信息。
【發明內容】
[0005]本發明為了解決複雜城市網絡中行程時間分布預測問題,提出了一種基於低採樣頻率浮動車數據預測多時段行程時間分布的方法。
[0006]本發明所採用的技術方案是:一種基於浮動車數據預測多時段行程時間分布的方法,其特徵在於,包括以下步驟:
[0007]步驟1:以信號燈為標誌對路段進行劃分,以N分鐘為時間間隔對浮動車數據進行劃分,其中NS 5 ;
[0008]步驟2:通過對GPS採樣點進行插值,估計每個路段上每輛浮動車的行程時間;[0009]步驟3:利用KNN預測多時段路段行程時間的均值;
[0010]步驟4:利用貝葉斯學習預測多時段路段行程時間的誤差分布;
[0011]步驟5:生成路段行程時間分布,並在此基礎上,預測行程時間區間。
[0012]作為優選,步驟I中所述的N = 5。
[0013]作為優選,步驟3中所述的預測多時段路段行程時間的均值是利用KNN模型預測多時段路段行程時間的均值。
[0014]作為優選,步驟3中所述的利用KNN模型預測多時段路段行程時間的均值,KNN模型在進行單步預測時,已知t時段之前的實時數據Rt和歷史數據Hf f預測時考慮t-Ι時間段到t-Ι時間段的數據,其實現方式包括以下子步驟:
[0015]步驟3.1:判斷是否是單步預測,若是,則計算當前狀態向量即實時數據Rt和歷史數據iff/之間的歐式距離,然後繼續步驟3.2 ;否則,跳到步驟3.4 ;
[0016]步驟3.2:根據歐式距離££>嚴從歷史數據/Zf中選擇k-近鄰,然後確定預測的t時間段行程時間的歷史狀態量;
[0017]步驟3.3:以歐式距離的倒數作為權重,通過對k_近鄰加權預測t時段行程時間均值m,;
[0018]步驟3.4:令t = t+1,用t時段的預測值更新實時數據Rt,從而對實時數據狀態向量和歷史數據進行更新,得到Rt+1和Ht+1,判斷:
[0019]如果t〈t+p,返回步驟3.1、步驟3.2、步驟3.3和步驟3.4,進行多時段行程時間均值預測,通過對k-近鄰加權預測t+Ι時間段行程時間均值:
[0020]如果t = t+p,預測結束,P表示連續預測的時間段個數。
[0021]作為優選,步驟4中所述的預測多時段路段行程時間的誤差分布,是在傳統KNN模型預測多時段行程時間均值的基礎上,利用貝葉斯模型對其進行改進,預測多時段路段行程時間的誤差分布。
[0022]作為優選,步驟4中所述的利用貝葉斯模型來預測多時段路段行程時間的誤差分布ε t,首先假設在同一時間段內,KNN模型的預測誤差Xt服從正態分布,即I,~靖為,Cf],
兩個位置參數μ t與< 都未知且相互聯繫,並分別服從正態分布和倒伽馬分布,二者的聯合分布為正態-倒伽馬分布,則其實現方式包括以下子步驟:
[0023]步驟4.1.初始化樣本的自由度Vtl、行程時間的估計均值Hitl和行程時間的方差的初值C。;
[0024]步驟4.2.先驗估計:利用當前t時間段的後驗分布來估計t+Ι時間段的先驗分布;
[0025]步驟4.3.預測:對於t+Ι時間段,利用先驗分布的均值和方差信息來預測t+Ι時間段的誤差均值ft+1、誤差均值的方差Ct+1和誤差的方差ct+1 ;
[0026]步驟4.4.更新:隨著時間的推移,如果獲得t時間段的實時樣本,則利用其對預測分布進行後驗更新;否則,將上一時段的後驗更新信息作為當前時段的樣本信息,進行後驗更新;步驟4.5.令t = 1+1,如果1^+?+1,返回步驟4.2,進行多時段行程時間均值預測;如果t = t+ρ+Ι,預測結束,其中P表示連續預測的時間段個數。
[0027]本發明針對現有行程時間預測方法多數隻估計路段行程時間均值、忽略了城市路網中行程時間的不確定性、多數局限的研究高速路上行程時間均值和分布、城市行程時間分布的預測研究集中於單時段的不足,提出了利用貝葉斯改進傳統KNN的方法來解決擁擠城市道路網絡中多時段行程時間分布預測的問題,在提高了預測結果魯棒性的同時,也保證了預測結果的可靠性。
【專利附圖】
【附圖說明】
[0028]圖1:為本發明實施例的流程圖。
【具體實施方式】
[0029]本發明要解決的是複雜城市網絡中行程時間分布的預測問題,針對低採樣頻率的浮動車GPS數據,提出了一種帶有學習能力的改進KNN的多時段行程時間分布預測方法。
[0030]為了便於本領域普通技術人員理解和實施本發明,下面結合附圖及實施例對本發明作進一步的詳細描述,應當理解,此處所描述的實施示例僅用於說明和解釋本發明,並不用於限定本發明。
[0031]本發明的輸入數據為地圖匹配後的浮動車GPS軌跡點和路網數據,GPS軌跡數據是一系列按照時間順序排序的GPS點組成,每個GPS點由速度、時間點和位置等組成,交通路網由一系列有向路段和節點組成,且具有時空動態特性,設G = (N, A, Ω)表示一個交通路網,其中,N表示節點集,A表示路段集,Ω表示一系列的離散時間段{Λ...,ηΛ,...},且η為整數,Λ表示時間間隔(本實施例取5min)。這裡路段au e A,以城市路網中信號燈為依據進行劃分。
[0032]請見圖1,本發明所採用的技術方案是:一種基於浮動車數據預測多時段行程時間分布的方法,其特徵在於,包括以下步驟:
[0033]步驟1:以信號燈為標誌對路段進行劃分,以5分鐘為時間間隔對浮動車數據進行劃分;
[0034]步驟2:通過對GPS採樣點進行插值,估計每個路段上每輛浮動車的行程時間;
[0035]由於GPS採樣時,多數浮動車不能恰好通過路口,從而大部分GPS採樣點落在路段上。因此,實施例通過插值估計出車輛通過路段兩端(即交叉路口)的時刻,從而估計出每個路段上每輛浮動車的路段行程時間。
[0036]步驟3:利用KNN模型預測多時段路段行程時間的均值;
[0037]實例利用歷史數據和實時數據進行預測,已知t時段之前的實時數據Rt =
[IV1,…,和歷史數據
【權利要求】
1.一種基於浮動車數據預測多時段行程時間分布的方法,其特徵在於,包括以下步驟: 步驟1:以信號燈為標誌對路段進行劃分,以N分鐘為時間間隔對浮動車數據進行劃分,其中N≤5 ; 步驟2:通過對GPS採樣點進行插值,估計每個路段上每輛浮動車的行程時間; 步驟3:利用KNN預測多時段路段行程時間的均值; 步驟4:利用貝葉斯學習預測多時段路段行程時間的誤差分布; 步驟5:生成路段行程時間分布,並在此基礎上,預測行程時間區間。
2.根據權利要求1所述的基於浮動車數據預測多時段行程時間分布的方法,其特徵在於:步驟3中所述的預測多時段路段行程時間的均值是利用KNN模型預測多時段路段行程時間的均值。
3.根據權利要求2所述的基於浮動車數據預測多時段行程時間分布的方法,其特徵在於:步驟3中所述的利用KNN模型預測多時段路段行程時間的均值,KNN模型在進行單步預測時,已知t時段之前的 實時數據Rt和歷史數據< f預測時考慮t-Ι時間段到t-Ι時間段的數據,其實現方式包括以下子步驟: 步驟3.1:判斷是否是單步預測,若是,則計算當前狀態向量即實時數據Rt和歷史數據Ff之間的歐式距離££)廣,然後繼續步驟3.2 ;否則,跳到步驟3.4 ; 步驟3.2:根據歐式距離從歷史數據iff中選擇k-近鄰,然後確定預測的t時間段行程時間的歷史狀態量; 步驟3.3:以歐式距離的倒數作為權重,通過對k-近鄰加權預測t時段行程時間均值ItIl ;步驟3.4:令t = t+Ι,用t時段的預測值W1更新實時數據Rt,從而對實時數據狀態向量和歷史數據進行更新,得到Rt+1和Ht+1,判斷: 如果t〈t+p,返回步驟3.1、步驟3.2、步驟3.3和步驟3.4,進行多時段行程時間均值預測,通過對k-近鄰加權預測t+Ι時間段行程時間均值; 如果t = t+p,預測結束,P表示連續預測的時間段個數。
4.根據權利要求2所述的基於浮動車數據預測多時段行程時間分布的方法,其特徵在於:步驟4中所述的預測多時段路段行程時間的誤差分布,是在傳統KNN模型預測多時段行程時間均值的基礎上,利用貝葉斯模型對其進行改進,預測多時段路段行程時間的誤差分布。
5.根據權利要求4所述的基於浮動車數據預測多時段行程時間分布的方法,其特徵在於: 步驟4中所述的利用貝葉斯模型來預測多時段路段行程時間的誤差分布ε t,首先假設在同一時間段內,KNN模型的預測誤差Xt服從正態分布,即Xf ~*兩個位置參數μ t與--;2都未知且相互聯繫,並分別服從正態分布和倒伽馬分布,二者的聯合分布為正態-倒伽馬分布,則其實現方式包括以下子步驟: 步驟4.1.初始化樣本的自由度Vtl、行程時間的估計均值Hitl和行程時間的方差的初值co ; 步驟4.2.先驗估計:利用當前t時間段的後驗分布來估計t+1時間段的先驗分布;步驟4.3.預測:對於t+1時間段,利用先驗分布的均值和方差信息來預測t+Ι時間段的誤差均值ft+1、誤差均值的方差Ct+1和誤差的方差ct+1 ; 步驟4.4.更新:隨著時間的推移,如果獲得t時間段的實時樣本,則利用其對預測分布進行後驗更新;否則,將上一時段的後驗更新信息作為當前時段的樣本信息,進行後驗更新;步驟4.5.令t = t+1,如果t〈t+p+l,返回步驟4.2,進行多時段行程時間均值預測;如果t = t+ρ+Ι,預測結束,其中P表示連續預測的時間段個數。
【文檔編號】G08G1/01GK103927872SQ201410173814
【公開日】2014年7月16日 申請日期:2014年4月28日 優先權日:2014年4月28日
【發明者】陳碧宇, 時朝陽, 李清泉 申請人:武漢大學