一種基於車輛軌跡時空特徵分析的黑車智能發現方法
2023-09-21 23:18:35
一種基於車輛軌跡時空特徵分析的黑車智能發現方法
【專利摘要】本發明提供一種基於車輛軌跡時空特徵分析的黑車智能發現方法。本發明首先提取城市小型車車輛列表,並剔除合法運營計程車,其次對於特定排查期,提取車輛列表中所有車輛在排查期的卡口過車記錄數據,進而從過車記錄數據中初步篩選得出嫌疑黑車列表;然後選擇數據挖掘分析樣本,提取車輛時空特徵數據,接著採用支持向量機算法訓練黑車分類器模型,最後將嫌疑黑車列表中的所有嫌疑黑車特徵數據作為測試集輸入訓練的分類器模型進行分類判定。本發明改變了傳統黑車人工排查方法,分析更加智能高效,對車輛行為特徵進行多維度提取,通過對訓練樣本數據進行樣本交叉訓練消除過擬合問題。
【專利說明】一種基於車輛軌跡時空特徵分析的黑車智能發現方法
【技術領域】
[0001] 本發明涉及基於車輛軌跡時空特徵分析的黑車智能發現方法,特別涉及一種基於 對車輛軌跡時空特徵數據進行挖掘分析進而從大量車輛軌跡時空特徵數據中發現黑車的 方法。
【背景技術】
[0002] 當前,許多城市黑車營運的現象日益嚴重、屢禁不止,成為困擾各地交通運輸管理 部門的難題。黑車營運不僅擾亂城市客運市場秩序,侵害合法經營者的利益,影響城市的文 明形象,而且嚴重地影響著人民群眾的生命財產安全和和諧社會的構建。
[0003] 目前執法機關抓獲黑車主要通過蹲點排查、釣魚執法、群眾舉報等方法,這些抓獲 方法難度大、收穫少。雖然許多城市道路都安裝了電子攝像頭、智慧卡口和電子警察設備, 但是目前尚沒有利用這些設備採集的數據進行科學智能分析從而自動發現黑車的方法。
【發明內容】
[0004] 本發明針對目前人工排查黑車收效甚微的問題,提供了一種基於車輛軌跡時空特 徵分析的黑車發現方法,該方法有較高的黑車發現精度,同時隨著發現的黑車數量增加,可 進一步將確認的黑車加入模型正向樣本對模型訓練反饋,不斷提升算法判定精度。通過該 發明描述的黑車發現方法,可極大減少人工排查的周期和投入人力,提高經濟效益。本發明 技術解決方案:基於車輛軌跡時空特徵分析的黑車智能發現方法,包括如下步驟:
[0005] 步驟1、提取城市小型車車輛列表,並剔除合法運營計程車;
[0006] 步驟2、對於特定排查期,提取步驟1車輛列表中所有車輛在排查期的卡口過車記 錄數據;
[0007] 步驟3、從步驟2的過車記錄數據中初步篩選得出嫌疑黑車列表,所述的嫌疑黑車 的判斷條件為:
[0008] 在該排查期內,超過R天的行為數據滿足以下條件:
[0009] (1)當日產生的卡口過車記錄數大於設定第一閾值m;
[0010] ⑵當日經過的卡口個數大於設定第二閾值η ;
[0011] 如果某輛車輛,有超過R天滿足以上條件,則將其作為嫌疑黑車供後續模型進一 步判斷,依此篩選出所有嫌疑黑車列表,作為步驟4中黑車判斷模型輸入;
[0012] 步驟4、數據挖掘分析樣本選擇;所述的數據挖掘分析樣本包括正向樣本和負向 樣本:正向樣本為所有在冊合法運營計程車行為數據,負向樣本為典型私家車、警用車行為 數據;因為黑車與合法運營計程車有相似的軌跡行為特徵,而典型私家車和警用車與黑車 在行為軌跡上特徵相差較大,因此將合法運營計程車的行為數據作為正向樣本、典型私家 車和警用車的行為數據作為負向樣本訓練分類器模型;
[0013] 步驟5、提取步驟4中選擇的樣本車輛的時空特徵數據,該時空特徵數據包括車輛 分別在工作日和節假日在一天當中不同時間段平均過車記錄數,在一級卡口、二級卡口、三 級卡口一天當中不同時間段的平均過車記錄數,經過的一級卡口、二級卡口、三級卡口數數 據;
[0014] 步驟6、利用步驟5得到的樣本車輛時空特徵數據,採用支持向量機算法訓練黑車 分類器模型,利用該模型能夠對所需判斷車輛進行判別並返回車輛是否屬於黑車;
[0015] 步驟7、將步驟3中產生的嫌疑黑車列表中的所有嫌疑黑車特徵數據作為測試集 輸入步驟六中訓練的分類器模型進行分類判定,獲取最終模型得到的黑車列表。
[0016] 所述步驟5中提取車輛時空特徵數據的具體步驟如下:
[0017] 步驟5. 1、對所有電子卡口設備按照過車記錄頻次進行分級,設分為L個等級;
[0018] 步驟5. 2、提取車輛初始的s個時空特徵數據,將該s個時空特徵數據形式化描述 為 F = {f\,f2, · · ·,fs};
[0019] 步驟5· 3、特徵細化,對所述步驟5· 2中的s個特徵F = {f^,f2, · · ·,fj,根據特徵 取值的分布情況,按照特徵值相近的聚類原則;所述根據特徵取值的分布情況是指特徵取 值大小的分布,進行聚類,能將儘可能將相近的值歸為相同類,進一步離散化,轉化為特徵 相似性越容易判斷的更細粒度的特徵集合FN = {f\,f2, . . .,f,}。
[0020] 所述步驟6中採用分類算法訓練黑車分類器模型M(F)過程如下:
[0021] 步驟6. 1、對於特徵集合FN = {f\,f2, . . .,fq}進行歸一化處理,去除特徵值為0的 特徵,同時標記特徵順序,得到歸一化後的特徵集合FNAUlA = 1,;^ e FN};
[0022] 步驟6. 2、選擇分類算法,將正向樣本和負向樣本特徵數據代入分類算法進行模型 訓練;
[0023] 步驟6. 3、交叉訓練最優模型參數,使得模型M(F)針對樣本分類具有最高精度。
[0024] 所述步驟5. 3轉化為特徵相似性越容易判斷的更細粒度的特徵以下步驟:
[0025] 步驟5. 3. 1、對於5. 2中獲取的初始特徵L得到樣本的初始特徵&取值集合
【權利要求】
1. 一種基於車輛軌跡時空特徵分析的黑車智能發現方法,其特徵在於實現步驟如下: 步驟1、提取城市小型車車輛列表,並剔除合法運營計程車; 步驟2、對於特定排查期,提取步驟1車輛列表中所有車輛在排查期的卡口過車記錄數 據; 步驟3、從步驟2的過車記錄數據中初步篩選得出嫌疑黑車列表,所述的嫌疑黑車的判 斷條件為: 在該排查期內,超過R天的行為數據滿足以下條件: (1) 當日產生的卡口過車記錄數大於設定第一閾值m; (2) 當日經過的卡口個數大於設定第二閾值n; 如果某輛車輛,有超過R天滿足以上條件,則將其作為嫌疑黑車供後續模型進一步判 斷,依此篩選出所有嫌疑黑車列表,作為步驟4中黑車判斷模型輸入; 步驟4、數據挖掘分析樣本選擇;所述的數據挖掘分析樣本包括正向樣本和負向樣本: 正向樣本為所有在冊合法運營計程車行為數據,負向樣本為典型私家車、警用車行為數據; 因為黑車與合法運營計程車有相似的軌跡行為特徵,而典型私家車和警用車與黑車在行為 軌跡上特徵相差較大,因此將合法運營計程車的行為數據作為正向樣本、典型私家車和警 用車的行為數據作為負向樣本訓練分類器模型; 步驟5、提取步驟4中選擇的樣本車輛的時空特徵數據,該時空特徵數據包括車輛分別 在工作日和節假日在一天當中不同時間段平均過車記錄數,在各級卡口一天當中不同時間 段的平均過車記錄數,經過的各級卡口數等數據; 步驟6、利用步驟5得到的樣本車輛時空特徵數據,採用分類算法訓練黑車分類器模 型,利用該分類器模型能夠對所需判斷車輛進行判別並返回車輛是否屬於黑車; 步驟7、將步驟3中產生的嫌疑黑車列表中的所有嫌疑黑車特徵數據作為測試集輸入 步驟六中訓練的分類器模型進行分類判定,獲取最終模型得到的黑車列表。
2. 根據權利要求1所述的基於車輛軌跡時空特徵分析的黑車智能發現方法,其特徵在 於:所述步驟5中提取車輛時空特徵數據的具體步驟如下: 步驟5. 1、提取車輛初始的時空特徵數據,將該時空特徵數據形式化描述為F={fpf2,. . .,fs},其中s表示特徵個數; 步驟5. 2、特徵細化,對所述步驟5. 1中的s個特徵F= {f\,f2,. . .,fj,根據特徵取值 的分布情況,按照特徵值相近的聚類原則;所述根據特徵取值的分布情況是指特徵取值大 小的分布,進行聚類,能將儘可能將相近的值歸為相同類,進一步離散化,轉化為特徵相似 性越容易判斷的更細粒度的特徵集合FN= {f\,f2,. . .,fq}。
3. 根據權利要求1所述的基於車輛軌跡時空特徵分析的黑車智能發現方法,其特徵在 於:所述步驟6中採用分類算法訓練黑車分類器模型M(F)過程如下: 步驟6. 1、對於特徵集合FN= {f\,f2,. . .,fq}進行歸一化處理,去除特徵值為O的特 徵,同時標記特徵順序,得到歸一化後的特徵集合FNA{iIfi =IfiGFN}; 步驟6. 2、選擇分類算法,將正向樣本和負向樣本特徵數據代入分類算法進行模型訓 練; 步驟6. 3、交叉訓練最優模型參數,使得模型M(F)針對樣本分類具有最高精度。
4. 根據權利要求2所述的基於車輛軌跡時空特徵分析的黑車智能發現方法,其特徵在 於:所述步驟5. 2轉化為特徵相似性越容易判斷的更細粒度的特徵以下步驟: 步驟5.3. 1、對於5. 1中獲取的初始特徵L得到樣本的初始特徵&取值集合Vfi =Ivalue1,Value2,--?,ValuesmJ,其中sum為樣本總數; 步驟5. 3. 2、對Vfi中的數值進行一維聚類,得到質心集合C=IC1,C2,...,CP}; 步驟5. 3. 3、將步驟5. 3. 2中質心集合C作為分界點對初始特徵&細化為 {f'pf' 2,...,f'p+1}的P+1個特徵,P為需要聚類的類數,對於特徵f'i其取值V(f'J 為:
Valuei表示初始特徵&的第i個樣本取值,Ci為質心集合第i個質心; 步驟5. 3. 4、對集合F中所有特徵f\,f2,. . .,f128,重複步驟5. 3. 1、5. 3. 2、5. 3. 3,得到細 化後特徵集合FN=If1,f2, ? ? ?,;
q為對於所有初始特徵進行相似性特徵聚類後獲取得到的最終特 徵個數的總數值; Centroidi表示初始特徵Ti的值聚類後得到的質心集合; C(Centroidi)表示初始特徵對應的Centroidi的大小。
5. 根據權利要求1所述的基於車輛軌跡時空特徵分析的黑車智能發現方法,其特徵在 於:所述步驟3中的R取值為不小於排查期的1/3的天數,S卩如果排查期為一個月30天,則 R取值不小於10,且不大於30。
6. 根據權利要求1所述的基於車輛軌跡時空特徵分析的黑車智能發現方法,其特徵在 於:所述步驟3中第一閾值m取值範圍通常為1-100,第二閾值n取值範圍為1-80。
7. 根據權利要求4所述的基於車輛軌跡時空特徵分析的黑車智能發現方法,其特徵在 於:所述步驟3中p取值為1-20的整數。
【文檔編號】G06K9/66GK104268599SQ201410514768
【公開日】2015年1月7日 申請日期:2014年9月29日 優先權日:2014年9月29日
【發明者】袁偉, 閆碧瑩, 鄧攀, 陳 峰, 李玉成 申請人:中國科學院軟體研究所