基於車聯網大數據的UBI系統預測方法與流程
2023-05-30 03:00:06
本發明涉及大數據時代下的UBI系統研究,即數據源,數據的處理,數據的分析和預測模型等部分,特別給出了車險預測模型和UBI車險定價策略。
背景技術:
2013年我國的財險行業突破了億萬元大關,比2009年增加了21.3%,儘管如此,但保險行業的盈利仍然不理想。由於傳統的機動車輛保險只考慮車輛購置價、購車類型等,車輛保險模式極其單一,沒有考慮駕駛行為對機動車輛保險的影響,導致大部分優質的車險用戶為少數因惡劣的駕駛行為造成高額理賠的用戶買單,因而使得投保人的車險保費設定存在嚴重不合理的現象。
相比之下,國外的保險費率更為靈活,美國未婚低齡保險費率最高(缺乏責任感,易出現車輛事故);德國新手費率高(出險概率高);加拿大周末用車比上班用車費率低(出險概率低)。國外積極推廣UBI(Usage-Based Insurance,UBI,基於駕駛行為的車輛保險系統)保險,並取得了一定的成效,未來UBI的車聯網保險模式也將被持續推廣與應用。
隨著網際網路時代的到來和技術全球化的發展,移動網際網路正在不斷滲透到社會、經濟各個領域,同樣地網際網路下的車聯網也正向著汽車保險行業滲透,因而基於車聯網的汽車保險行業有巨大的發展前景。其中,車聯網技術、大數據技術等是未來保險行業發展的核心驅動力。
公開號為CN105389864A、名稱為「一種汽車UBI信息提取的方法」的發明專利公開了一種基於汽車UBI的數據提取方法,屬於汽車UBI保險系統領域,包括汽車UBI數據集合、搜集方法、預加工方法、加工流程、雲計算與數據挖掘等。但該專利僅涉及智能車載感知終端對汽車運行過程中的一些參數的採集,和對UBI系統的研究,沒有涉及車險費用的預測。
技術實現要素:
本發明目的在於解決車輛保險模式極其單一,沒有考慮駕駛行為對機動車輛保險的影響,提出大數據時代下的UBI系統,數據源,數據的處理,數據的分析和預測模型,對各個模塊進行了詳細的闡述分析。並結合數據的分析結果,制定了合理的車險預測模式。
為解決上述問題,本發明結合對車聯網保險以及大數據時代下的UBI系統的研究提出基於車聯網大數據的UBI系統預測方法。具體技術方案如下:
基於大數據技術下的UBI系統預測方法,包括如下步驟:
步驟1:應用智能車載終端OBD,對車輛行駛數據和駕駛行為信息進行收集存儲,並進行數據處理;
步驟2:分析建模;
步驟3:在分析建模的基礎上給出合理的車險預測方案,並針對用戶的個性化服務要求進行模塊化的系統分析和處理;
步驟4:在駕駛行為分析研究的基礎上,給出車險預測模型和UBI車險定價策略。
進一步,步驟1中所述數據處理包含數據預處理和數據存儲兩部分,數據預處理可以獲取對車輛保險預測方案有價值的數據信息,數據存儲是通過對駕駛行為有關的數據解析,篩選出UBI系統所需的數據,然後對這些數據進行分類、合併,並存儲到分布式資料庫中,收集存儲是利用車聯網,通過OBD、GPS等裝置,完成車輛自身狀態和環境信息數據的採集,並通過網際網路將採集的數據傳輸到中央處理器。
進一步,步驟2中所述分析建模處理是針對預處理提取的數據特徵,對不同的駕駛行為給予不同的保險費率。
有益效果:
1.本發明是通過對大數據處理,得出了車聯網大數據時代的UBI系統。
2.在此系統的作用下,詳細分析大數據處理過程,結合實際所得數據從不同角度說明駕駛行為對車險的影響。
3.根據分析的結果,給出簡易的分析模型和合理的車險預測模式建議。
附圖說明
圖1為OBD模式下的車聯網模型。
圖2為本發明的車聯網大數據時代的UBI系統。
圖3對收集數據分析處理的結果圖。
圖4為本發明的流程圖。
具體實施方式
現結合附圖對本發明的具體實施方式做進一步詳細的說明。本發明提出基於車聯網大數據的UBI系統預測方法,對車聯網保險進行了研究,並創新性提出了大數據時代下的UBI系統預測方法。該方法從車主的駕駛行為習慣、行車裡程、購置的價格及車輛的類型等方面進行綜合分析,在車聯網保險的第一代基於按裡程付費(PAYD,Pay As You Drive)的車保險到第二代考慮駕駛安全(PHYD,Pay How You Drive)的車保險基礎上提出車和人相結合多模式釐定車險方案,打破傳統的只對車或者人單一的分析模式。本發明分析處理的數據均是由車載終端OBD收集的真實駕駛行為數據。
如圖1所示,車聯網(Internet of Vehicles,IOV)是通過OBD、GPS等裝置,完成車自身狀態的和環境信息數據的採集,通過網際網路將採集的數據傳輸到中央處理器並對數據進行分析處理,並對不同需求的車輛進行有效監管和提供綜合服務的系統,實現車輛的智能化控制。
車載診斷(OBD,On-Board Diagnostics)是車聯網的核心技術,融合了汽車智能感知模塊、汽車與網際網路的連接模塊、汽車系統和部件(發動機,排放控制系統等)的監測模塊,實現車輛狀況的實時記錄和報告。OBD模式的車聯網系統,是由OBD終端、後臺系統、手機APP這三個主要部分組成,OBD模式下的車聯網模型,車輛內置的傳感器具有智能感知功能,車載診斷OBD通過控制局部網(CAN,Controller Aver Network)與總線相連,獲取電控單元(ECU,Engine Control Unit)中的車輛狀態信息。該模式系統與物聯網的邏輯組成類似,由數據採集,數據分析處理,數據報告等組成。
如圖2所示,大數據時代的UBI系統主要有數據源,數據的處理,數據的分析和預測模型等部分組成。以下是對大數據的UBI車險系統的詳細分析綜述。
機動車輛中安裝的OBD對車輛的各個系統進行實時監測,車聯網的應用實現了從客戶端-伺服器(Client/Server)成功連接,伺服器是整個應用系統的資源中心,客戶端發送的數據傳送到資料庫伺服器,客戶端也可以對資料庫進行訪問。本發明數據源存儲在關係資料庫MySQL中,通過數據網關傳輸到分布式資料庫管理系統中。MySQL具有體積小、速度快、成本低等特點,適用於車況中快速產生數據,及時更新資料庫中的數據,去除了冗餘的數據信息,減少了網絡資源的浪費。
數據處理包含數據預處理和數據存儲兩部分,數據預處理可以獲取對車保險預測方案有價值的數據信息。通過對駕駛行為有關的數據解析,篩選出本發明提出的UBI系統所需的數據,如每日四急(急剎車、急加速、急減速、急轉彎)次數、行駛裡程、出行時間、超速次數等數據,然後對這些數據進行分類、合併,並存儲到分布式資料庫HBase中。HBase是一種基於Hadoop的項目,也稱Hadoop分布式文件系統(HDFS,Hadoop Distributed File System)。它是一個非結構化數據存儲的分布式資料庫,使用Zookeeper管理集群,在架構層面上分為Master(Zookeeper中的leader)和多個區域伺服器(RS,RegionServer)。基本架構如下,RS是集群中的一個節點,每個RS可以負責管理多個Region,每個Region只能被一個RS提供服務,HBase中需要多個Region來存儲數據,HBase給每個Region定義一定範圍,落在規定範圍的數據,就會分配給規定的Region,從而把負載分到各個節點上,這就是分布式存儲的過程及優點YARN(Yet Another Resource Negotiator)是布式集群的資源管理器。MapReduce1架構是在整個集群上執行Map和Reduce任務並報告結果,但在大型集群時,當集群節點超過一定量時,就會出現級聯故障,級聯故障通過網絡泛洪形式導致整個集群嚴重惡化。為了克服MapReduce1的這種缺陷,採用YARN分層集群管理框架的技術,能使集群共享、可伸縮和更可靠。YARN分層結構是資源管理程序ResourceManager將各部分資源傳給基礎節點代理程序NodeManager,NodeManager啟動和監視基礎應用程式執行和資源管理(CPU、內存等資源分配)。
Spark是一個基於內存計算的集群計算系統,它的核心是彈性分布式數據集(RDD,Resilient Distributed Datasets),Spark的所有操作基於RDD,RDD是容錯的、並行的數據結構,RDD是一個不可修改的分布的對象集合。每個RDD由多個分區組成,每個分區可以同時在集群中的不同節點上計算,RDD的分區特性與並行計算能力,使得Spark可以更好地利用可伸縮的硬體資源。若將分區與持久化二者結合起來,就能更加高效地處理海量數據。
本發明對於1000輛汽車數據進行收集,並分析處理駕駛行為相關數據信息,如四急、行駛裡程、最大瞬時速度和出行的時間。如圖3所示,是基於駕駛行為分別從每天駕駛的距離、每天四急的次數總和、最大速度和最晚出行時間四個方面所得數據的柱狀圖,通過這些數據的分析,得出相應的駕駛行為處理結果,為本發明中大數據時代下的UBI車保險方案提供有力證據。
數據建模分析是針對預處理提取的數據特徵,得到想要的結果。在數據提取後,常使用的是Spark算法。Spark常用的應用有Spark SQL、Spark Streaming、MLLib、Graph等。Spark SQL使用RDD實現SQL查詢;Spark Streaming流式計算,提供實時計算功能;GraphX圖計算框架,實現了基本的圖計算功能,常用圖算法和pregel圖編程框架;MLLib機器學習庫,提供常用分類、聚類、回歸、交叉檢驗等機器學習算法並行實現,如樸素貝葉斯、邏輯回歸、決策樹、神經網絡、TFIDF、協同過濾等算法,在ML lib裡面已經存在,只需要將數據帶入調用比較方便。
本發明提出的UBI系統對不同的駕駛行為給予不同的保險費率,並提供個性化的增值服務。在大數據分析處理後,該系統提供的機動車輛保險的實施方案如下:給每個用戶每天設置一個基總分數值如100分,四急/每日行駛總裡程/每日超速次數/每日夜間行駛時間按5:2:2:1分配總分值,即50分/20分/20分/10分。
如下表1格是根據駕駛行為制定的評分規則,通過累計的得分多少,判斷一個人的駕駛行為的優良性。
表1
根據方案累計一年的得分情況記為Sum,駕駛的天數即算入計算分數的天數為Day,平均得分記為Avg:
Avg=Sum/Day
為了防止惡意做假行為,天數Day有一定的規定:若Day<100天,視為最低等級,100≤Day<250,則在原來的Sum上乘一定比例50%,若Day≥250則按照原Sum計算。
根據Avg分析給不同克服分為不同的等級Avg≥80是為五星級客戶,60≤Avg<80四星,40≤Avg<60三星,20≤Avg<40二星,0≤Avg<20一星級客戶。不同星級的客戶可以承擔不同車保險費率,保險公司應獎勵優質客戶(即星級高的客戶),在下一年的保險中給予優惠活動,同時,懲罰劣質用戶(即星級低的客戶),可以提高來年投保車輛的保險費率。此外,獲取的數據還可以為客戶提供個性化服務,如根據駕駛習慣和經常去的地方,適時為其推薦地方特色和商店活動信息,對於駕駛行為不良的用戶給予及時提醒等服務。
圖4是本發明基於大數據技術下的UBI系統預測方法的流程圖,從中可以看出,本發明的預測方法首先是基於車聯網大數據的技術框架下,應用智能車載終端OBD,對車輛行駛數據和駕駛行為信息進行收集存儲,並進行數據處理;之後進行分析建模,以及在分析建模的基礎上給出合理的車險預測方案,並針對用戶的個性化服務要求進行模塊化的系統分析和處理。最後在駕駛行為分析研究的基礎上,給出車險預測模型和UBI車險定價策略。