新四季網

應急聯動警情自動分類系統的製作方法

2023-05-31 11:41:11


專利名稱::應急聯動警情自動分類系統的製作方法
技術領域:
:本發明屬計算機系統的數據處理範疇,涉及根據概率進行數據的分類處理。
背景技術:
:城市的報警系統,與城市的現代化建設和人民的生活質量息息相關。單一的報警系統已經遠遠不能滿足現代發展的需要,應急聯動系統己經成為發展的必然趨勢。集公安(110)、消防(119)、交警(122)、急救(120)、防洪、防震、防災、森林防火、環保及其它相關的需要及時響應的應急事件處理部門於一體,實現多警種和多個職能部門統一接警、聯動處警的集成聯動系統,是適應現代發展的結果。現有國內的應急聯動警情系統,大都是將以往的各級硬體資源,設施,通過各種通訊網絡的方式聯繫在一起。雖然硬體投資大,建設規格較高,但是,普遍存在軟體建設落後的情況。特別是接警部分,幾乎全部採用人工判斷的方式。即接警人員收到報警信息後,判斷報警信息的類型,認為是110,120,122,或119中的一種,然後在此基礎上進行調度。人工接警分類的缺點是反應速度慢,主觀性較強,分類精度較差。在這種情況下,利用先進的計算機進行輔助決策,充分發揮計算機的決策支持功能,就顯得尤為重要。而國內現有的警情聯動報警系統都不具備這一警情自動分類功能。
發明內容本發明的目的是在應急聯動系統的基礎上,建立接處警自動分類系統,作為應急聯動的重要組成部分。本系統提供一種具有自學習性和進化性的自動分類系統為應急聯動系統的大量接警信息進行自動分類,以減少接警人員進行人為判別警情類別的工作量,極大提高接警工作的效率、分類精確度和可靠性。本系統還可作為一個接處警系統單獨使用。本發明的目的是這樣達到的一種應急聯動警情自動分類系統,其特徵在於警情自動分類系統作為應急聯動系統的一個重要部分,設立在接警和分級分類處警系統之間。與應急聯動系統共享資料庫數據,支持應急聯動系統使用的GIS地理信息系統、GPS衛星定位系統以及視頻監控系統。其核心部件是分類器。分類器是一套計算機數據處理系統,在分類器中利用一種改進的貝葉斯算法進行警情的自動分類。分類的過程包括構建分類器和分類器工作兩部分,分類器採用機器學習的原理,用歷史警情信息數據作為學習數據,採用改進的樸素貝葉斯算法來構造;構建分類器的步驟是(1)輸入歷史警情數據;(2)對報警信息進行規格化,生成標準的警情矢量信息;(3)用改進的樸素貝葉斯自動分類算法來構造分類器;(4)對分類結果進行評估;(5)用評估結果對分類器進行改進;分類器工作的步驟是(1)輸入新的警情數據;(2)用分類器進行分類;(3)檢驗修正分類結果;(4)存儲分類結果。所述貝葉斯警情自動分類算法構建分類器的流程如下(1)、首先對歷史報警信息數據集進行訓練,根據具體的需要與要求建立相應類型的報警信息集合;(2)、規格化報警信息,生成標準的警情矢量信息,分別處理各種不同類別的報警fe息;(3)每一個報警信息集合對應一個哈西表,建立表中存儲的TOKEN串到詞頻的映射關係;(4)、計算每個哈希表中TOKEN串出現的概率P,P=(某TOKEN串的詞頻)/(對應哈希表的長度);(5)、綜合考慮所有哈西表中TOKEN串出現的概率,推斷出當新來的報警信息中出現某個TOKEN串時,該報警信息為以上任何一個範疇的概率;(6)、對每個類別的報警信息,逐個計算?"1|"')(1=1,2,...11;」=1,2...[10,建立新的哈希表hashtable—probability_i存儲TOKEN串tj到P(Ai|tj)的映射(j-0,1,…m,m表示屬於i類報警信息的字符串總數,i=l,2,-n,n表示報警類別總數);(7)、至此,以上各類報警信息集合的學習過程結束,根據建立的哈希表hashtable—probability—i估計新到達的、已經生成標準的警情矢量的報警信息屬於何類報警類型。所述規格化報警信息,生成標準的警情矢量信息的具體方法如下提取報警信息中出現的獨立字符串,得到的內容作為TOKEN串,並且統計提取出TOKEN串出現的次數即詞頻來生成矢量信息並按照上述方法分別處理各種類別報警信息集合中的所有報警信息;所述"報警信息中出現的獨立字符串"是指對於結構化的報警信息直接進行特徵字符串統計,對於無結構的文本信息選擇分詞器,通過遍歷報警信息得到符合要求的字符串。所述綜合考慮所有哈西表中TOKEN串出現的概率,推斷出當新來的報警信息中出現某個TOKEN串時,該報警信息為某一個範疇的概率用其數學表達式表達為設M事件一一報警信息為特定的某一類報警信息;(i^,2,3…n)tl,t2......tm代表TOKEN串,P(Ai|ti)表示在報警信息中出現TOKEN串ti時事件Ai發生的概率,貝formulaseeoriginaldocumentpage7推斷出當出現字符串tj時,報警信息為i類事件的概率。所述進行分類器的工作流程如下(1)輸入新的警情數據,按照報警信息規格化的要求,生成TOKEN串;(2)抽取得到關鍵字tl、t2t3……tn;(3)查詢對報警類別i對應的hashtable—probability_i得到PI,P2,PN,表示在報警信息中出現TOKEN串tj時,該報警信息屬於報警類別i的概率;(4)按照複合概率公式計算概率,根據事先設定的閥值結果判斷報警信息的類別;(5)判斷分類結果是否需要修正,若需要,修正,並將最後結果存儲。所述由複合概率公式判斷報警信息的類別方法是設報警信息共得到N個TOKEN串,tl,t2......tn,hashtable—probability_i中對應的值為PI,P2,......PN,P(Ai|tl,t2,t3……tn)表示在報警信息中同時出現多個TOKEN串tl,t2……tn,且報警信息屬於i類報警信息的概率;複合概率公式可得formulaseeoriginaldocumentpage7當P(Ailtl,t2,t3……tn)超過預定閾值a時,即可判定報警信息屬於i類報警{曰息。所述當P(Ai|tl,t2,t3……tn)超過預定閾值a時,即可判定報警信息屬於i類報警信息,是指當a的取值為0.5時,若formulaseeoriginaldocumentpage7則為第i類報警信息。所述檢驗修正分類結果是進行重複生成TOKEN串並進行判斷的過程;所述對分類結果進行評估,用評估結果對分類器進行改進是指對分類結果進行評判,對報警信息的規格化進行改進,生成新的警情矢量信息。所述P(Ai|ti)表示在報警信息中出現TOKEN串ti時事件Ai發生的概率,是設置Al表示事件"報警信息為119報警信息",A2表示事件"報警信息為110報警信息",A3表示事件"報警信息為120報警信息",A4表示事件"報警信息為122報警信息",A5表示事件"報警信息為其它類型的報警信息";通過統計報警信息樣本數據,得到了表格hashtable—119,hashtable—110,hashtable—120,hashtable—122,hashtable—other,分別存儲了字符串ti在119,110,120,122以及其它報警信息中出現的頻率PItj):=(tj在hashtable—119中對應的值),P2(tj):=(tj在hashtable—110中對應的值),P3Ctj)==(tj在hashtable—120中對應的值),P4(tj)==(tj在hashtable—122中對應的值),P5(tj)==(tj在hashtable—other中對應的值)。所述對於無結構的文本信息選擇分詞器,是選用最大匹配法分詞器。本發明具有以下積極效果1、提出了一個擴展性強的統一的報警矢量信息規範。能夠適應各種複雜的報警情況。國內目前建成的應急聯動系統,大都是將以往的各級硬體資源,設施,通過各種通訊網絡的方式聯繫在一起。硬體投資大,建設規格較高。但是普遍存在軟體建設落後的情況。未能發揮信息化帶來的真正威力。在報警信息這一塊上,多數系統存在缺乏相應的配套軟體支持。就是有,也大都存在設計簡單,涵蓋面窄等等缺點。本發明提出的統一的報警矢量信息規範。具有很好的適應性,可以根據不同的實際情況靈活配置。適應不同地區,不同部門的要求。大大降低了開發和日後維護費用。2、自動化分類報警信息,大大提高反應速度。降低判斷誤差。前面已經提到目前國內建成的應急聯動系統大都存在反應速度較慢,判斷誤差較大的特點。採用計算機輔助的自動化分類以後。能夠最大可能的減少人為因素的幹擾。做到規範化,科學化。從而大大提高反應速度,降低判斷誤差。3、本自動分類系統可對應急聯動系統的接警信息進行自動分類歸檔,使應急聯動系統能夠清晰的反映出各類警情的發生頻率,並且簡化了報警歷史數據的歸檔和査詢工作,為今後對報警歷史信息進行進一步的數據挖掘做好了鋪墊。4、適應了現代發展需要,規範工作流程,提高政府執政形象。圖1是警情自動分類系統的結構和程序流程示意圖。圖2是應急聯動系統組織結構示意圖。圖3是警情自動分類系統在應急聯動系統中的結構部署示意圖。圖4是構建分類器的程序流程圖。圖5是分類器進行分類時的流程圖。具體實施例方式從附圖可知,應急聯動系統是集公安(IIO)、消防(U9)、交警(122)、急救(120)、防洪、防震、防災、森林防火、環保及其它相關的需要及時響應的應急事件處理部門於一體,實現多個警種和多個職能部門統一接警、聯動處警的集成系統。整個系統以資料庫系統為基礎,綜合運用先進的計算機網絡技術、現代通信技術、呼叫中心技術、GIS地理信息系統技術、GPS衛星定位技術等建立和完善一個具備指揮中心及輔助決策能力的先進的應急聯動系統和指揮中心。從層次結構上來說,應急聯動系統成立統一的領導組織機構,下設若干個專業分支機構(分別設立於各相關職能部門中),將公安、消防、交警、急救、防洪、防震、防災、環保等職能部門處理各類危機事件的職能統一納入到應急機制中,實現統一接警、統一處警、統一指揮、資源共享、聯合行動,保證應急機制的快速反應、協調作戰、協調運轉。為了實現這一目標,系統必須能夠對各種不同類型的報警信息進行及時、正確、有效的處理。由於報警信息種類繁多,可能涉及到不同的應急聯動相關部門,如果能夠對報警信息進行正確分類,按照警情的等級與類別將不同的報警信息和與之相關的部門進行關聯,能夠極大的提升系統的吞吐量,增強其處理能力。而目前現有的應急聯動系統在這一方面還比較欠缺,對於報警信息大多沒有進行有效的分類處理,或者由接警人員憑經驗判斷,效率低下,判斷缺乏同一的標準,分類結果受人為因素影響較大。警情自動分類系統,能夠根據具體的需要採用不同的標準對應急聯動系統的報警信息進行自動分類,從而對報警信息進行了有效的管理,有效解決了接處警子系統人工處理效率較低的瓶頸。警情自動分類採用了機器學習的原理,用歷史警情信息數據作為學習數據,採用改進的樸素貝葉斯算法來構造分類器,這是自動分類系統的關鍵。本發明採用的是基於多項式樸素貝葉斯算法,本實施例是基於火警119報警信息,110報警信息,120報警信息,交通事故報警信息以及其它報警信息的應急聯動。同時,假定每一條報警信息必須並且只能屬於上面5種類型中的一種,並且不能同時屬於任何兩種。附圖4、5分別給出了分類器的構建和分類器工作的流程圖。從圖中知分類器的構建的具體過程是1、首先對歷史報警信息數據集進行訓練,根據具體的需要與要求建立相應類型的報警信息集合,包括119、110、120、交通事故報警和由各地具體情況決定的其它報警信息,確定總的報警類別。2、將所有的報警信息規格化,生成標準的警情矢量信息。具體方法如下提取報警信息中出現的獨立字符串如"盜竊"、"偷"、"受傷"、"火"、"追尾"等,得到的內容等作為TOKEN串,並且統計提取出的TOKEN串出現的次數即詞頻。按照上述的方法分別處理各種類別報警信集合中的所有報警信息。對於結構化的報警信息可以直接進行特徵字符串統計,對於無結構的文本信息可以根據需要選擇適當的分詞器,如最大匹配法分詞器,通過遍歷報警信息得到符合要求的字符串。3、每一個報警信息集合對應一個哈西表,例如,hashtable一119對應火警報警信息,hashtable—110對應110報警信息,hashtable—120對應120報警信息,hashtablej22對應交警報警信息.hashtable—other對應其他類型的報警信息,表中存儲TOKEN串到詞頻的映射關係。4、計算每個哈希表中TOKEN串出現的概率P二(某TOKEN串的詞頻)/(對應哈希表的長度),用概率值取代步驟3中得到的詞頻,hashtablej中存儲的是詞頻到出現頻率的映射。5、統計所有哈希表得到總的詞典表key—total。6、取一類報警類別,用i表示,事件Ai表示報警信息屬於i類報警信息,依次取總的哈希表key—total中的一個關鍵tj,計算當報警信息中出現上述tj時,報警信息屬於i的概率。(Ai|tj)=Pi(tj)/[(PI(tj)+P2(tj)+P3(tj)+P4(tj)+P5(tj)];其中Pi(tj)表示tj在hashtable—i中的值。7、檢查key—total是否已經遍歷,若沒有,繼續進行步驟6,已經完成,進入下一步。8、生成對應於報警類別i的hashtable—probability—i,存儲TOKEN串tj到P(Ai|tj)的映射。9、檢查是否所有的報警類別檢查完畢,否,回到步驟6,檢査完畢,則學習過程結束,完成分類器的構建。分類器的工作過程是1、將報警信息規格化,生成標準的警情矢量信息。2、抽取得到關鍵字tl、t2t3……tn。3、查詢對報警類別i對應的hashtable—probability—i得到PI,P2,......PN,表示在報警信息中出現TOKEN串tj時,該報警信息屬於報警類別i的概率。4、P(Ailtl,t2,t3……tn)表示在報警信息中同時出現多個tn時,該報警信息屬於類別i報警信息的概率。由複合概率公式可得P(Ailtl,t2,t3……tn)=(P1*P2*......PN)/[P1*P2*......PN+(1-PI)*(1-P2)*......(1-PN)]。5、檢査P(A|tl,t2,t3……tn)的值是否超過預先設定的閾值ci。6、超過預定閾值時,就可以判斷報警信息為屬於第i類報警信息,否則不屬於第i類報警信息。7、檢査確認已經屬於第i類報警信息,檢査所有報警類別是否檢査完畢,沒有,返回第3步,已經完成,檢查是否需要人工修正,需要,將修正結果加入訓練集合,重新訓練,若不需要,則分類工作完成,信息儲存。以上過程的偽代碼如下設A表示訓練集合(al,a2,…anK其中元素ai具有這樣的結構{stringmsg,class},stringmsg表示報警信息的文字信息,class表示已經知道的報警信息的種類),B為指定的分類類別集合{bl,b2,...bm},C為關鍵詞字典{cl,c2,...cl}。訓練過程〃生成哈希表foreachaiinA(i=0,l…n-l,n表示A中報警信息的個數)抽取ai中關鍵字形成關鍵字表key_table—ai={stringl,string2...stringn}根據以上的關鍵字表key—table—ai,生成對應的hash一ai表foreachentity—hash—aiinhash_ai(entity—hash—ai表示表hash—ai中的條目,其結構為{key(表示關鍵字),probability(表示概率)〉{計算關鍵字key出現的概率entity_hash_ai.key=key—table_ai中存在但不重複的關鍵字;entity_hash—ai.probability=nkeyi/Enkeyj(j=0,l...m-l,m表示key—table—ai中的關鍵字的個數,nkeyi表示keyi關鍵字出現的次數)〃從而得到得到對應與報警信息ai的對應的hash_ai。生成總的hashjotalforeachhash_ai(i=0,l...n-l,n表示A中報警信息的個數)抽取hash—a中不重複的關鍵字形成z總的關鍵字表key」able_total={string1,string2...stringn}〃生成概率表hash一keyi一cj(每張表記錄了出現keyi關鍵字並且屬於類別cj的概率情況foreachkeyiinkey—table—totalforeachcjinC(對於分類類別集合中的每一個類別ci)計算當出現keyi時的本報警信息屬於cj的概率〃判斷收到新報警信息axin的時候,foreachcjinC{〃對每種分類情況分別調用各自的hash—keyi—cjforeachkeyiinaxin{査詢哈希表hash—keyi—cj可得P(報警信息屬於cjlkeyi)}>a(預先設定的闡值,則報警信息屬於cj類)。〃反饋過程,將axin加入訓練集合A,重複訓練過程該算法具有良好的自學習性和進化性,並且該算法實現較為簡單且效率高,計算代價小,是一種廉價高效的警情自動分類系統。警情自動分類的過程實際是貝葉斯過濾算法的過程,例如訓練數據階段,一條報警信息含有"受傷","搶劫","兇手"字樣的110報警信息A和一條含有"受傷","追尾"字樣的122交警報警信息B以及一條含有"受傷","墜樓"字樣的120交警報警信息C。根據報警信息A生成hashtable一110,該哈希表中的記錄為"受傷"1次"搶劫"l次"兇手"i次,計算得在本表中"受傷"出現的概率為0.3"搶劫"出現的概率為0.3"兇手"出現的概率為0.3。根據報警信息B生成hashtable—122,該哈希表中的記錄為"受傷"1次"追尾"1次,計算得在本表中"受傷"出現的概率為0.5"追尾"出現的概率為0.5。根據報警信息C生成hashtablej20,該哈希表中的記錄為"受傷"1次"墜樓"1次計算得在本表中"受傷"出現的概率為0.5"墜樓"出現的概率為0.5。綜合考慮三個哈希表,共有7個TOKEN串"受傷""搶劫""兇手""追尾""墜樓"。當報警信息中出現"受傷"時,該報警信息為110報警信息的概率為P=0.3/(0.3+0.5+0.5+0)=0.23,出現"搶劫"時,該報警信息為110報警信息的概率為P=0.3/(0.3+0+0+0)=1,出現"兇手"時,該報警信息為110報警信息的概率為P=0.3/(0.3+0+0+0)=1,出現"追尾"時,該報警信息為iio報警信息的概率為-P=0/(0+0.5+0+0)=0,出現"墜樓"時,該報警信息為110報警信息的概率為P=0/(0+0+0.5+0)=0,由此可得第4個哈希表hashtable—probability,其數據為"受傷"0.23"搶劫"1"兇手"1"追尾"0"墜樓"0。當新到一條報警信息,"望江賓館發生搶劫,兇手逃離現場"的時候,我們可得到兩個TOKEN串"搶劫","兇手",查詢哈希表hashtable—probability可得P(110報警信息I"搶劫")=1P(110報警信息I"兇手")=1此時該報警信息為iio報警信息的可能性為-P=(1*1)/[1*1+(1-1)*(1-1)]=1如果我們事先定義閾值為0.5,則當P>0.5就表示信息為110報警信息,那麼,由此可推出該報警信息為110報警信息。再比如,當新到一條報警信息,"商場混亂,消費者受傷"的時候,我們可得到兩個TOKEN串:"消費者","受傷"查詢哈希表hashtable_probability可得P(110報警信息I"消費者")=0P(110報警信息l"受傷")=0.23此時該報警信息為110報警信息的可能性為P=(0*0.23)/=0再比如,當新到一條報警信息,"商場混亂,消費者受傷"的時候,我們可得到兩個TOKEN串"消費者","受傷"由此可推出該報警信息為不屬於110報警信息,得出這個消息屬於other類型。可見,貝葉斯分類算法發揮了作用。另外,如果收到一條消息"人民南路發生打鬥,有人受傷",這樣一條消息的時候,可得到一個TOKEN串:"受傷"查詢哈希表hashtable—probability可得P(110報警信息I"受傷")=0.23〈0.5,系統將不會判斷為110類型的報警信息。同樣系統也將不會判斷為120,119,122的範圍,而是其他類型。其實,這是應該進入110報警事件的範疇,之所以無法判斷,完全是因為訓練樣本過小的原因。所以,系統中有"對分類結果進行評估"的環節,通過評估分類結果是否合理,對結果加以修正。同時利用剛剛判斷處理過的樣本中提供的新信息來改進分類算法,擴大訓練數據,增加系統精度。從這個過程來看,系統運行的越久,樣本庫就越大,判斷的精度就越高。這是一個逐漸優化的過程。同時報警信息進入資料庫後,對接警信息進行自動分類歸檔,使應急聯動系統能夠清晰的反映出各類警情的發生頻率,為今後對報警歷史信息進行進一步的數據挖掘做好了鋪墊。權利要求1、一種應急聯動警情自動分類系統,其特徵在於警情自動分類系統作為應急聯動系統的一個重要部分,設立在接警和分級分類處警系統之間,與應急聯動系統共享資料庫數據,支持應急聯動系統使用的GIS地理信息系統、GPS衛星定位系統以及視頻監控系統;其核心部件是分類器,分類器是一套計算機數據處理系統,在分類器中利用一種改進的貝葉斯算法進行警情的自動分類,分類的過程包括構建分類器和分類器工作兩部分,分類器採用機器學習的原理,用歷史警情信息數據作為學習數據,採用改進的樸素貝葉斯算法來構造;構建分類器的步驟是(1)輸入歷史警情數據;(2)對報警信息進行規格化,生成標準的警情矢量信息;(3)用改進的樸素貝葉斯自動分類算法來構造分類器;(4)對分類結果進行評估;(5)用評估結果對分類器進行改進;分類器工作的步驟是(1)輸入新的警情數據;(2)用分類器進行分類;(3)檢驗修正分類結果;(4)存儲分類結果。2、如權利要求l所述的自動分類系統,其特徵在於所述貝葉斯警情自動分類算法構建分類器流程如下-(1)、首先對歷史報警信息數據集進行訓練,根據具體的需要與要求建立相應類型的報警信息集合;(2)、規格化報警信息,生成標準的警情矢量信息,分別處理各種不同類別的報警信息;(3)每一個報警信息集合對應一個哈西表,建立表中存儲的TOKEN串到詞頻的映射關係;(4)、計算每個哈希表中TOKEN串出現的概率P,P=(某TOKEN串的詞頻)/(對應哈希表的長度);(5)、綜合考慮所有哈西表中TOKEN串出現的概率,推斷出當新來的報警信息中出現某個TOKEN串時,該報警信息為以上任何一個範疇的概率;(6)、對每個類別的報警信息,逐個計算?"1|^)(1-1,2,...^^1,2...110,建立新的哈希表hashtable_probability_i存儲TOKEN串tj到P(Ai|tj)的映射(j-O,1,..'m,m表示屬於i類報警信息的字符串總數,i=1,2,…n,n表示報警類別總數);(7)、至此,以上各類報警信息集合的學習過程結束,根據建立的哈希表hashtable—probability—i估計新到達的、已經生成標準的警情矢量的報警信息屬於何類報警類型。3、如權利要求1或2所述的自動分類系統,其特徵在於所述規格化報警信息,生成標準的警情矢量信息的具體方法如下提取報警信息中出現的獨立字符串,得到的內容作為TOKEN串,並且統計提取出TOKEN串出現的次數即詞頻來生成矢量信息並按照上述方法分別處理各種類別報警信息集合中的所有報警信息;所述報警信息中出現的獨立字符串是指對於結構化的報警信息直接進行特徵字符串統計,對於無結構的文本信息選擇分詞器,通過遍歷報警信息得到符合要求的字符串。4、如權利要求2所述的自動分類方法,其特徵在於所述綜合考慮所有哈西表中TOKEN串出現的概率,推斷出當新來的報警信息中出現某個TOKEN串時,該報警信息為某一個範疇的概率用其數學表達式表達為設Ai事件一一報警信息為特定的某一類報警信息;(i=l,2,3…n)tl,t2......tm代表TOKEN串,P(Ai|ti)表示在報警信息中出現TOKEN串ti時事件Ai發生的概率,則P(Ai|U)=Pi(tj)/[(Pl(tj)+P2(tj)+P3(tj)+P4(tj)+P5(tj)]推出當出現字符串tj時,報警信息為i類事件的概率。5、如權利要求l所述的自動分類方法,其特徵在於所述進行分類器的工作流程如下(1)輸入新的警情數據,按照報警信息規格化的要求,生成TOKEN串;(2)抽取得到關鍵字tl、t2t3……tn;(3)查詢對報警類別i對應的hashtable—probability—i得到PI,P2,......PN,表示在報警信息中出現TOKEN串tj時,該報警信息屬於報警類別i的概率;(4)按照複合概率公式計算概率,根據事先設定的閥值結果判斷報警信息的類別;(5)判斷分類結果是否需要修正,若需要,修正,並將最後結果存儲。6、如權利要求5所述的自動分類方法,其特徵在於所述由複合概率公式判斷報警信息的類別方法是設報警信息共得到N個TOKEN串,tl,t2tn,hashtable—probability—i中對應的值為PI,P2,......PN,P(Ai|tl,t2,t3......tn)表示在報警信息中同時出現多個TOKEN串tl,t2……tn,且報警信息屬於i類報警信息的概率;複合概率公式可得P(Ai|tl,t2,t3......tn)=(P1*P2*......PN)/[P1*P2*......PN+(1-P1)*(1-P2)*......(1-PN)]當P(Ailtl,t2,t3……tn)超過預定閾值a時,即可判定報警信息屬於i類報警信息。7、如權利要求6所述的自動分類系統,其特徵在於所述當P(Ailtl,t2,t3……tn)超過預定閾值a時,即可判定報警信息屬於i類報警信息,是指當a的取值為0.5時,若P(Ailtl,t2,t3……tn)〉0.5則為第i類報警信息。8、如權利要求l所述的自動分類方法,其特徵在於所述檢驗修正分類結果是進行重複生成TOKEN串並進行判斷的過程;所述對分類結果進行評估,用評估結果對分類器進行改進是指對分類結果進行評判,對報警信息的規格化進行改進,生成新的警情矢量信息o9、如權利要求4所述的自動分類方法,其特徵在於所述P(Ailti)表示在報警信息中出現TOKEN串ti時事件Ai發生的概率,是設置Al表示事件"報警信息為119報警信息",A2表示事件"報警信息為110報警信息",A3表示事件"報警信息為120報警信息",A4表示事件"報警信息為122報警信息",A5表示事件"報警信息為其它類型的報警信息";通過統計報警信息樣本數據,得到了表格hashtable」19,hashtable—110,hashtable—120,hashtable—122,hashtable—other,分別存儲了字符串ti在119,110,120,122以及其它報警信息中出現的頻率Pl(tj)=(tj在hashtable—119中對應的值),P2(tj)=(tj在hashtable—110中對應的值),P3(tj)=(tj在hashtable—120中對應的值),P4(tj)=(tj在hashtable—122中對應的值),P5(tj)=(tj在hashtable—other中對應的值)。10、如權利要求3所述的自動分類方法,其特徵在於所述對於無結構的文本信息選擇分詞器,是選用最大匹配法分詞器。全文摘要本發明屬計算機系統的數據處理。警情自動分類系統作為應急聯動系統的一個重要部分,與應急聯動系統共享資料庫數據。其核心部件是分類器,分類器是計算機處理系統,在分類器中利用貝葉斯算法構建的軟體進行警情的自動分類。分類的過程包括構建分類器和分類器工作兩部分,分類器採用機器學習的原理,用歷史警情信息數據作為學習數據,採用改進的樸素貝葉斯算法來構造。分類時輸入新的警情數據後生成標準的警情矢量信息,根據TOKEN串出現的次數,依據預定的概率閥值,由複合概率公式判斷報警信息的類別。本分類系統不僅適應各種應急系統,也可成為獨立體系,分類快捷、準確,規範化,科學化。文檔編號G06F17/30GK101201835SQ20071005094公開日2008年6月18日申請日期2007年12月21日優先權日2007年12月21日發明者維周,颺成,李志蜀,王紅軍申請人:四川大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀