一種日誌數據的圖形展現方法和圖像展現裝置與流程
2023-08-10 06:31:11 2

本發明涉及數據處理技術領域,具體涉及一種日誌數據的圖形展現方法和圖像展現裝置。
背景技術:
隨著大數據在各個領域的不斷普及,對於數據呈現的重視程度也越來越高,現有的方案,基於大數據圖形化展示定製系統,針對海量數據,提供了多種圖形展示方案,例如柱狀圖、線條圖、氣泡圖等。但是,基於大數據信息的多維化、立體化要求,使得簡單的柱狀圖、線條圖形展示方式不能滿足大數據呈現的複雜需求。複雜的氣泡圖、股票圖等圖形又無法體現日誌數據的針對性及特殊性。按照父節點、子節點數據進行樹形結構展示的方式又無法滿足當前各企業對於數據可讀性的基礎需求,降低了大數據平臺上的日誌分析的可讀性、實用性。
技術實現要素:
本發明提供了一種日誌數據的圖形展現方法和圖像展現裝置,以解決現有的日誌數據的圖形展現方案存在的無法體現日誌數據的針對性以及降低了日誌分析的可讀性、實用性的問題。
根據本發明的一個方面,提供了一種根據預設的關鍵字組對指定業務的原始日誌數據逐條進行分詞提取處理,得到每條原始日誌數據對應的一條數據並保存到指定資料庫中;
其中,該條數據包括關鍵字以及關鍵字對應的值;關鍵字屬於關鍵字組,關鍵字對應的值是從原始日誌數據中通過分詞提取對應得到的;預設關鍵字組中包含一個或多個關鍵字;
根據用戶選擇的一個或多個關鍵字,對指定資料庫中的數據進行分類統 計,得到關於用戶選擇的一個或多個關鍵字的分類統計結果;
根據分類統計結果生成對應的餅圖。
可選地,預設關鍵字組是根據指定業務的日誌數據特性確定的。
可選地,當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;
根據層級關聯分類統計結果,生成對應的多級餅圖。
可選地,當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;根據層級關聯分類統計結果,生成對應的多級餅圖包括:
對指定資料庫中的數據,統計第一級關鍵字對應的值的總數量A,並根據第一級關鍵字對應的值的不同進行分類統計,得到第一級關鍵字對應的每一類值的數量B,分別計算每一類值的數量B佔總數量A的第一比例M;根據第一比例M計算第一級關鍵字對應的每一類值的數量B在第一級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成第一級餅圖;
對指定資料庫中的數據,在第一級關鍵字對應的每一類值的數量B內,按照第二級關鍵字對應的值的不同進行分類統計,得到第二級關鍵字對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;根據第二比例N計算第二級關鍵字對應的每一類值的數量C在第二級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成關聯的第二級餅圖。
可選地,根據第一比例M計算第一級關鍵字對應的每一類值的數量B在第一級餅圖中的起止角度以及所佔面積包括:
通過如下公式計算第一級關鍵字對應的每一類值的數量B在第一級餅圖中的起止角度:
終止角度=K+2πM,其中,K是第一級餅圖的起始角度,K等於0°或者K等於第一級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,π為常數;
通過如下公式計算第一級關鍵字對應的每一類值的數量B在第一級餅圖中的所佔面積:
所佔面積=πMr2,其中,r為第一級餅圖所在的圓的半徑,是一個常數,M是第一比例;
根據第二比例N計算第二級關鍵字對應的每一類值的數量C在第二級餅圖中的起止角度以及所佔面積包括:
通過如下公式計算第二級關鍵字對應的每一類值的數量C在第二級餅圖中的起止角度:
終止角度=K+2πMN,其中,K是第二級餅圖的起始角度K=0°或者K等於第二級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,N是第二比例,π為常數;
通過如下公式計算第二級關鍵字對應的每一類值的數量C在第二級餅圖中的所佔面積:
所佔面積=πMN(R2-r2),其中,M是第一比例,N是第二比例,R是第二級餅圖所在的圓的半徑,為一常數,r是第一級餅圖所在的圓的半徑,為一常數。
根據本發明的另一個方面,提供了一種日誌數據的圖像展現裝置,該裝置包括:
數據處理單元,用於根據預設的關鍵字組對指定業務的原始日誌數據逐條進行分詞提取處理,得到每條原始日誌數據對應的一條數據並保存到指定資料庫中;其中,該條數據包括關鍵字以及關鍵字對應的值;關鍵字屬於關鍵字組,關鍵字對應的值是從原始日誌數據中通過分詞提取對應得到的;預設關鍵字組中包含一個或多個關鍵字;
統計單元,用於根據用戶選擇的一個或多個關鍵字,對指定資料庫中的數據進行分類統計,得到關於用戶選擇的一個或多個關鍵字的分類統計結果;
圖形展現單元,用於根據分類統計結果生成對應的餅圖。
可選地,數據處理單元,具體用於根據指定業務的日誌數據特性確定預設關鍵字組。
可選地,統計單元包括:多個關鍵字統計單元;
多個關鍵字統計單元,用於當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;
圖形展現單元,用於根據層級關聯分類統計結果,生成對應的多級餅圖。
可選地,多個關鍵字統計單元,具體用於對指定資料庫中的數據,統計第一級關鍵字對應的值的總數量A,並根據第一級關鍵字對應的值的不同進行分類統計,得到第一級關鍵字對應的每一類值的數量B,分別計算得到的每一類值的數量B佔總數量A的第一比例M;以及,對指定資料庫中的數據,在第一級關鍵字對應的每一類值的數量B內,按照第二級關鍵字對應的值的不同進行分類統計,得到第二級關鍵字對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;
圖形展現單元,用於根據第一比例M計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成第一級餅圖;以及,根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成關聯的第二級餅圖。
可選地,圖形展現單元,具體用於通過如下公式計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度:
終止角度=K+2πM,其中,K是第一級餅圖的起始角度K等於0°或者K等於第一級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,π為常數;
通過如下公式計算第一級關鍵字對應的每一類值在第一級餅圖中的所佔面積:
所佔面積=πMr2,其中,r為第一級餅圖所在的圓的半徑,是一個常數,M是第一比例;
根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起 止角度以及所佔面積包括:
通過如下公式計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度:
終止角度=K+2πMN,其中,K是第二級餅圖的起始角度K=0°或者K等於第二級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,N是第二比例,π為常數;
通過如下公式計算第二級關鍵字對應的每一類值在第二級餅圖中的所佔面積:
所佔面積=πMN(R2-r2),其中,M是第一比例,N是第二比例,R是第二級餅圖所在的圓的半徑,為一常數,r是第一級餅圖所在的圓的半徑,為一常數。
本發明的有益效果是:本發明實施例的這種日誌數據的圖形展現方法和圖形展現裝置,按照預設的關鍵字組,利用分詞提取處理技術對日誌監控系統中的原始日誌數據進行自動切割、分離,將分離後的結果作為關鍵字對應的值,根據用戶對關鍵字的選擇,統計用戶所選的每個關鍵字對應的值,得到統計結果,或者根據用戶所選關鍵字之間的聯繫,形成多級關聯的統計結果,然後將統計結果以對應餅圖的方式展示。改變了現有技術中圖形展現方式對樹形結構數據的簡單鑽取模式,靈活的將日誌數據之間的數據結構簡潔、直觀的展現在用戶面前,增強了日誌數據的統計結果的可讀性及可用性。
附圖說明
圖1是本發明一個實施例的一種日誌數據的圖形展現方法的流程圖;
圖2是本發明又一個實施例日誌數據的圖形展現方法完整實現流程圖;
圖3是本發明一個實施例的網站訪問業務的原始日誌數據示意圖;
圖4是本發明一個實施例提供的對原始日誌數據進行分詞提取處理得到對應的一條數據的示意圖;
圖5是本發明一個實施例的多個關鍵字之間的結構示意圖;
圖6是本發明一個實施例中生成的第一級餅圖的示意圖;
圖7是本發明一個實施例中生成的兩級餅圖的示意圖;
圖8是本發明一個實施例提供的一種日誌數據的圖形展現裝置的框圖。
具體實施方式
本發明的核心思想是:針對大數據平臺下的日誌數據圖形展示,直觀性、可讀性、可用性不佳的問題,基於大數據平臺下日誌數據的內在結構規律,利用分詞提取處理技術按照預設的關鍵字組對原始日誌數據進行標記,獲取原始日誌數據對應的統計數據,根據用戶對關鍵字的選擇確定餅圖的顯示層級,並對統計數據進行數據鑽取,獲得每個關鍵字對應的統計結果,結合關鍵字之間的聯繫,進一步形成多級關聯的統計結果,從而利用該多級關聯的統計結果生成多級餅圖,這樣用戶通過多級餅圖可以直觀的查看到所選關鍵字的分布情況和統計結果以及該關鍵字與其他層級關鍵字的統計結果之間的關聯關係,一目了然,提高了日誌數據的可讀性和可用性。
圖1是本發明一個實施例的一種日誌數據的圖形展現方法的流程圖,參見圖1,
步驟S11,根據預設的關鍵字組對指定業務的原始日誌數據逐條進行分詞提取處理,得到每條原始日誌數據對應的一條數據並保存到指定資料庫中;
其中,該條數據包括關鍵字以及所述關鍵字對應的值;所述關鍵字屬於所述關鍵字組,所述關鍵字對應的值是從所述原始日誌數據中通過分詞提取對應得到的;所述預設關鍵字組中包含一個或多個關鍵字;
步驟S12,根據用戶選擇的一個或多個關鍵字,對所述指定資料庫中的數據進行分類統計,得到關於所述用戶選擇的一個或多個關鍵字的分類統計結果;
步驟S13,根據所述分類統計結果生成對應的餅圖。
經過圖1所示的步驟,本發明實施例的這種日誌數據的圖形展現方法實現了大數據平臺下對日誌分析統計結果以對應的餅圖展現,改善了針對大數據領域數據呈現方式單調的現狀。結合大數據平臺下數據種類多樣化的特點,餅圖展現方式突破了現有線圖、柱圖的局限性,靈活的將數據之間的網絡結構簡潔、直觀的展現在用戶面前。利用了日誌內容的結構規律性,全面增強了對大數據平臺中日誌數據統計結果展示的可讀性及實用性。
在圖1所示的方法中,預設的關鍵字組是根據指定業務的特點進行確定的。也就是說,不同業務的日誌數據,預設的關鍵字組中的關鍵字可能不同。以下以大數據平臺中的網頁訪問類日誌數據為例,對本發明的這種日誌數據的圖形展現方法進行具體說明。
圖2是本發明又一個實施例日誌數據的圖形展現方法完整實現流程圖,參見圖2,本發明又一個實施例中日誌數據的圖形展現方法包括步驟S21至步驟S26。
流程開始,執行步驟S21,實時批量採集原始日誌數據信息;
圖3是本發明一個實施例的網站訪問業務的原始日誌數據示意圖,結合圖3,圖3示出了一段時間內某公司內部網站訪問日誌數據的示意圖,在圖3中示出了採集到的20條原始日誌數據信息。
步驟S22,按照預設的關鍵字組,逐條進行分詞提取;
在步驟S21得到的原始日誌數據信息的基礎上,按照預設的關鍵字組,逐條進行分詞提取處理,得到原始日誌數據對應的一條數據,在這條數據中包括:關鍵字以及關鍵字對應的值,其中,關鍵字是關鍵字組中的關鍵字,而關鍵字對應的值則是從原始日誌數據中通過分詞提取技術分離出來的。
圖4是本發明一個實施例提供的對原始日誌數據進行分詞提取處理得到對應的一條數據的示意圖,結合圖4,在圖3所得的20條數據的基礎上,逐條進行分詞提取(分詞提取是把原始的一條日誌,按照關鍵詞進行分詞,把原始日誌中的對應數據提取出來作為關鍵字的值,這樣原始的日誌數據就可以通過關鍵詞以及關鍵詞的值這樣的一條數據來表示),得到每條原始日誌數據對應的一條數據。在圖4中示意出了7個關鍵字,分別為:timestamp、requestpath、clientip、status、method、resplen、version;
步驟S23,對屬於同一條原始日誌數據的不同關鍵字進行標記,得到原始日誌數據對應的一條數據;
本實施例中,預設關鍵字組中包括多個關鍵字,對屬於同一條原始日誌數據的不同關鍵字進行標記(也就是說對一條原始的日誌數據利用關鍵詞,從這條原始日誌數據中把關鍵詞對應的值取出來,形成一條新數據,每個原始日誌數據都按照這種提取過程,則每條原始日誌數據都可以對應得到一條 新數據,這條新數據就相當於對原始的日誌數據進行了標記),從而得到屬於同一條原始日誌數據的不同關鍵字對應的值。參見圖4,還示意出了7個關鍵字對應的值,例如關鍵字clientip對應的值2.2.1.1。也就是說,將原始日誌數據分割成多個片段,轉換成了圖4中所示的一條數據。而7個關鍵字對應的值都來自於一條原始日誌數據(如圖3所示),這樣對20條原始日誌數據進行分詞提取和標記處理後,可以對應得到20條如圖4所示的數據。
需要說明的是,圖4是按照預設的關鍵字組中的7個關鍵字對得到的20條原始日誌數據中的每一條進行標記的示意圖。在本發明的其他實施例中,可以選取不同數量的關鍵字將原始日誌數據進行分割,不限於本實施例中的7個關鍵字。
步驟S24,接收用戶對關鍵字的選擇;
圖5是本發明一個實施例的多個關鍵字之間的結構示意圖,參見圖5,將20條原始日誌數據按照預設的7個關鍵字進行分詞提取和標記後,得到20條對應的數據。這樣一條數據中的關鍵字之間形成了一種網狀結構。本實施例的這種關鍵字網狀結構中每個關鍵字和剩餘的6個關鍵字都是平級的關聯關係,不同於現有技術的關鍵字之間上下級依賴關係的樹形結構。這種網狀結構方便用戶直觀選擇和自由組合,用戶對哪個關鍵字感興趣,可以在網狀結構中選擇一個關鍵字,後續再根據該關鍵字的分類統計結果生成對應的餅圖並展現。
步驟S25,將所選關鍵字按照層級關聯情況統計關鍵字對應的值,得到層級關聯統計結果;
當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;根據層級關聯分類統計結果,生成對應的多級餅圖。用戶選擇了關鍵字後,根據圖4所示的數據進行統計,由於關鍵字對應的值的不同,我們可以得到每個關鍵字對應的值的分類統計結果,當用戶只選擇了一個關鍵字時,例如,用戶選擇了clientip這個關鍵字後,在20條如圖4所示的數據中,統計clientip對應的值的分類統計結果。後續再生成一級餅圖,以餅圖的形式展現出這種分類統計結果。當用戶選擇了多個關鍵字時,為了增強日誌數據 的可讀性以及實用性,本發明的這種方法還需要根據多個關鍵字之間的關聯關係,得到層級關聯統計結果。也就是說,根據用戶的選擇確定關鍵字之間的級別,如果用戶選擇多個關鍵字,那麼先確定第一級關鍵字,然後確定第二級關鍵字,根據第二級關鍵字的分類統計結果以及第二級關鍵字的與第一級關鍵字的關聯關係,生成兩級關聯的統計結果。
步驟S26,根據層級關聯統計結果,生成多級餅圖。流程結束。
根據步驟S25中得到的層級關聯統計結果生成多級餅圖。這裡的多級餅圖是在用戶選擇了多個關鍵字時的圖形展現方式,如果用戶只選擇了一個關鍵字,則可以只生成該一個關鍵字對應的一級餅圖。對此不作限制。
以下結合圖3-圖5對本發明實施例的這種對日誌數據的圖形展現方法進行具體說明。
本實施例中用戶選擇的關鍵字為兩個,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的兩個關鍵字的層級關聯分類統計結果;根據層級關聯分類統計結果,生成對應的多級餅圖。結合圖3和圖5,用戶在圖5所示的網狀結構中選擇了帶展現的關鍵字clientip和status進行分級統計,且用戶選中了將關鍵字clientip的統計結果作為第一級展現,將關鍵字status的統計結果作為第二級展現。
本實施例中,對指定資料庫中的數據,統計第一級關鍵字對應的值的總數量A,並根據第一級關鍵字對應的值的不同進行分類統計,得到第一級關鍵字對應的每一類值的數量B,分別計算得到的每一類值的數量B佔總數量A的第一比例M;根據第一比例M計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成第一級餅圖;對指定資料庫中的數據,在第一級關鍵字對應的每一類值的數量B內,按照第二級關鍵字對應的值的不同進行分類統計,得到第二級關鍵字對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成關聯的第二級餅圖。
這裡,指定資料庫中存儲的數據即圖4所示的數據,由於圖3中批量採 集的是20條日誌數據,對日誌數據進行分詞提出的圖4所示的數據是和圖3所示的數據對應的,所以指定資料庫中存儲的數據數量也為20。本發明實施例的方法先按照第一級關鍵字對指定資料庫中的20條數據進行統計。具體的,根據圖3所示的原始日誌數據信息可知,第一級關鍵字對應的值的總數量A等於20。clientip對應的值有兩類分別為2.2.1.1和192.168.22.102,並且在圖3採集到的20條日誌數據中,clientip為2.2.1.1日誌條數和192.168.22.102日誌條數均為10(即第一級關鍵字對應的每一類值的數量B等於10)。計算得到每一類值的數量B佔總數量A的第一比例M均為50%。
接著,對指定資料庫中的數據在第一級關鍵字對應的每一類值的數量B(10條)內,按照第二級關鍵字status對應的值的不同進行分類統計,得到第二級關鍵字status對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N。具體的,clientip為2.2.1.1的10條日誌數據信息中有200、302、304三種status,三種status對應的日誌條數分別為8條,1條和1條,即第二級關鍵字對應的每一類值的數量C,分別佔到了clientip為2.2.1.1的日誌信息總條數的80%,10%和10%,即第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;
clientip為192.168.22.102的日誌數據信息有200、304兩種status,兩種status分別為1條和9條,即第二級關鍵字對應的每一類值的數量C,佔到了clientip為192.168.22.102的日誌信息總條數的10%和90%,即第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N。
得到層級關聯分類統計結果信息後,根據第一比例M生成第一級關鍵字對應的不同值的數量B在第一級餅圖中的起止角度和所佔面積。具體的,通過下面的公式進行計算:
終止角度=K+2πM
其中,K為起始角度,K=0°,M是各clientip與總日誌條數的比值。
例如,clientip為2.2.1.1的統計結果為10條,而總日誌條數為20條,則 M=50%,終止角度為180°。由此可知,clientip為2.2.1.1的統計結果在第一級餅圖中的起止角度為0°至180°;
clientip為192.168.22.102的統計結果,K=180°(即相鄰的clientip為2.1.1.1的數量所對應的終止角度),M=50%,終止角度為360°,由此可知,clientip為192.168.22.102的統計結果在第一級餅圖中的起止角度為180°至360°。
需要說明的是,本實施例中以clientip為2.2.1.1的統計結果的起始角度為0°,可以理解在本發明的其他實施例中,可以將clientip為192.168.22.102的統計結果的起始角度作為0°,對此不作限制。
接下來,分別計算clientip為192.168.22.102的統計結果和2.2.1.1的統計結果在第一級餅圖中所佔的面積:
所佔面積=πMr2
r為第一級餅圖所在的圓的半徑,是一個常數,本實施例中,r=5,M是第一比例,這裡M=50%;
通過計算可知,clientip為2.2.1.1的統計結果在第一級餅圖中所佔面積為12.5π;clientip為192.168.22.102的統計結果在第一級餅圖中所佔面積為12.5π。
根據上述clientip對應的值的分類統計結果的起止角度和所佔面積,生成第一級餅圖。圖6是本發明一個實施例中生成的第一級餅圖的示意圖,參見圖6,圖6中大圓代表總日誌數量,右半圓代表關鍵字clientip對應的值為2.2.2.1時的統計結果,左半圓代表關鍵字clientip對應的值為192.168.22.102時的統計結果。
通過圖6所示的餅圖,可以直觀、簡潔的看出大數據平臺下採集的原始日誌數據的分類統計結果情況,更加具有直觀性和可讀性。
接下來,根據用戶對status的選擇以及status在clientip對應的值的分類統計結果的關聯關係生成兩級餅圖。具體的,計算第二層級餅圖中,status關鍵字對應的值的分類統計結果所對應的起止角度和所佔面積:
終止角度=K+2πMN
其中,K是第二級餅圖的起始角度K=0°或者K等於第二級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,N是第二比例,π為常數;
具體的,在clientip為2.2.1.1時的統計結果內:
關鍵字status對應的值為200時,起始角度K=0°,N=80%,M=50%,則終止角度為144°;
關鍵字status對應的值為302時,起始角度K=144°,N=10%,M=50%,則終止角度為162°;
關鍵字status對應的值為304時,起始角度K=162°,N=10%,M=50%,則終止角度為180°;
即clientip對應的值為2.2.1.1時,在第二級餅圖中,關鍵字status為200的統計結果所對應的起止角度為0°至144°;
關鍵字status為302的統計結果所對應的起止角度為144°至162°;
關鍵字status為304時的統計結果所對應的起止角度為162°至180°。
在clientip為192.168.22.102時的統計結果內:
status為200時,起始角度K=180°,N=10%,M=50%,則終止角度為198°;
status為304時,起始角度K=198°,N=90%,M=50%,則終止角度為360°。
即clientip為192.168.22.102,在第二級餅圖中,關鍵字status的值為200時的統計結果的起止角度為180°至198°;
關鍵字status的值為304時的統計結果所對應的起止角度為198°至360°。
通過如下公式計算第二級關鍵字對應的每一類值的數量在第二級餅圖中的所佔面積:
所佔面積=πMN(R2-r2)
其中,M是第一比例,N是第二比例,R是第二級餅圖所在的圓的半徑, 為一常數,r是第一級餅圖所在的圓的半徑,為一常數。
具體的,在clientip的值為2.2.1.1的統計結果內,
Status值為200時,R=7,r=5,N=80%,M=50%,則Status值為200的統計結果所佔面積為9.6π;
status值為302,R=7,r=5,N=10%,M=50%,則status值為302的統計結果所佔面積為1.2π;
status值為304時,R=7,r=5,N=10%,M=50%,則所佔面積為1.2π。
即clientip為2.2.1.1,在第二級餅圖中,status為200的關鍵字所佔面積為9.6π;status為302的關鍵字所佔面積為1.2π;status為304的關鍵字所佔面積為1.2π。
在關鍵字clientip對應的值為192.168.22.102的統計結果內:
關鍵字status值為200時,R=7,r=5,N=90%,M=50%,則status值為200對應所佔的面積為10.8π;
關鍵字status值為304時,R=7,r=5,N=10%,M=50%,則status值為304對應所佔的面積為1.2π。
即clientip值為192.168.22.102時,在第二級餅圖中,status為200的統計結果所佔面積為10.8π;status為304的統計結果所佔面積為1.2π。
根據上述第二級餅圖中關鍵字status的分類統計結果生成第二級餅圖。圖7是本發明一個實施例中生成的兩級餅圖的示意圖,參見圖7,第二級餅圖所在的圓與第一級餅圖所在的圓之間滿足同心圓的關係。
本實施例中,第二級餅圖所在的圓的半徑為7,而第一級餅圖所在的圓的半徑為5。在圖6所示的一級餅圖的基礎上,圖7所示的兩級餅圖上直觀顯示了關鍵字status的分布情況,及其與clientip的層級關聯關係。具體的
在關鍵字clientip的值為2.2.1.1的統計結果對應的第一級餅圖右半圓的外環上,分別展現關鍵字status的分類統計結果,即status值為200的統計結果分布情況、status值為302的統計結果分布情況以及status值為304的統計結果分布情況。圖7靈活的將原始日誌數據信息分統計分析結果簡潔、直 觀的顯示給用戶,通過分層級展現更加具有可讀性和可用性。
由圖6和圖7可知,本發明實施例的這種日誌數據的圖形展現方法提供一種大數據平臺上對日誌數據分析統計結果的多級呈現。採用多級餅圖的形式將日誌數據中各關鍵字對應的值的統計結果關聯後,進行多維度、立體化的數據呈現。不局限於現有中的樹形結構,通過基於關鍵字內在聯繫的網狀結構,用戶可以靈活的選擇、組合,並經過處理後形成關鍵字的多級關聯統計結果,最終將數據鑽取的統計結果以多級餅圖(或者扇形圖)的方式分層級的展示在同一頁面中。實現直觀、形象的對日誌數據進行分層級展示,極大地提高了日誌數據的統計結果的可讀性及可用性。
圖8是本發明一個實施例提供的一種日誌數據的圖形展現裝置的框圖,參見圖8,該日誌數據的圖形展現裝置80包括:數據處理單元801,用於根據預設的關鍵字組對指定業務的原始日誌數據逐條進行分詞提取處理,得到每條原始日誌數據對應的一條數據並保存到指定資料庫中;其中,該條數據包括關鍵字以及關鍵字對應的值;關鍵字屬於關鍵字組,關鍵字對應的值是從原始日誌數據中通過分詞提取對應得到的;預設關鍵字組中包含一個或多個關鍵字;
統計單元802,用於根據用戶選擇的一個或多個關鍵字,對指定資料庫中的數據進行分類統計,得到關於用戶選擇的一個或多個關鍵字的分類統計結果;
圖形展現單元803,用於根據分類統計結果生成對應的餅圖。
在本發明的一個實施例中,數據處理單元801,具體用於根據指定業務的日誌數據特性確定預設關鍵字組。
在本發明的一個實施例中,統計單元802包括:多個關鍵字統計單元;
多個關鍵字統計單元,用於當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;
圖形展現單元803,用於根據層級關聯分類統計結果,生成對應的多級餅圖。
在本發明的一個實施例中,多個關鍵字統計單元,具體用於對指定資料庫中的數據,統計第一級關鍵字對應的值的總數量A,並根據第一級關鍵字對應的值的不同進行分類統計,得到第一級關鍵字對應的每一類值的數量B,分別計算得到的每一類值的數量B佔總數量A的第一比例M;以及,對指定資料庫中的數據,在第一級關鍵字對應的每一類值的數量B內,按照第二級關鍵字對應的值的不同進行分類統計,得到第二級關鍵字對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;
圖形展現單元803,用於根據第一比例M計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成第一級餅圖;以及,根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成關聯的第二級餅圖。
在本發明的一個實施例中,圖形展現單元803,具體用於通過如下公式計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度:
終止角度=K+2πM,其中,K是第一級餅圖的起始角度K等於0°或者K等於第一級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,π為常數;
通過如下公式計算第一級關鍵字對應的每一類值在第一級餅圖中的所佔面積:
所佔面積=πMr2,其中,r為第一級餅圖所在的圓的半徑,是一個常數,M是第一比例;
根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度以及所佔面積包括:
通過如下公式計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度:
終止角度=K+2πMN,其中,K是第二級餅圖的起始角度K=0°或者K等於第二級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,N是 第二比例,π為常數;
通過如下公式計算第二級關鍵字對應的每一類值在第二級餅圖中的所佔面積:
所佔面積=πMN(R2-r2),其中,M是第一比例,N是第二比例,R是第二級餅圖所在的圓的半徑,為一常數,r是第一級餅圖所在的圓的半徑,為一常數。
需要說明的是,本實施例中的這種日誌數據的圖形展現裝置是和前述實施例中的日誌數據的圖形展現方法相對應的,本實施例中的日誌數據的圖形展現裝置的實現步驟可以具體參見前述日誌數據的圖形展現方法部分的說明,這裡不再贅述。
綜上可知,本發明實施例的技術方案基於大數據平臺對日誌分析統計結果的多級餅圖呈現,改善了針對大數據領域數據呈現方式單調的現狀。結合大數據平臺下數據種類多樣化的特點,本實施例的多級餅圖突破了現有線圖、柱圖的局限性,動態選擇、自由組合日誌關鍵字的手段,改變了現有多級餅圖中對樹狀數據結構展示的簡單鑽取模式,靈活的將數據之間的網絡結構簡潔、直觀的展現在用戶面前,增強了對日誌數據統計結果展示的可讀性及實用性。
以上所述僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發明的保護範圍內。