新四季網

一種日誌數據的圖形展現方法和圖像展現裝置與流程

2023-08-10 06:31:11 2


本發明涉及數據處理技術領域,具體涉及一種日誌數據的圖形展現方法和圖像展現裝置。



背景技術:

隨著大數據在各個領域的不斷普及,對於數據呈現的重視程度也越來越高,現有的方案,基於大數據圖形化展示定製系統,針對海量數據,提供了多種圖形展示方案,例如柱狀圖、線條圖、氣泡圖等。但是,基於大數據信息的多維化、立體化要求,使得簡單的柱狀圖、線條圖形展示方式不能滿足大數據呈現的複雜需求。複雜的氣泡圖、股票圖等圖形又無法體現日誌數據的針對性及特殊性。按照父節點、子節點數據進行樹形結構展示的方式又無法滿足當前各企業對於數據可讀性的基礎需求,降低了大數據平臺上的日誌分析的可讀性、實用性。



技術實現要素:

本發明提供了一種日誌數據的圖形展現方法和圖像展現裝置,以解決現有的日誌數據的圖形展現方案存在的無法體現日誌數據的針對性以及降低了日誌分析的可讀性、實用性的問題。

根據本發明的一個方面,提供了一種根據預設的關鍵字組對指定業務的原始日誌數據逐條進行分詞提取處理,得到每條原始日誌數據對應的一條數據並保存到指定資料庫中;

其中,該條數據包括關鍵字以及關鍵字對應的值;關鍵字屬於關鍵字組,關鍵字對應的值是從原始日誌數據中通過分詞提取對應得到的;預設關鍵字組中包含一個或多個關鍵字;

根據用戶選擇的一個或多個關鍵字,對指定資料庫中的數據進行分類統 計,得到關於用戶選擇的一個或多個關鍵字的分類統計結果;

根據分類統計結果生成對應的餅圖。

可選地,預設關鍵字組是根據指定業務的日誌數據特性確定的。

可選地,當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;

根據層級關聯分類統計結果,生成對應的多級餅圖。

可選地,當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;根據層級關聯分類統計結果,生成對應的多級餅圖包括:

對指定資料庫中的數據,統計第一級關鍵字對應的值的總數量A,並根據第一級關鍵字對應的值的不同進行分類統計,得到第一級關鍵字對應的每一類值的數量B,分別計算每一類值的數量B佔總數量A的第一比例M;根據第一比例M計算第一級關鍵字對應的每一類值的數量B在第一級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成第一級餅圖;

對指定資料庫中的數據,在第一級關鍵字對應的每一類值的數量B內,按照第二級關鍵字對應的值的不同進行分類統計,得到第二級關鍵字對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;根據第二比例N計算第二級關鍵字對應的每一類值的數量C在第二級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成關聯的第二級餅圖。

可選地,根據第一比例M計算第一級關鍵字對應的每一類值的數量B在第一級餅圖中的起止角度以及所佔面積包括:

通過如下公式計算第一級關鍵字對應的每一類值的數量B在第一級餅圖中的起止角度:

終止角度=K+2πM,其中,K是第一級餅圖的起始角度,K等於0°或者K等於第一級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,π為常數;

通過如下公式計算第一級關鍵字對應的每一類值的數量B在第一級餅圖中的所佔面積:

所佔面積=πMr2,其中,r為第一級餅圖所在的圓的半徑,是一個常數,M是第一比例;

根據第二比例N計算第二級關鍵字對應的每一類值的數量C在第二級餅圖中的起止角度以及所佔面積包括:

通過如下公式計算第二級關鍵字對應的每一類值的數量C在第二級餅圖中的起止角度:

終止角度=K+2πMN,其中,K是第二級餅圖的起始角度K=0°或者K等於第二級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,N是第二比例,π為常數;

通過如下公式計算第二級關鍵字對應的每一類值的數量C在第二級餅圖中的所佔面積:

所佔面積=πMN(R2-r2),其中,M是第一比例,N是第二比例,R是第二級餅圖所在的圓的半徑,為一常數,r是第一級餅圖所在的圓的半徑,為一常數。

根據本發明的另一個方面,提供了一種日誌數據的圖像展現裝置,該裝置包括:

數據處理單元,用於根據預設的關鍵字組對指定業務的原始日誌數據逐條進行分詞提取處理,得到每條原始日誌數據對應的一條數據並保存到指定資料庫中;其中,該條數據包括關鍵字以及關鍵字對應的值;關鍵字屬於關鍵字組,關鍵字對應的值是從原始日誌數據中通過分詞提取對應得到的;預設關鍵字組中包含一個或多個關鍵字;

統計單元,用於根據用戶選擇的一個或多個關鍵字,對指定資料庫中的數據進行分類統計,得到關於用戶選擇的一個或多個關鍵字的分類統計結果;

圖形展現單元,用於根據分類統計結果生成對應的餅圖。

可選地,數據處理單元,具體用於根據指定業務的日誌數據特性確定預設關鍵字組。

可選地,統計單元包括:多個關鍵字統計單元;

多個關鍵字統計單元,用於當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;

圖形展現單元,用於根據層級關聯分類統計結果,生成對應的多級餅圖。

可選地,多個關鍵字統計單元,具體用於對指定資料庫中的數據,統計第一級關鍵字對應的值的總數量A,並根據第一級關鍵字對應的值的不同進行分類統計,得到第一級關鍵字對應的每一類值的數量B,分別計算得到的每一類值的數量B佔總數量A的第一比例M;以及,對指定資料庫中的數據,在第一級關鍵字對應的每一類值的數量B內,按照第二級關鍵字對應的值的不同進行分類統計,得到第二級關鍵字對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;

圖形展現單元,用於根據第一比例M計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成第一級餅圖;以及,根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成關聯的第二級餅圖。

可選地,圖形展現單元,具體用於通過如下公式計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度:

終止角度=K+2πM,其中,K是第一級餅圖的起始角度K等於0°或者K等於第一級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,π為常數;

通過如下公式計算第一級關鍵字對應的每一類值在第一級餅圖中的所佔面積:

所佔面積=πMr2,其中,r為第一級餅圖所在的圓的半徑,是一個常數,M是第一比例;

根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起 止角度以及所佔面積包括:

通過如下公式計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度:

終止角度=K+2πMN,其中,K是第二級餅圖的起始角度K=0°或者K等於第二級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,N是第二比例,π為常數;

通過如下公式計算第二級關鍵字對應的每一類值在第二級餅圖中的所佔面積:

所佔面積=πMN(R2-r2),其中,M是第一比例,N是第二比例,R是第二級餅圖所在的圓的半徑,為一常數,r是第一級餅圖所在的圓的半徑,為一常數。

本發明的有益效果是:本發明實施例的這種日誌數據的圖形展現方法和圖形展現裝置,按照預設的關鍵字組,利用分詞提取處理技術對日誌監控系統中的原始日誌數據進行自動切割、分離,將分離後的結果作為關鍵字對應的值,根據用戶對關鍵字的選擇,統計用戶所選的每個關鍵字對應的值,得到統計結果,或者根據用戶所選關鍵字之間的聯繫,形成多級關聯的統計結果,然後將統計結果以對應餅圖的方式展示。改變了現有技術中圖形展現方式對樹形結構數據的簡單鑽取模式,靈活的將日誌數據之間的數據結構簡潔、直觀的展現在用戶面前,增強了日誌數據的統計結果的可讀性及可用性。

附圖說明

圖1是本發明一個實施例的一種日誌數據的圖形展現方法的流程圖;

圖2是本發明又一個實施例日誌數據的圖形展現方法完整實現流程圖;

圖3是本發明一個實施例的網站訪問業務的原始日誌數據示意圖;

圖4是本發明一個實施例提供的對原始日誌數據進行分詞提取處理得到對應的一條數據的示意圖;

圖5是本發明一個實施例的多個關鍵字之間的結構示意圖;

圖6是本發明一個實施例中生成的第一級餅圖的示意圖;

圖7是本發明一個實施例中生成的兩級餅圖的示意圖;

圖8是本發明一個實施例提供的一種日誌數據的圖形展現裝置的框圖。

具體實施方式

本發明的核心思想是:針對大數據平臺下的日誌數據圖形展示,直觀性、可讀性、可用性不佳的問題,基於大數據平臺下日誌數據的內在結構規律,利用分詞提取處理技術按照預設的關鍵字組對原始日誌數據進行標記,獲取原始日誌數據對應的統計數據,根據用戶對關鍵字的選擇確定餅圖的顯示層級,並對統計數據進行數據鑽取,獲得每個關鍵字對應的統計結果,結合關鍵字之間的聯繫,進一步形成多級關聯的統計結果,從而利用該多級關聯的統計結果生成多級餅圖,這樣用戶通過多級餅圖可以直觀的查看到所選關鍵字的分布情況和統計結果以及該關鍵字與其他層級關鍵字的統計結果之間的關聯關係,一目了然,提高了日誌數據的可讀性和可用性。

圖1是本發明一個實施例的一種日誌數據的圖形展現方法的流程圖,參見圖1,

步驟S11,根據預設的關鍵字組對指定業務的原始日誌數據逐條進行分詞提取處理,得到每條原始日誌數據對應的一條數據並保存到指定資料庫中;

其中,該條數據包括關鍵字以及所述關鍵字對應的值;所述關鍵字屬於所述關鍵字組,所述關鍵字對應的值是從所述原始日誌數據中通過分詞提取對應得到的;所述預設關鍵字組中包含一個或多個關鍵字;

步驟S12,根據用戶選擇的一個或多個關鍵字,對所述指定資料庫中的數據進行分類統計,得到關於所述用戶選擇的一個或多個關鍵字的分類統計結果;

步驟S13,根據所述分類統計結果生成對應的餅圖。

經過圖1所示的步驟,本發明實施例的這種日誌數據的圖形展現方法實現了大數據平臺下對日誌分析統計結果以對應的餅圖展現,改善了針對大數據領域數據呈現方式單調的現狀。結合大數據平臺下數據種類多樣化的特點,餅圖展現方式突破了現有線圖、柱圖的局限性,靈活的將數據之間的網絡結構簡潔、直觀的展現在用戶面前。利用了日誌內容的結構規律性,全面增強了對大數據平臺中日誌數據統計結果展示的可讀性及實用性。

在圖1所示的方法中,預設的關鍵字組是根據指定業務的特點進行確定的。也就是說,不同業務的日誌數據,預設的關鍵字組中的關鍵字可能不同。以下以大數據平臺中的網頁訪問類日誌數據為例,對本發明的這種日誌數據的圖形展現方法進行具體說明。

圖2是本發明又一個實施例日誌數據的圖形展現方法完整實現流程圖,參見圖2,本發明又一個實施例中日誌數據的圖形展現方法包括步驟S21至步驟S26。

流程開始,執行步驟S21,實時批量採集原始日誌數據信息;

圖3是本發明一個實施例的網站訪問業務的原始日誌數據示意圖,結合圖3,圖3示出了一段時間內某公司內部網站訪問日誌數據的示意圖,在圖3中示出了採集到的20條原始日誌數據信息。

步驟S22,按照預設的關鍵字組,逐條進行分詞提取;

在步驟S21得到的原始日誌數據信息的基礎上,按照預設的關鍵字組,逐條進行分詞提取處理,得到原始日誌數據對應的一條數據,在這條數據中包括:關鍵字以及關鍵字對應的值,其中,關鍵字是關鍵字組中的關鍵字,而關鍵字對應的值則是從原始日誌數據中通過分詞提取技術分離出來的。

圖4是本發明一個實施例提供的對原始日誌數據進行分詞提取處理得到對應的一條數據的示意圖,結合圖4,在圖3所得的20條數據的基礎上,逐條進行分詞提取(分詞提取是把原始的一條日誌,按照關鍵詞進行分詞,把原始日誌中的對應數據提取出來作為關鍵字的值,這樣原始的日誌數據就可以通過關鍵詞以及關鍵詞的值這樣的一條數據來表示),得到每條原始日誌數據對應的一條數據。在圖4中示意出了7個關鍵字,分別為:timestamp、requestpath、clientip、status、method、resplen、version;

步驟S23,對屬於同一條原始日誌數據的不同關鍵字進行標記,得到原始日誌數據對應的一條數據;

本實施例中,預設關鍵字組中包括多個關鍵字,對屬於同一條原始日誌數據的不同關鍵字進行標記(也就是說對一條原始的日誌數據利用關鍵詞,從這條原始日誌數據中把關鍵詞對應的值取出來,形成一條新數據,每個原始日誌數據都按照這種提取過程,則每條原始日誌數據都可以對應得到一條 新數據,這條新數據就相當於對原始的日誌數據進行了標記),從而得到屬於同一條原始日誌數據的不同關鍵字對應的值。參見圖4,還示意出了7個關鍵字對應的值,例如關鍵字clientip對應的值2.2.1.1。也就是說,將原始日誌數據分割成多個片段,轉換成了圖4中所示的一條數據。而7個關鍵字對應的值都來自於一條原始日誌數據(如圖3所示),這樣對20條原始日誌數據進行分詞提取和標記處理後,可以對應得到20條如圖4所示的數據。

需要說明的是,圖4是按照預設的關鍵字組中的7個關鍵字對得到的20條原始日誌數據中的每一條進行標記的示意圖。在本發明的其他實施例中,可以選取不同數量的關鍵字將原始日誌數據進行分割,不限於本實施例中的7個關鍵字。

步驟S24,接收用戶對關鍵字的選擇;

圖5是本發明一個實施例的多個關鍵字之間的結構示意圖,參見圖5,將20條原始日誌數據按照預設的7個關鍵字進行分詞提取和標記後,得到20條對應的數據。這樣一條數據中的關鍵字之間形成了一種網狀結構。本實施例的這種關鍵字網狀結構中每個關鍵字和剩餘的6個關鍵字都是平級的關聯關係,不同於現有技術的關鍵字之間上下級依賴關係的樹形結構。這種網狀結構方便用戶直觀選擇和自由組合,用戶對哪個關鍵字感興趣,可以在網狀結構中選擇一個關鍵字,後續再根據該關鍵字的分類統計結果生成對應的餅圖並展現。

步驟S25,將所選關鍵字按照層級關聯情況統計關鍵字對應的值,得到層級關聯統計結果;

當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;根據層級關聯分類統計結果,生成對應的多級餅圖。用戶選擇了關鍵字後,根據圖4所示的數據進行統計,由於關鍵字對應的值的不同,我們可以得到每個關鍵字對應的值的分類統計結果,當用戶只選擇了一個關鍵字時,例如,用戶選擇了clientip這個關鍵字後,在20條如圖4所示的數據中,統計clientip對應的值的分類統計結果。後續再生成一級餅圖,以餅圖的形式展現出這種分類統計結果。當用戶選擇了多個關鍵字時,為了增強日誌數據 的可讀性以及實用性,本發明的這種方法還需要根據多個關鍵字之間的關聯關係,得到層級關聯統計結果。也就是說,根據用戶的選擇確定關鍵字之間的級別,如果用戶選擇多個關鍵字,那麼先確定第一級關鍵字,然後確定第二級關鍵字,根據第二級關鍵字的分類統計結果以及第二級關鍵字的與第一級關鍵字的關聯關係,生成兩級關聯的統計結果。

步驟S26,根據層級關聯統計結果,生成多級餅圖。流程結束。

根據步驟S25中得到的層級關聯統計結果生成多級餅圖。這裡的多級餅圖是在用戶選擇了多個關鍵字時的圖形展現方式,如果用戶只選擇了一個關鍵字,則可以只生成該一個關鍵字對應的一級餅圖。對此不作限制。

以下結合圖3-圖5對本發明實施例的這種對日誌數據的圖形展現方法進行具體說明。

本實施例中用戶選擇的關鍵字為兩個,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的兩個關鍵字的層級關聯分類統計結果;根據層級關聯分類統計結果,生成對應的多級餅圖。結合圖3和圖5,用戶在圖5所示的網狀結構中選擇了帶展現的關鍵字clientip和status進行分級統計,且用戶選中了將關鍵字clientip的統計結果作為第一級展現,將關鍵字status的統計結果作為第二級展現。

本實施例中,對指定資料庫中的數據,統計第一級關鍵字對應的值的總數量A,並根據第一級關鍵字對應的值的不同進行分類統計,得到第一級關鍵字對應的每一類值的數量B,分別計算得到的每一類值的數量B佔總數量A的第一比例M;根據第一比例M計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成第一級餅圖;對指定資料庫中的數據,在第一級關鍵字對應的每一類值的數量B內,按照第二級關鍵字對應的值的不同進行分類統計,得到第二級關鍵字對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成關聯的第二級餅圖。

這裡,指定資料庫中存儲的數據即圖4所示的數據,由於圖3中批量採 集的是20條日誌數據,對日誌數據進行分詞提出的圖4所示的數據是和圖3所示的數據對應的,所以指定資料庫中存儲的數據數量也為20。本發明實施例的方法先按照第一級關鍵字對指定資料庫中的20條數據進行統計。具體的,根據圖3所示的原始日誌數據信息可知,第一級關鍵字對應的值的總數量A等於20。clientip對應的值有兩類分別為2.2.1.1和192.168.22.102,並且在圖3採集到的20條日誌數據中,clientip為2.2.1.1日誌條數和192.168.22.102日誌條數均為10(即第一級關鍵字對應的每一類值的數量B等於10)。計算得到每一類值的數量B佔總數量A的第一比例M均為50%。

接著,對指定資料庫中的數據在第一級關鍵字對應的每一類值的數量B(10條)內,按照第二級關鍵字status對應的值的不同進行分類統計,得到第二級關鍵字status對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N。具體的,clientip為2.2.1.1的10條日誌數據信息中有200、302、304三種status,三種status對應的日誌條數分別為8條,1條和1條,即第二級關鍵字對應的每一類值的數量C,分別佔到了clientip為2.2.1.1的日誌信息總條數的80%,10%和10%,即第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;

clientip為192.168.22.102的日誌數據信息有200、304兩種status,兩種status分別為1條和9條,即第二級關鍵字對應的每一類值的數量C,佔到了clientip為192.168.22.102的日誌信息總條數的10%和90%,即第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N。

得到層級關聯分類統計結果信息後,根據第一比例M生成第一級關鍵字對應的不同值的數量B在第一級餅圖中的起止角度和所佔面積。具體的,通過下面的公式進行計算:

終止角度=K+2πM

其中,K為起始角度,K=0°,M是各clientip與總日誌條數的比值。

例如,clientip為2.2.1.1的統計結果為10條,而總日誌條數為20條,則 M=50%,終止角度為180°。由此可知,clientip為2.2.1.1的統計結果在第一級餅圖中的起止角度為0°至180°;

clientip為192.168.22.102的統計結果,K=180°(即相鄰的clientip為2.1.1.1的數量所對應的終止角度),M=50%,終止角度為360°,由此可知,clientip為192.168.22.102的統計結果在第一級餅圖中的起止角度為180°至360°。

需要說明的是,本實施例中以clientip為2.2.1.1的統計結果的起始角度為0°,可以理解在本發明的其他實施例中,可以將clientip為192.168.22.102的統計結果的起始角度作為0°,對此不作限制。

接下來,分別計算clientip為192.168.22.102的統計結果和2.2.1.1的統計結果在第一級餅圖中所佔的面積:

所佔面積=πMr2

r為第一級餅圖所在的圓的半徑,是一個常數,本實施例中,r=5,M是第一比例,這裡M=50%;

通過計算可知,clientip為2.2.1.1的統計結果在第一級餅圖中所佔面積為12.5π;clientip為192.168.22.102的統計結果在第一級餅圖中所佔面積為12.5π。

根據上述clientip對應的值的分類統計結果的起止角度和所佔面積,生成第一級餅圖。圖6是本發明一個實施例中生成的第一級餅圖的示意圖,參見圖6,圖6中大圓代表總日誌數量,右半圓代表關鍵字clientip對應的值為2.2.2.1時的統計結果,左半圓代表關鍵字clientip對應的值為192.168.22.102時的統計結果。

通過圖6所示的餅圖,可以直觀、簡潔的看出大數據平臺下採集的原始日誌數據的分類統計結果情況,更加具有直觀性和可讀性。

接下來,根據用戶對status的選擇以及status在clientip對應的值的分類統計結果的關聯關係生成兩級餅圖。具體的,計算第二層級餅圖中,status關鍵字對應的值的分類統計結果所對應的起止角度和所佔面積:

終止角度=K+2πMN

其中,K是第二級餅圖的起始角度K=0°或者K等於第二級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,N是第二比例,π為常數;

具體的,在clientip為2.2.1.1時的統計結果內:

關鍵字status對應的值為200時,起始角度K=0°,N=80%,M=50%,則終止角度為144°;

關鍵字status對應的值為302時,起始角度K=144°,N=10%,M=50%,則終止角度為162°;

關鍵字status對應的值為304時,起始角度K=162°,N=10%,M=50%,則終止角度為180°;

即clientip對應的值為2.2.1.1時,在第二級餅圖中,關鍵字status為200的統計結果所對應的起止角度為0°至144°;

關鍵字status為302的統計結果所對應的起止角度為144°至162°;

關鍵字status為304時的統計結果所對應的起止角度為162°至180°。

在clientip為192.168.22.102時的統計結果內:

status為200時,起始角度K=180°,N=10%,M=50%,則終止角度為198°;

status為304時,起始角度K=198°,N=90%,M=50%,則終止角度為360°。

即clientip為192.168.22.102,在第二級餅圖中,關鍵字status的值為200時的統計結果的起止角度為180°至198°;

關鍵字status的值為304時的統計結果所對應的起止角度為198°至360°。

通過如下公式計算第二級關鍵字對應的每一類值的數量在第二級餅圖中的所佔面積:

所佔面積=πMN(R2-r2)

其中,M是第一比例,N是第二比例,R是第二級餅圖所在的圓的半徑, 為一常數,r是第一級餅圖所在的圓的半徑,為一常數。

具體的,在clientip的值為2.2.1.1的統計結果內,

Status值為200時,R=7,r=5,N=80%,M=50%,則Status值為200的統計結果所佔面積為9.6π;

status值為302,R=7,r=5,N=10%,M=50%,則status值為302的統計結果所佔面積為1.2π;

status值為304時,R=7,r=5,N=10%,M=50%,則所佔面積為1.2π。

即clientip為2.2.1.1,在第二級餅圖中,status為200的關鍵字所佔面積為9.6π;status為302的關鍵字所佔面積為1.2π;status為304的關鍵字所佔面積為1.2π。

在關鍵字clientip對應的值為192.168.22.102的統計結果內:

關鍵字status值為200時,R=7,r=5,N=90%,M=50%,則status值為200對應所佔的面積為10.8π;

關鍵字status值為304時,R=7,r=5,N=10%,M=50%,則status值為304對應所佔的面積為1.2π。

即clientip值為192.168.22.102時,在第二級餅圖中,status為200的統計結果所佔面積為10.8π;status為304的統計結果所佔面積為1.2π。

根據上述第二級餅圖中關鍵字status的分類統計結果生成第二級餅圖。圖7是本發明一個實施例中生成的兩級餅圖的示意圖,參見圖7,第二級餅圖所在的圓與第一級餅圖所在的圓之間滿足同心圓的關係。

本實施例中,第二級餅圖所在的圓的半徑為7,而第一級餅圖所在的圓的半徑為5。在圖6所示的一級餅圖的基礎上,圖7所示的兩級餅圖上直觀顯示了關鍵字status的分布情況,及其與clientip的層級關聯關係。具體的

在關鍵字clientip的值為2.2.1.1的統計結果對應的第一級餅圖右半圓的外環上,分別展現關鍵字status的分類統計結果,即status值為200的統計結果分布情況、status值為302的統計結果分布情況以及status值為304的統計結果分布情況。圖7靈活的將原始日誌數據信息分統計分析結果簡潔、直 觀的顯示給用戶,通過分層級展現更加具有可讀性和可用性。

由圖6和圖7可知,本發明實施例的這種日誌數據的圖形展現方法提供一種大數據平臺上對日誌數據分析統計結果的多級呈現。採用多級餅圖的形式將日誌數據中各關鍵字對應的值的統計結果關聯後,進行多維度、立體化的數據呈現。不局限於現有中的樹形結構,通過基於關鍵字內在聯繫的網狀結構,用戶可以靈活的選擇、組合,並經過處理後形成關鍵字的多級關聯統計結果,最終將數據鑽取的統計結果以多級餅圖(或者扇形圖)的方式分層級的展示在同一頁面中。實現直觀、形象的對日誌數據進行分層級展示,極大地提高了日誌數據的統計結果的可讀性及可用性。

圖8是本發明一個實施例提供的一種日誌數據的圖形展現裝置的框圖,參見圖8,該日誌數據的圖形展現裝置80包括:數據處理單元801,用於根據預設的關鍵字組對指定業務的原始日誌數據逐條進行分詞提取處理,得到每條原始日誌數據對應的一條數據並保存到指定資料庫中;其中,該條數據包括關鍵字以及關鍵字對應的值;關鍵字屬於關鍵字組,關鍵字對應的值是從原始日誌數據中通過分詞提取對應得到的;預設關鍵字組中包含一個或多個關鍵字;

統計單元802,用於根據用戶選擇的一個或多個關鍵字,對指定資料庫中的數據進行分類統計,得到關於用戶選擇的一個或多個關鍵字的分類統計結果;

圖形展現單元803,用於根據分類統計結果生成對應的餅圖。

在本發明的一個實施例中,數據處理單元801,具體用於根據指定業務的日誌數據特性確定預設關鍵字組。

在本發明的一個實施例中,統計單元802包括:多個關鍵字統計單元;

多個關鍵字統計單元,用於當用戶選擇的關鍵字為多個時,對指定資料庫中的數據進行按照關鍵字對應的值進行分類統計,得到關於用戶選擇的多個關鍵字的層級關聯分類統計結果;

圖形展現單元803,用於根據層級關聯分類統計結果,生成對應的多級餅圖。

在本發明的一個實施例中,多個關鍵字統計單元,具體用於對指定資料庫中的數據,統計第一級關鍵字對應的值的總數量A,並根據第一級關鍵字對應的值的不同進行分類統計,得到第一級關鍵字對應的每一類值的數量B,分別計算得到的每一類值的數量B佔總數量A的第一比例M;以及,對指定資料庫中的數據,在第一級關鍵字對應的每一類值的數量B內,按照第二級關鍵字對應的值的不同進行分類統計,得到第二級關鍵字對應的每一類值的數量C,分別計算第二級關鍵字對應的每一類值的數量C佔第一級關鍵字對應的每一類值的數量B的第二比例N;

圖形展現單元803,用於根據第一比例M計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成第一級餅圖;以及,根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度以及所佔面積,根據起止角度以及所佔面積生成關聯的第二級餅圖。

在本發明的一個實施例中,圖形展現單元803,具體用於通過如下公式計算第一級關鍵字對應的每一類值在第一級餅圖中的起止角度:

終止角度=K+2πM,其中,K是第一級餅圖的起始角度K等於0°或者K等於第一級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,π為常數;

通過如下公式計算第一級關鍵字對應的每一類值在第一級餅圖中的所佔面積:

所佔面積=πMr2,其中,r為第一級餅圖所在的圓的半徑,是一個常數,M是第一比例;

根據第二比例N計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度以及所佔面積包括:

通過如下公式計算第二級關鍵字對應的每一類值在第二級餅圖中的起止角度:

終止角度=K+2πMN,其中,K是第二級餅圖的起始角度K=0°或者K等於第二級餅圖中相鄰類值的數量所對應的終止角度,M是第一比例,N是 第二比例,π為常數;

通過如下公式計算第二級關鍵字對應的每一類值在第二級餅圖中的所佔面積:

所佔面積=πMN(R2-r2),其中,M是第一比例,N是第二比例,R是第二級餅圖所在的圓的半徑,為一常數,r是第一級餅圖所在的圓的半徑,為一常數。

需要說明的是,本實施例中的這種日誌數據的圖形展現裝置是和前述實施例中的日誌數據的圖形展現方法相對應的,本實施例中的日誌數據的圖形展現裝置的實現步驟可以具體參見前述日誌數據的圖形展現方法部分的說明,這裡不再贅述。

綜上可知,本發明實施例的技術方案基於大數據平臺對日誌分析統計結果的多級餅圖呈現,改善了針對大數據領域數據呈現方式單調的現狀。結合大數據平臺下數據種類多樣化的特點,本實施例的多級餅圖突破了現有線圖、柱圖的局限性,動態選擇、自由組合日誌關鍵字的手段,改變了現有多級餅圖中對樹狀數據結構展示的簡單鑽取模式,靈活的將數據之間的網絡結構簡潔、直觀的展現在用戶面前,增強了對日誌數據統計結果展示的可讀性及實用性。

以上所述僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發明的保護範圍內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀