新四季網

一種信息處理方法及裝置製造方法

2023-06-08 18:11:36 1

一種信息處理方法及裝置製造方法
【專利摘要】本發明實施例提供了一種信息處理方法,包括:獲得目標欄位的屬性信息;依據所述目標欄位的屬性信息,獲得利用第一語言描述的目標欄位的屬性信息;將所述利用第一語言描述的目標欄位的屬性信息發送給使用所述第一語言的查詢引擎,以便於所述查詢引擎依據利用第一語言描述的目標欄位的屬性信息,獲得所述目標欄位對應的數據;本發明實施例還提供一種信息處理裝置。根據本發明實施例提供的技術方案,可以實現自動利用語言描述的目標欄位的屬性信息,以提高數據的查詢效率。
【專利說明】一種信息處理方法及裝置 【【技術領域】】
[0001] 本發明涉及計算機【技術領域】,尤其涉及一種信息處理方法及裝置。 【【背景技術】】
[0002] 目前,隨著網際網路的蓬勃發展,各種數據以爆炸式的速度增長。現有技術中,從存 儲單元中查詢數據的方法是:依據所需要查詢的數據,人工利用某種語言來描述需要查詢 的數據,該利用某種語言來描述需要查詢的數據相當於人工編寫的查詢代碼,與存儲單元 對應的查詢引擎可以運行該查詢代碼,以實現在該存儲單元中自動查詢所需要的數據。
[0003] 然而,對於不同的數據查詢需求,需要編寫不同的查詢代碼。而且,數據的存儲單 元是多樣性的,如存儲在海杜普(Hadoop)類型的存儲單元、蜂巢(Hive)類型的存儲單元 等,數據的存儲單元不同,在處理數據需求時,所利用的語言也不同。因此,目前這種查詢代 碼需要人工進行編寫的方法,需要人工學習不同的語言,並手動編寫查詢代碼,才能查詢到 數據,導致目前數據的查詢效率比較低。 【
【發明內容】

[0004] 有鑑於此,本發明實施例提供了一種信息處理方法及裝置,可以實現自動利用語 言描述目標欄位的屬性信息,以提高數據的查詢效率。
[0005] 本發明實施例提供了一種信息處理方法,包括:
[0006] 獲得目標欄位的屬性信息;
[0007] 依據所述目標欄位的屬性信息,獲得利用第一語言描述的目標欄位的屬性信息;
[0008] 將所述利用第一語言描述的目標欄位的屬性信息發送給使用所述第一語言的查 詢引擎,以便於所述查詢引擎依據利用第一語言描述的目標欄位的屬性信息,獲得所述目 標欄位對應的數據。
[0009] 上述方法中,所述獲得目標欄位的屬性信息,包括:
[0010] 接收利用第二語言描述的候選欄位的屬性信息;對所述利用第二語言描述的候選 欄位的屬性信息進行解析,以獲得所述候選欄位的屬性信息;
[0011] 在所述候選欄位的屬性信息中去除不正確的候選欄位的屬性信息,以獲得目標字 段的屬性信息。
[0012] 上述方法中,所述目標欄位的屬性信息包括所述目標欄位的名稱;所述依據所述 目標欄位的屬性信息,獲得利用第一語言描述的目標欄位的屬性信息,包括:
[0013] 依據所述目標欄位的名稱,獲得存儲所述目標欄位的存儲單元的類型信息;
[0014] 依據所述類型信息,獲得查詢所述目標欄位的數值的查詢引擎所使用的第一語 言;
[0015] 依據所述第一語言和所述目標欄位的屬性信息,獲得所述利用第一語言描述的目 標欄位的屬性信息。
[0016] 上述方法中,所述目標欄位的屬性信息還包括所述目標欄位的聚類函數,所述目 標欄位的聚類函數用於所述查詢引擎對獲得的所述目標欄位對應的數值進行聚類處理;其 中,所述聚類函數包括以下函數中至少一個:求和函數、求平均值函數、計數函數、求最大值 函數和求最小值函數;和/或,
[0017] 所述目標欄位的屬性信息還包括所述目標欄位的篩選條件,所述目標欄位的篩選 條件用於所述查詢引擎對獲得的所述目標欄位對應的數值進行篩選處理。
[0018] 上述方法中,所述第一語言包括微軟Μ語言、R語言、Hive查詢語言HQL或者結構 化查詢語言SQL。
[0019] 本發明實施例提供了一種信息處理裝置,包括:
[0020] 獲取單元,用於獲得目標欄位的屬性信息;
[0021] 處理單元,用於依據所述目標欄位的屬性信息,獲得利用第一語言描述的目標字 段的屬性信息;
[0022] 發送單元,用於將所述利用第一語言描述的目標欄位的屬性信息發送給使用所述 第一語言的查詢引擎,以便於所述查詢引擎依據利用第一語言描述的目標欄位的屬性信 息,獲得所述目標欄位對應的數據。
[0023] 上述裝置中,所述獲取單元具體用於:
[0024] 接收利用第二語言描述的候選欄位的屬性信息;對所述利用第二語言描述的候選 欄位的屬性信息進行解析,以獲得所述候選欄位的屬性信息;
[0025] 在所述候選欄位的屬性信息中去除不正確的候選欄位的屬性信息,以獲得目標字 段的屬性信息。
[0026] 上述裝置中,所述目標欄位的屬性信息包括所述目標欄位的名稱;所述處理單元 具體用於:
[0027] 依據所述目標欄位的名稱,獲得存儲所述目標欄位的存儲單元的類型信息;
[0028] 依據所述類型信息,獲得查詢所述目標欄位的數值的查詢引擎所使用的第一語 言;
[0029] 依據所述第一語言和所述目標欄位的屬性信息,獲得所述利用第一語言描述的目 標欄位的屬性信息。
[0030] 上述裝置中,所述目標欄位的屬性信息還包括所述目標欄位的聚類函數,所述目 標欄位的聚類函數用於所述查詢引擎對獲得的所述目標欄位對應的數值進行聚類處理;其 中,所述聚類函數包括以下函數中至少一個:求和函數、求平均值函數、計數函數、求最大值 函數和求最小值函數;和/或,
[0031] 所述目標欄位的屬性信息還包括所述目標欄位的篩選條件,所述目標欄位的篩選 條件用於所述查詢引擎對獲得的所述目標欄位對應的數值進行篩選處理。
[0032] 上述裝置中,所述第一語言包括微軟Μ語言、R語言、Hive查詢語言HQL或者結構 化查詢語言SQL。
[0033] 由以上技術方案可以看出,本發明實施例具有以下有益效果:
[0034] 本發明實施例中,可以利用查詢引擎使用的語言描述目標欄位的屬性信息,然後 將獲得的利用該語言描述的目標欄位的屬性信息發送給該查詢引擎,查詢引擎就可以依據 利用該語言描述的目標欄位的屬性信息,查詢所述目標欄位的數值,從而獲得目標欄位對 應的數據。這樣,本發明實施例就可以實現自動地利用語言描述需要查詢的數據,以自動生 成查詢代碼,與現有技術中人工利用某種語言來描述需要查詢的數據的技術方案相比,不 再需要手動編寫查詢代碼,能夠提高數據的查詢效率。 【【專利附圖】

【附圖說明】】
[0035] 為了更清楚地說明本發明實施例的技術方案,下面將對實施例中所需要使用的附 圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域 普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其它的附 圖。
[0036] 圖1是本發明實施例所提供的技術方案使用的系統示意圖;
[0037] 圖2是本發明實施例所提供的信息處理方法的流程示意圖;
[0038] 圖3是本發明實施例中前端的Π 示意圖
[0039] 圖4是本發明實施例所提供的元數據分層管理示意圖;
[0040] 圖5是本發明實施例所提供的信息處理裝置的功能方塊圖。 【【具體實施方式】】
[0041] 為了更好的理解本發明的技術方案,下面結合附圖對本發明實施例進行詳細描 述。
[0042] 應當明確,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基 於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其 它實施例,都屬於本發明保護的範圍。
[0043] 在本發明實施例中使用的術語是僅僅出於描述特定實施例的目的,而非旨在限制 本發明。在本發明實施例和所附權利要求書中所使用的單數形式的"一種"、"所述"和"該" 也旨在包括多數形式,除非上下文清楚地表示其他含義。
[0044] 應當理解,本文中使用的術語"和/或"僅僅是一種描述關聯對象的關聯關係,表 示可以存在三種關係,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B 這三種情況。另外,本文中字符"/",一般表示前後關聯對象是一種"或"的關係。
[0045] 應當理解,儘管在本發明實施例中可能採用術語第一、第二等來描述語言,但這些 關鍵詞不應限於這些術語。這些術語僅用來將關鍵詞彼此區分開。例如,在不脫離本發明 實施例範圍的情況下,第一語言也可以被稱為第二語言,類似地,第二語言也可以被稱為第 一語目。
[0046] 取決於語境,如在此所使用的詞語"如果"可以被解釋成為"在……時"或"當…… 時"或"響應於確定"或"響應於檢測"。類似地,取決於語境,短語"如果確定"或"如果檢 測(陳述的條件或事件)"可以被解釋成為"當確定時"或"響應於確定"或"當檢測(陳述 的條件或事件)時"或"響應於檢測(陳述的條件或事件)"。
[0047] 本發明實施例所提供的技術方案使用的系統如圖1所示,主要由用戶界面(User Interface,Π )、信息處理裝置、查詢引擎和存儲單元組成,本發明實施例所提供的方法在 信息處理裝置側實現。
[0048] 本發明實施例給出一種信息處理方法,請參考圖2,其為本發明實施例所提供的信 息處理方法的流程示意圖,如圖所示,該方法包括以下步驟:
[0049] S201,獲得目標欄位的屬性信息。
[0050] 具體的,本發明實施例中,上述信息處理裝置獲得目標欄位的屬性信息的方法可 以包括:
[0051] 首先,接收前端的Π 發送的利用第二語言描述的候選欄位的屬性信息,然後,對 所述利用第二語言描述的候選欄位的屬性信息進行解析,以獲得所述候選欄位的屬性信 息。然後,在所述候選欄位的屬性信息中去除不正確的候選欄位的屬性信息,以獲得目標字 段的屬性信息。
[0052] 優選的,前端的Π 可以接收用戶配置的候選欄位的屬性信息;其中,該候選欄位 的屬性信息可以包括候選欄位的名稱,還可以包括候選欄位的聚類函數和候選欄位的篩選 條件中至少一個。
[0053] 其中,由於後端的存儲單元中會存在大量欄位以及每個欄位對應的數值,因此,當 查詢引擎需要查詢存儲單元中的某數值時,需要前端的Π 接收配置的需要查詢的數值所 對應的欄位的名稱,將該欄位的名稱作為上述候選欄位的名稱。例如,存儲單元存儲的每條 搜索日誌中包含欄位A、欄位B、欄位C和欄位D,如果需要查詢引擎查詢欄位B的數值,則用 戶需要在前端的UI上輸入欄位B的名稱。
[0054] 例如,請參考圖3,其為本發明實施例中前端的UI示意圖,如圖所示,前端的UI顯 示了多個欄位的名稱,用戶可以在該多個欄位中勾選至少一個候選欄位。
[0055] 其中,所述候選欄位的聚類函數用於查詢引擎對獲得的候選欄位對應的數值進行 聚類處理。優選的,所述聚類函數可以包括以下函數中至少一個:求和函數、求平均值函數、 計數函數、求最大值函數和求最小值函數。相應的,若聚類函數包括求和函數,則查詢引擎 在查詢到數值後可以對查詢到的數值進行求和計算。若聚類函數包括求平均值函數,則查 詢引擎在查詢到數值後可以對查詢到的數值進行求平均值計算。若聚類函數包括計數函 數,則查詢引擎在查詢到數值後,可以對查詢到的數值進行數目統計。若聚類函數包括求最 大值函數,則查詢引擎在查到數值後,可以獲得數值中的最大值。若聚類函數包括求最小值 函數,則查詢引擎在查到數值後,可以獲得數值中的最小值。可以理解的,聚類函數還可以 包括其他對數值進行統計的函數,上述聚類函數僅用以舉例說明,並不限定聚類函數隻包 含上述函數。
[0056] 其中,所述候選欄位的篩選條件用於查詢引擎依據該篩選條件,對獲得的數值進 行篩選處理。
[0057] 優選的,依據該篩選條件,對獲得的數值進行篩選處理可以包括以下幾種篩選處 理中至少一個:依據黑名單或者白名單,對數值進行篩選處理;依據閾值對數值進行篩選 處理;依據精確匹配或者模糊匹配,對欄位的數值進行篩選處理;依據時間區間,對數值進 行篩選出裡;依據出現次數,對欄位的數值進行篩選處理。
[0058] 例如,篩選條件為檢索詞包含鮮花速遞,則對檢索詞對應的欄位進行查詢,以獲得 所有檢索詞,然後對檢索詞進行篩選處理,以獲得包含鮮花速遞的檢索詞。再例如,篩選條 件為時間區間8點至22點,則對獲得的數值進行篩選處理,只保留8點至22點的日誌中的 數值。再例如,篩選條件為獲得出現次數最多的檢索詞,則對依據檢索詞對應的欄位進行查 詢,以獲得檢索詞,並統計每個檢索詞的出現次數,然後獲得出現次數最多的檢索詞。
[0059] 前端的Π 可以接收用戶輸入的候選欄位的屬性信息的方法可以包括以下三種中 至少一種:
[0060] 第一種:前端的π可以接收用戶直接輸入的候選欄位的屬性信息。
[0061] 第二種:前端的Π 可以接收用戶在若干選項中選出的候選欄位的屬性信息。
[0062] 第三種:前端的Π 可以依據預設的文件地址,從該文件地址中找到配置文件,進 而從配置文件中自動獲取候選欄位的屬性信息。這種方法適用於候選欄位的屬性信息比較 龐大的情況,通過配置文件可以批量獲取候選欄位的屬性信息。
[0063] 前端的UI在獲得候選欄位的屬性信息後,利用預設的第二語言對該候選欄位的 屬性信息進行描述,然後將獲得的利用第二語言描述的候選欄位的屬性信息發送給後端 的信息處理裝置,這樣信息處理裝置就可以接收到前端的Π 發送的利用第二語言描述的 候選欄位的屬性信息。例如,所述第二語言可以包括一種類結構化查詢語言(structured Query Language,SQL)或者數據格式。例如,該數據格式可以包括輕量級的數據交換格式 (JavaScript Object Notation, JSON)〇
[0064] 後端的信息處理裝置在從前端的Π 獲得利用第二語言描述的候選欄位的屬性信 息後,對利用第二語言描述的候選欄位的屬性信息進行解析處理,就可以獲得候選欄位的 屬性信息,信息處理裝置還需要進一步對獲得的候選欄位的屬性信息進行正確性判斷,判 斷屬性欄位的名稱是否正確,若不正確,就在候選欄位的屬性信息中去除該不正確的欄位 的名稱以及針對該不正確的欄位的聚類函數和篩選條件,從而實現在所述候選欄位的屬性 信息中去除不正確的候選欄位的屬性信息,其餘的候選欄位的屬性信息就可以作為本發明 實施例中的目標欄位的屬性信息。
[0065] 可以理解的,目標欄位的屬性信息可以包括全部或者部分的候選欄位的屬性信 息,因此,所述目標欄位的屬性信息可以包括目標欄位的名稱,還可以包括目標欄位的聚類 函數和目標欄位的篩選條件中至少一個。同理,所述目標欄位的聚類函數用於所述查詢引 擎對獲得的所述目標欄位對應的數值進行聚類處理;其中,所述聚類函數包括以下函數中 至少一個:求和函數、求平均值函數、計數函數、求最大值函數、求最小值函數。所述目標字 段的屬性信息還包括所述目標欄位的篩選條件,所述目標欄位的篩選條件用於所述查詢引 擎對獲得的所述目標欄位對應的數值進行篩選處理。
[0066] S202,依據所述目標欄位的屬性信息,獲得利用第一語言描述的目標欄位的屬性 信息。
[0067] 具體的,後端的信息處理裝置在獲得目標欄位的屬性信息後,可以獲得利用第一 語言描述的目標欄位的屬性信息。
[0068] 舉例說明,依據目標欄位的屬性信息,獲得利用第一語言描述的目標欄位的屬性 信息的方法可以包括:
[0069] 首先,依據所述目標欄位的名稱,獲得存儲所述目標欄位的存儲單元的類型信息。
[0070] 例如,可以依據目標欄位的名稱以及預設的欄位的名稱與表的對應關係,獲得一 個存儲目標欄位的表或者獲得至少兩個存儲目標欄位的表。
[0071] 若獲得至少兩個存儲目標欄位的表,則選擇包含的內容最少的表,將選出的包含 的內容最少的表作為所述存儲目標欄位的表。這裡,包含的內容最少的表對應的查詢速度 最快,因此,為了優化查詢速度,當存在至少兩個存儲目標欄位的表時,只選擇一個內容最 少的表即可。
[0072] 請參考圖4,其為本發明實施例所提供的元數據分層管理示意圖,如圖所示,在獲 得一個存儲目標欄位的表後,依據該目標欄位的表所包含的數據源號,獲得數據源信息,該 數據源信息中保存後端存儲該目標欄位的存儲單元的相關信息,如編號、名稱、描述、帳號、 密碼、主機、埠號、路徑、參數和類型編號,依據其中的類型編號可以獲得後端存儲該目標 欄位的存儲單元的類型信息。
[0073] 然後,依據所述類型信息,獲得查詢所述目標欄位的數值的查詢引擎所使用的第 一語目。
[0074] 優選的,可以依據該存儲單元的類型信息以及類型與第一語言的對應關係,可以 獲得該類型信息所對應的第一語言。本發明實施例中,所述第一語言指的是能夠在該存儲 單元執行查詢操作的查詢引擎所使用的語言。
[0075] 優選的,所述第一語言包括微軟(Microsoft,M)語言、R語言、蜂巢查詢語言(Hive Query Language, HQL)或者結構化查詢語言(Structured Query Language, SQL)。
[0076] 最後,依據所述第一語言和所述目標欄位的屬性信息,獲得所述利用第一語言描 述的目標欄位的屬性信息。
[0077] 可以理解的,第一語言、查詢引擎以及存儲單元是一一對應的,後端的每個存儲單 元都存在與該存儲單元對應的查詢引擎,該查詢引擎能夠在對應的存儲單元中執行查詢操 作,然而查詢引擎想要在存儲單元中執行查詢操作,以獲得目標欄位對應的數值,則查詢引 擎需要運行可執行代碼,該可執行代碼需要利用查詢引擎所使用的第一語言實現,這樣,查 詢引擎才能夠運行該可執行代碼,從而實現查詢操作。
[0078] 如圖1所示,如果存儲單元為Hadoop類型的存儲單元,Hadoop類型的存儲單元對 應的查詢引擎所使用的第一語言是Μ語言或者R語言,則Hadoop類型的存儲單元對應的第 一語言是Μ語言或者R語言。再例如,如果存儲單元為Hive類型的存儲單元,HIVE類型的 存儲單元對應的查詢引擎所使用的第一語言是HQL,則Hive類型的存儲單元對應的第一語 言是HQL。再例如,如果存儲單元為My SQL類型的存儲單元,My SQL類型的存儲單元對應 的查詢引擎所使用的第一語言是SQL,則My SQL類型的存儲單元對應的第一語言是SQL。
[0079] S203,將所述利用第一語言描述的目標欄位的屬性信息發送給使用所述第一語言 的查詢引擎,以便於所述查詢引擎依據利用第一語言描述的目標欄位的屬性信息,獲得所 述目標欄位對應的數據。
[0080] 具體的,信息處理裝置在獲得利用第一語言描述的目標欄位的屬性信息後,將該 利用第一語言描述的目標欄位的屬性信息發送給使用第一語言的查詢引擎,即發送給查詢 目標欄位的數值的查詢引擎,以便於查詢引擎在收到利用第一語言描述的目標欄位的屬性 信息後,依據利用第一語言描述的目標欄位的屬性信息,獲得目標欄位對應的數據。
[0081] 例如,查詢引擎可以運行利用第一語言描述的目標欄位的屬性信息,然後依據第 一語言中的語法,讀取其中的目標欄位的屬性信息,依據其中目標欄位的名稱,在對應的存 儲單元中查詢該目標欄位對應的數值,在獲得目標欄位對應的數值後,可以將該數值作為 目標欄位對應的數據直接返回給前端的UI進行顯示,也可以依據目標欄位的屬性信息中 的聚類函數和/或篩選條件,對查詢到的數值進行聚類處理和/或篩選處理,將處理後獲得 的數據作為目標欄位對應的數據返回給前端的UI進行顯示。
[0082] 隨著後端平臺的發展,需要由大量的存儲單元接入,因此為了更好的對存儲單元 中的數據進行管理和維護,需要使用元數據,元數據主要用於描述哪些數據在哪個存儲單 元中、定義要進入存儲單元中的數據和從存儲單元中產生的數據等。
[0083] 如圖4所示,元數據分為三層,從上到下依次為:業務元數據、模型抽象元數據和 物理元數據。
[0084] 其中,業務元數據指的是從業務角度描述存儲單元中存儲的數據,主要包含主題 的屬性信息、每個主題對應的欄位和每個欄位的屬性信息。業務元數據還可以包括聚類函 數和/或篩選條件。
[0085] 其中,模型抽象元數據支持兩種數據查詢模式,即星型數據查詢模式和單表數據 查詢模式。如圖4所示,如果是星型數據查詢模式,模型抽象元數據包含星型表的屬性信 息、星型表中的維度表以及維度表對應的聚合表。星型表包含一個基礎表和至少一個維度 表,其中,基礎表用於保存至少一個欄位的標識,維度表用於保存欄位的標識與欄位的名稱 的對應關係。
[0086] 其中,如圖4所示,物理元數據用於利用表的形式來記錄存儲單元存儲的數據的 屬性信息。其中,該表可以包括若干列,每一列用於保存一個欄位的屬性信息,如編號、位 置、名稱、數據類型的編號、長度、所屬表的編號、編碼等,物理元數據中還包含該表的可用 狀態信息,該可用狀態信息可以表示該表中的內容是否可用、在什麼時間段可用等。對於每 個列,物理元數據還包含該列的數據類型。該表還包含表自身的屬性信息,如編碼、名稱、描 述、標籤、編碼、大小以及欄位所在的數據源的編號。依據數據源的編號可以獲得對應的數 據源的屬性信息,如數據源的編號、名稱、描述、帳號、密碼、主機、埠號、路徑、參數和類型 編號。對於數據源,物理元數據還可以保存該數據源的類型編號所對應的類型信息,如數據 源的類型編號、類型名稱和描述。
[0087] 本發明實施例進一步給出實現上述方法實施例中各步驟及方法的裝置實施例。
[0088] 請參考圖5,其為本發明實施例所提供的信息處理裝置的功能方塊圖。如圖所示, 該裝置包括:
[0089] 獲取單元501,用於獲得目標欄位的屬性信息;
[0090] 處理單元502,用於依據所述目標欄位的屬性信息,獲得利用第一語言描述的目標 欄位的屬性信息;
[0091] 發送單元503,用於將所述利用第一語言描述的目標欄位的屬性信息發送給使用 所述第一語言的查詢引擎,以便於所述查詢引擎依據利用第一語言描述的目標欄位的屬性 信息,獲得所述目標欄位對應的數據。
[0092] 優選的,所述獲取單元501具體用於:
[0093] 接收利用第二語言描述的候選欄位的屬性信息;對所述利用第二語言描述的候選 欄位的屬性信息進行解析,以獲得所述候選欄位的屬性信息;
[0094] 在所述候選欄位的屬性信息中去除不正確的候選欄位的屬性信息,以獲得目標字 段的屬性信息。
[0095] 優選的,所述目標欄位的屬性信息包括所述目標欄位的名稱;所述處理單元502 具體用於:
[0096] 依據所述目標欄位的名稱,獲得存儲所述目標欄位的存儲單元的類型信息;
[0097] 依據所述類型信息,獲得查詢所述目標欄位的數值的查詢引擎所使用的第一語 言;
[0098] 依據所述第一語言和所述目標欄位的屬性信息,獲得所述利用第一語言描述的目 標欄位的屬性信息。
[0099] 優選的,所述目標欄位的屬性信息還包括所述目標欄位的聚類函數,所述目標字 段的聚類函數用於所述查詢引擎對獲得的所述目標欄位對應的數值進行聚類處理;其中, 所述聚類函數包括以下函數中至少一個:求和函數、求平均值函數、計數函數、求最大值函 數和求最小值函數;和/或,
[0100] 所述目標欄位的屬性信息還包括所述目標欄位的篩選條件,所述目標欄位的篩選 條件用於所述查詢引擎對獲得的所述目標欄位對應的數值進行篩選處理。
[0101] 優選的,所述第一語言包括微軟Μ語言、R語言、Hive查詢語言HQL或者結構化查 詢語言SQL。
[0102] 由於本實施例中的各單元能夠執行圖2所示的方法,本實施例未詳細描述的部 分,可參考對圖2的相關說明。
[0103] 本發明實施例的技術方案具有以下有益效果:
[0104] 本發明實施例中,可以利用查詢引擎使用的語言描述目標欄位的屬性信息,然後 將獲得的利用該語言描述的目標欄位的屬性信息發送給該查詢引擎,查詢引擎就可以依據 利用該語言描述的目標欄位的屬性信息,查詢所述目標欄位的數值,從而獲得目標欄位對 應的數據。這樣,本發明實施例就可以實現自動地利用語言描述需要查詢的數據,以自動生 成查詢代碼,與現有技術中人工利用某種語言來描述需要查詢的數據的技術方案相比,不 再需要手動編寫查詢代碼,能夠提高數據的查詢效率。
[0105] 所屬領域的技術人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統, 裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
[0106] 在本發明所提供的幾個實施例中,應該理解到,所揭露的系統,裝置和方法,可以 通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如,多個單元或組 件可以結合或者可以集成到另一個系統,或一些特徵可以忽略,或不執行。另一點,所顯示 或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接 耦合或通信連接,可以是電性,機械或其它的形式。
[0107] 所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個 網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目 的。
[0108] 另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以 是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單 元既可以採用硬體的形式實現,也可以採用硬體加軟體功能單元的形式實現。
[0109] 上述以軟體功能單元的形式實現的集成的單元,可以存儲在一個計算機可讀取存 儲介質中。上述軟體功能單元存儲在一個存儲介質中,包括若干指令用以使得一臺計算 機裝置(可以是個人計算機,伺服器,或者網絡裝置等)或處理器(Processor)執行本發 明各個實施例所述方法的部分步驟。而前述的存儲介質包括:U盤、移動硬碟、只讀存儲器 (Read-Only Memory, ROM)、隨機存取存儲器(Random Access Memory, RAM)、磁碟或者光碟 等各種可以存儲程序代碼的介質。
[0110] 以上所述僅為本發明的較佳實施例而已,並不用以限制本發明,凡在本發明的精 神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明保護的範圍之內。
【權利要求】
1. 一種信息處理方法,其特徵在於,所述方法包括: 獲得目標欄位的屬性信息; 依據所述目標欄位的屬性信息,獲得利用第一語言描述的目標欄位的屬性信息; 將所述利用第一語言描述的目標欄位的屬性信息發送給使用所述第一語言的查詢引 擎,以便於所述查詢引擎依據利用第一語言描述的目標欄位的屬性信息,獲得所述目標字 段對應的數據。
2. 根據權利要求1所述的方法,其特徵在於,所述獲得目標欄位的屬性信息,包括: 接收利用第二語言描述的候選欄位的屬性信息;對所述利用第二語言描述的候選欄位 的屬性信息進行解析,以獲得所述候選欄位的屬性信息; 在所述候選欄位的屬性信息中去除不正確的候選欄位的屬性信息,以獲得目標欄位的 屬性信息。
3. 根據權利要求1所述的方法,其特徵在於,所述目標欄位的屬性信息包括所述目標 欄位的名稱;所述依據所述目標欄位的屬性信息,獲得利用第一語言描述的目標欄位的屬 性信息,包括: 依據所述目標欄位的名稱,獲得存儲所述目標欄位的存儲單元的類型信息; 依據所述類型信息,獲得查詢所述目標欄位的數值的查詢引擎所使用的第一語言; 依據所述第一語言和所述目標欄位的屬性信息,獲得所述利用第一語言描述的目標字 段的屬性信息。
4. 根據權利要求2或3所述的方法,其特徵在於, 所述目標欄位的屬性信息還包括所述目標欄位的聚類函數,所述目標欄位的聚類函數 用於所述查詢引擎對獲得的所述目標欄位對應的數值進行聚類處理;其中,所述聚類函數 包括以下函數中至少一個:求和函數、求平均值函數、計數函數、求最大值函數和求最小值 函數;和/或, 所述目標欄位的屬性信息還包括所述目標欄位的篩選條件,所述目標欄位的篩選條件 用於所述查詢引擎對獲得的所述目標欄位對應的數值進行篩選處理。
5. 根據權利要求1或3所述的方法,其特徵在於,所述第一語言包括微軟Μ語言、R語 言、Hive查詢語言HQL或者結構化查詢語言SQL。
6. -種信息處理裝置,其特徵在於,所述裝置包括: 獲取單元,用於獲得目標欄位的屬性信息; 處理單元,用於依據所述目標欄位的屬性信息,獲得利用第一語言描述的目標欄位的 屬性信息; 發送單元,用於將所述利用第一語言描述的目標欄位的屬性信息發送給使用所述第一 語言的查詢引擎,以便於所述查詢引擎依據利用第一語言描述的目標欄位的屬性信息,獲 得所述目標欄位對應的數據。
7. 根據權利要求6所述的裝置,其特徵在於,所述獲取單元具體用於: 接收利用第二語言描述的候選欄位的屬性信息;對所述利用第二語言描述的候選欄位 的屬性信息進行解析,以獲得所述候選欄位的屬性信息; 在所述候選欄位的屬性信息中去除不正確的候選欄位的屬性信息,以獲得目標欄位的 屬性信息。
8. 根據權利要求6所述的裝置,其特徵在於,所述目標欄位的屬性信息包括所述目標 欄位的名稱;所述處理單元具體用於: 依據所述目標欄位的名稱,獲得存儲所述目標欄位的存儲單元的類型信息; 依據所述類型信息,獲得查詢所述目標欄位的數值的查詢引擎所使用的第一語言; 依據所述第一語言和所述目標欄位的屬性信息,獲得所述利用第一語言描述的目標字 段的屬性信息。
9. 根據權利要求7或8所述的裝置,其特徵在於, 所述目標欄位的屬性信息還包括所述目標欄位的聚類函數,所述目標欄位的聚類函數 用於所述查詢引擎對獲得的所述目標欄位對應的數值進行聚類處理;其中,所述聚類函數 包括以下函數中至少一個:求和函數、求平均值函數、計數函數、求最大值函數和求最小值 函數;和/或, 所述目標欄位的屬性信息還包括所述目標欄位的篩選條件,所述目標欄位的篩選條件 用於所述查詢引擎對獲得的所述目標欄位對應的數值進行篩選處理。
10. 根據權利要求6或8所述的裝置,其特徵在於,所述第一語言包括微軟Μ語言、R語 言、Hive查詢語言HQL或者結構化查詢語言SQL。
【文檔編號】G06F17/30GK104216992SQ201410456925
【公開日】2014年12月17日 申請日期:2014年9月9日 優先權日:2014年9月9日
【發明者】梁變, 郭謝, 孫勇義, 劉生, 張道泉, 王玉嫻, 史曉峰, 王勇, 陳愈堅, 李呈奇, 劉小林, 朱栩甲, 任峰 申請人:百度在線網絡技術(北京)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀