根據用戶應用程式要求改寫數據質量規則的方法和系統的製作方法
2023-08-03 02:23:11
專利名稱:根據用戶應用程式要求改寫數據質量規則的方法和系統的製作方法
技術領域:
本發明的各實施例涉及當從一個或多個數據源提取數據時,建立數據質量的規則。
背景技術:
當把數據從一個或多個數據源加載到系統中,供應用程式之用時,數據一般必須 經歷某種數據質量分析和/或數據清理,以確保數據適合於供應用程式使用。根據將使用數據的特定應用程式,對相同數據的數據質量要求可不同(例如,不同的客戶端和/或客戶端的不同部分可能對數據質量有不同的要求)。然而,儘管能夠建立確保提供具有某種格式的數據的某些通用數據質量規則,不過這些規則通常是用與應用程式相關的邏輯或者在從數據源提取數據的系統源設定和建立的。改變一些或者所有的數據質量規則一般要求應用程式或者源系統代碼的改變。因此,一般不能在運行時修改數據質量規則,而是需要在數據處理循環期間評估數據質量規則,然後只在處理循環之後進行所述改變。由於適用於一個應用程式的具體規則可能不適用於另一個應用程式,因此難以為從一個或多個數據源取回數據的許多應用程式確保嚴格的數據質量。
發明內容
在本發明的一個例證實施例中,提供一種用於對從至少一個數據源獲得的數據集應用數據質量規則的計算機實現方法。所述方法包括連同一組公共規則一起,從所述至少一個數據源取回數據,所述一組公共規則被配置成以按照該組公共規則中的一條或多條預定的數據質量規則的方式,格式化取回的數據,利用至少一個可編輯微件,調整至少一條預定的數據質量規則,以形成適合於供指定應用程式使用的一組修改的數據質量規則,和把所述一組修改的數據質量規則應用於取回的數據。在本發明的另一個例證實施例中,提供一種用於對從至少一個數據源獲得的數據集應用數據質量規則的系統。所述系統包括連同一組公共規則一起,從所述至少一個數據源取回數據的源系統,所述一組公共規則被配置成以按照該組公共規則中的一條或多條預定的數據質量規則的方式,格式化取回的數據,和從所述源系統接收取回的數據和一組公共規則的客戶端。所述客戶端包括微件模塊,所述微件模塊包含至少一個可編輯微件,以及所述客戶端還配置有邏輯模塊,用於利用所述至少一個可編輯微件,調整至少一條預定的數據質量規則,以形成適合於供客戶端的指定應用程式使用的一組修改的數據質量規則,和把所述一組修改的數據質量規則應用於取回的數據。在本發明的另一個例證實施例中,提供一種用於對從至少一個數據源獲得的數據集應用數據質量規則的電腦程式產品。所述電腦程式產品包括具有在其中具體化計算機可讀程序代碼的計算機可讀存儲介質。所述計算機可讀程序代碼被配置成連同一組公共規則一切,接收從所述至少一個數據源取回的數據,所述一組公共規則被配置成以按照該組公共規則中的一條或多條預定的數據質量規則的方式,格式化取回的數據,利用至少一個可編輯微件,調整至少一條預定的數據質量規則,以形成適合於供指定應用程式使用的一組修改的數據質量規則,和把所述一組修改的數據質量規則應用於取回的數據。當考慮以下詳細說明,尤其是當結合附圖考慮以下詳細說明時,本發明實施例的以上和另外的特徵和優點將變得明顯,附圖中,各個圖中的相同附圖標記表示相同的組件。
圖I是按照本發明的取回實現可單獨調整的數據質量規則的數據的系統的例證實施例的示意圖。圖2描述用於根據應用程式和/或用戶規範,改寫特定客戶端應用程式的數據質量規則的例證微件的⑶I圖像。圖3是圖解說明按照本發明的例證實施例,生成微件的方式的流程圖。圖4是表示按照本發明的例證實施例,對一組數據應用數據質量規則,以便生成·微件的示意圖。圖5是圖解說明按照本發明的例證實施例的圖I的系統的操作,包括定製微件以改寫一組通用數據質量規則,從而供客戶端應用程式使用的方式的流程圖。圖6描述按照本發明的例證實施例,與微件相關的⑶I圖像,所述⑶I圖像可以允許修改/定製與所述微件相關的數據質量規則。
具體實施例方式本發明的實施例提供把數據質量規則應用於從數據源獲得的數據集。連同一組公共規則,從數據源取回數據,所述一組公共規則被配置成以按照該組公共規則中的一條或多條預定的數據質量規則的方式,格式化取回的數據。利用至少一個可編輯微件,調整至少一條預定的數據質量規則,以形成適合於供指定應用程式之用的一組修改的數據質量規貝U,然後把所述修改的一組數據質量規則應用於取回的數據。本發明的實施例便於修改或定製可用於不同客戶端系統的每個不同應用程式的一組公共數據質量規則。圖I中描述了實現本發明的特徵的系統的例證實施例。系統包括通過源系統(在圖I中稱為數據質量規則資料庫12),從一個或多個數據源6、8、10訪問數據的多個客戶端
2、4。雖然圖I中只示出了兩個客戶端2、4和三個數據源6、8、10,不過注意這只是簡單表示,並且所述系統並不局限於所述數字。相反,可以為系統提供任何適當數目的客戶端和數據源。質量規則資料庫12被配置成根據來自客戶端2、4的數據查詢,從數據源6、8、10取回或提取數據,然後把數據提供給請求所述數據的客戶端(例如,通過任何適當的提取、傳送和加載處理)。資料庫12還包括任何適當數目的不同類型或不同組的公共或通用數據質量規則,所述數據質量規則在數據被提供給進行查詢的客戶端之前,根據選擇的規則類型,對數據應用統一的規則。一組公共規則包括固定的並且適合於為向數據源請求數據的每個客戶端,以相同方式提取和格式化所述數據的規則。客戶端2、4,數據質量規則資料庫12和數據源6、8、10可以相互遠離,並通過直接連接或者任何適當的網絡通信(如圖I中所示的不同系統組件之間的箭頭所示)。例如,可以實現網絡,以便於利用任何適當的通信媒體(例如,廣域網(WAN)、區域網(LAN)、網際網路、企業內部網等),在兩個或更多個系統組件之間傳送任何類型的數據和/或其它信息。另一方面,客戶端2、4,數據質量規則資料庫12和數據源6、8、10中的一個或多個可以彼此在本地,並通過任何適當的本地通信媒體(例如,區域網(LAN)、硬連線、無線鏈路、企業內部網等)通信。此外,客戶端2、4,數據質量規則資料庫12和數據源6、8、10中的任意兩個或更多個,和移植資料庫4可被實現成單一系統組件內的子組件。客戶端2、4,數據質量規則資料庫12和數據源6、8、10都可以用任何常規的或者其它計算機系統實現,所述計算機系統可以配備提供圖形用戶界面或其它界面(例如,提供命令行提示、微件和/或其它菜單屏幕等),以向用戶請求與期望數據和分析有關的信息的顯示器或監視器,基本部分(例如包括處理器、存儲器和/或內部或外部通信裝置(例如,數據機、網卡等)),可選輸入裝置(例如,鍵盤、滑鼠或其它輸入裝置),和任何可從市場上獲得和/或定製的軟體(例如,伺服器/通信軟體、分析和/或其它類型的模塊、瀏覽器/界面軟體等)。數據質量規則資料庫包括數據質量規則模塊14,在數據被提供給客戶端之前,可從數據質量規則模塊14對從數據源取回的數據應用一組公共的數據質量規則。數據質量規則模塊14可以包括將根據對特定應用程式和/或根據數據查詢取回的特定多列數據或 者數據記錄的要求,應用於數據的所選數目的不同多組預定數據質量規則。數據質量規則可以是將對數據進行的任何系列的邏輯運算,比如將應用於數據的約束,或者將對數據採取的動作(例如,根據規則內被滿足的條件,對數據的修改)。在例證實施例中,從數據源內的表格獲得的記錄的一列數據中的數據串可包括諸如「MR SMITH JOHN HAROLD」之類的姓名(例如,業務經理姓名、聯繫人姓名等)。可從數據質量規則模塊14選擇特定規則,所述規則把字符串的數據分成不同的類別,比如(I)頭銜MR名字JOHN中名HAR0LD姓SMITH在另一個例子中,數據源的表格中的某列的字符串可以是指定國家代碼、地區、城市、數據類型和數據代碼(例如,表示與在特定城市內的帳戶有關的信息)的一系列數字,比如『1234567890123』。出自數據質量規則模塊14的規則可把所述字符串的數據分成以下不同類別,供特定應用程式使用(2)國家代碼(3位)-地區(2位)-城市(3位)-類型(I位)-帳戶代碼(5位)132-34-567-8-9101234數據質量規則資料庫12把出自數據質量規則模塊14的一個或多個規則應用於從一個或多個數據源6、8、10獲得的數據,並把這樣的數據(具有根據數據規則的要求,分成不同類別的數據串)提供給進行查詢的客戶端。例如,客戶端2包括應用程式Appl (20),而客戶端4包括不同的應用程式App2 (24)。任意一個客戶端可以利用資料庫12,向一個或多個數據源6、8、10請求數據。在數據質量規則模塊14中提供的相同一組數據質量規則可被應用於每個客戶端2、4請求的相同類型的數據。不過,客戶端2的應用程式Appl (20)可能要求以從數據質量規則模塊14的數據質量規則所應用的通用或公共規則格式稍微修訂或修改的格式提供數據。另外,客戶端4的應用程式App2(24)也可具有稍微不同於Appl,並且相對於模塊14的數據質量規則所應用的公共規則格式稍微修訂的格式要求。在存在對將應用於從數據源接收的數據的數據格式具有稍微不同或修改要求的多個客戶端和/或多個應用程式的情況下,難以提供能夠預期應用程式或者利用該應用程式的用戶為處理來自數據源的數據而需要的每種可能格式類型的一組完整的數據規則。作為一種例證情形,考慮上面的示例(I),其中數據規則可把諸如「MR SMITH JOHNHAROLD」之類的姓名串分成供各種客戶端應用程式使用的公共格式。在這種情況下,可能存在要求姓名串呈不同格式,以供應用程式使用的許多不同的客戶端應用程式。例如,一種應用程式可能要求姓名串呈以下格式「Mr John Harold SMITH」 ;再一種應用程式可能要求姓名呈以下格式「John Smith」;又一種應用程式可能要求姓名串呈以下格式「Mr.Smith」 ;另一種應用程式可能要求姓名串呈以下格式「John H. Smith」。在另一個例證情形中,考慮上面的示例(2),其中數據規則可把數字型數據串,比如「1234567890123」分成包括如在示例(2)中提到的不同類別的公共格式。不同的客戶端應用程式還可能要求格式方面的更多差異。例如,一種應用程式可能要求字符串格式為除 去國家代碼的地區-城市-類型-代碼(例如,34-567-8-901234);再一種應用程式可能要求字符串格式僅僅是代碼(例如,901234);另一種應用程式可能只要求城市信息(例如,567)。一組公共的數據質量規則是由源系統(比如圖I的系統中的數據質量規則資料庫12),或者利用客戶端應用程式實現的邏輯應用的預定規則。不過,在不在源系統或者為應用程式改變原始碼的情況下,不能容易地改變或改寫這樣的規則。由於對使用從數據源取回的數據的特定客戶端應用程式來說,在任何時候可能都期望或要求修改,因此這會是一項乏味並且費時的任務。按照本發明的實施例,每個客戶端具備一個或多個圖形用戶界面(GUI)元件或微件,所述GUI元件或微件允許客戶端用戶對於待使用的應用程式和/或根據變化的客戶端應用程式要求和/或用戶偏好或規範,微調或改寫規則。重新參見圖1,客戶端2包括GUI微件模塊22,所述GUI微件模塊22包括配置成按照對應用程式Appl (20)的客戶端要求,進一步調整或改寫將應用於從數據質量規則資料庫12接收的數據的規則的多個微件。客戶端4還包括⑶I微件模塊26,所述⑶I微件模塊26包括為App2 (24)進行相同功能的多個微件。微件模塊22、26的微件包含⑶I菜單,所述⑶I菜單包括便於對從資料庫12接收的數據進行操作或調整,從而進一步根據用戶規範,改寫供客戶端應用程式之用的數據的任何適當類型的可調整控制對象,包括但不限於切換開啟/關閉按鈕,複選框,可選擇的菜單和/或圖標,可填寫的欄。從而,微件允許根據客戶端應用程式和/或用戶對特定情形的要求,進一步編輯和改寫將應用於數據源取回的數據的一組公共規則。如上所述,系統的數據質量規則資料庫12可被配置成在數據被傳送給客戶端之前,利用從模塊14獲得的數據質量規則,對從一個或多個數據源6、8、10取回或提取的數據記錄應用規則。另外注意系統還可被配置成使得數據質量規則資料庫12把從一個或多個數據源取回的數據記錄,連同來自模塊14的一組公共的數據質量規則一起提供給客戶端,客戶端隨後應用為供客戶端應用程式使用而用微件改寫的數據質量規則。例如,微件可被配置成包括與從一個或多數據源獲得的數據(包括元數據)相關的信息,以及還包括由資料庫12的數據質量模塊14提供的與數據相關的一組公共數據質量規則,使得微件把所述規則應用於所述數據。圖2中描述可用於改寫用於應用程式的一組公共規則的微件的例證實施例。圖2中描述的微件與數據實體相聯繫(其中數據實體與相同實體類別,例如,產品、客戶、僱員等中的一系列記錄相聯繫),以及每個實體微件與數據表的感興趣的並且包括將按某種方式格式化以供客戶端應用程式使用的數據的確定各列相關。例如,圖2中描述了產品實體微件30 (與產品數據相關)和客戶實體微件40 (與客戶數據相關)。也可生成另外的微件,所述微件具有能夠被修改,以包括關於和特定實體相關的數據列的具體信息的基本模板(表示成微件50)。每個微件還包括「編輯規則」按鈕,所述「編輯規則」按鈕便於用戶以選擇的方式,編輯與該實體相關的數據質量規則,如下所述。微件,比如圖2中所示的微件30-50可以按照如圖3的流程圖中所示的處理生成。特別地,最初通過從自數據源獲得的數據的數據表中選擇屬性(例如,列),定義實體微件(步驟100)。例如,參見產品實體微件30,與該微件相關的屬性是產品名稱,品牌名稱,數量和類型。對客戶實體微件40來說,與該微件相關的屬性是姓名、地址I (第一地址框)、地址2(第二地址框)和產品。隨後為實體微件選擇與選擇的數據屬性對應的模式,並依據該微·件分組與實體微件相關的所有規則(步驟110)。所述模式可以人工定義,或者用基於上下文的模式發現方法發現。微件使數據屬性的修改更容易(例如,按照與產品實體微件30中的產品名稱屬性相關並且可由該微件控制的可編輯規則,改變該屬性的數據值)。圖4中描述了示意性示出通過對來自數據源的數據31應用公共或通用規則集32,生成產品實體微件30的例證實施例。來自數據源的數據31包括產品屬性(例如,雜貨店倉庫存貨的不同產品的列表)。確定數據的模式,以幫助確立規則集32的哪條規則將被應用於該微件。在例證情形下,可能存在從數據質量模塊14獲得的、適用於將由客戶端2的應用程式Appl(20)使用的數據的多組規則。假定兩條規則(規則I和規則2)適用於產品實體微件30的產品名稱屬性。這兩條規則是依據該屬性分組的,並且可訪問,以供微件選擇和/或修改(例如,通過選擇該微件的「編輯規則」按鈕)。根據人為規則,使和微件有關的每條規則參數化(步驟120)。特別地,為不同的人為規則選擇參數,參數定義根據人為規則的被滿足條件,要採取的動作(例如,如果條件被滿足,那麼把特定參數應用於與該微件相關的數據)。藉助微件的規則參數化可包括新規則的增加,現有規則的修改和/或現有規則的刪除。在為特定應用程式生成實體微件之後,可以利用微件的「編輯規則」功能,根據應用程式或用戶規範,把每組公共規則修改成一組新的定製或者改寫的規則。現在參考圖5的流程圖,說明圖I的系統的操作的例證實施例,包括一組規則的定製或改寫(利用諸如微件30之類的實體微件)。在該處理中,按照圖3中描述的處理,生成了實體微件(比如保存在客戶端2的微件模塊22中的實體微件30)。客戶端2的查詢導致從一個或多個數據源6、8、10獲得數據記錄(步驟150)。把來自數據質量規則資料庫12的數據質量規則模塊14的一組或多組公共規則應用於所述數據記錄(步驟160)。這些公共規則都相同,從而對從數據源6、8、10獲得的相同或相似的數據(例如,在表的相同列中,或者相同或相似的數據記錄中的數據)應用相同類型的修改,而與哪個客戶端或哪個客戶端應用程式在進行查詢無關。可例如根據數據屬性,確定關於從數據質量規則模塊14應用哪些規則的決策(例如,所選數據表的不同數據列可能與特定的一組或多組公共規則相關)。對從數據源獲得的一組或多組公共或通用規則的應用可由數據質量規則資料庫12執行,或者另一方面,可由客戶端2執行。
從客戶端2的微件模塊22選擇一個或多個實體微件(步驟170)。用戶訪問微件的「編輯規則」特徵,以在客戶端應用程式(比如Appl)的運行期間,利用應用於數據的修改的人為結果,生成改寫規則(步驟190)。換句話說,微件的「編輯規則」特徵允許用戶有選擇地修改應用於數據的一組或多組公共規則。客戶端應用程式輸出已根據一個或多個實體微件應用的改寫規則修改的數據(例如,在圖形顯示中)(步驟200)。另外,通過用戶在應用程式的運行期間的任何時間,選擇任意微件的「編輯規則」特徵,在應用程式的運行期間可進一步更改已改寫的規則(步驟210)。例如,如果用戶希望改變特定數據屬性的顯示,那麼用戶可選擇適當微件的「編輯規則」特徵,以進行這樣的改變,從而允許在客戶端應用程式的運行期間進行改變。參考圖6,說明描述示出微件(產品實體微件30)的「編輯規則」特徵的GUI界面35的例證實施例。本例證實施例表示根據客戶端應用程式和/或用戶規範,可如何調整關於數量屬性的規則。示出了例證記錄「120Z FIZZY CORP CHEESE CAN」,其中微件修改數據質量規則,以轉換該數據記錄和/或與產品實體微件30相關的每個數據記錄的數量計量單位(對該特定記錄來說,計量單位從「0Z」修改成「OUNCES」,以便輸出或顯示)。從而,微件修改數據質量規則,使得該記錄(和選擇的具有產品數量信息的其它記錄)的輸出或顯示具有修訂的數量值。對於與這種產品記錄相關的其它屬性,也可以設定或調整其它修改(例如,對與產品名稱、品牌名稱和類型相關的數據的修改)。另外,可以訪問其它實體微件,以有選擇地編輯與微件相關的規則。可在客戶端應用程式的運行期間,進一步進行對微件的這種調整或修改(例如,「在飛行中」或者在應用程式的運行時期間應用)。圖I的系統被配置成使得源系統或數據質量規則資料庫12可向每個客戶端(例如,客戶端2和客戶端4)提供一組或多組預定的公共規則,每個客戶端利用保存在客戶端的微件模塊內的微件,修改或改寫所述規則。規則是根據客戶端的特殊要求,或者每個客戶端的指定應用程式的要求改寫的。從而,客戶端2和客戶端4都可接收用資料庫12的數據質量規則模塊14保存的相同的一組公共規則。不過,每個客戶端可以按照客戶端自己的規範(例如,根據對不同的客戶端應用程式APPl或APP2的不同要求),修改並從而定製所述規則,使得客戶端2的改寫或者修改的一組數據質量規則不同於客戶端4的改寫或者修改的一組數據質量規則。從而,本發明的實施例便於根據特定應用程式或用戶規範,修改和改寫應用於數據的一組公共或通用規則。這不同於典型系統,在典型系統中,由源系統應用數據質量規貝U,以及改變或定製數據質量規則會是冗長和複雜的過程(例如,要求應用規則的代碼的變化)。在本發明的實施例中,一組公共/通用的規則被應用於從數據源獲得的數據(例如,在數據質量規則資料庫和/或由特定的客戶端應用所述一組公共/通用的規則),而特定的客戶端可利用一個或多個微件,單獨進行對數據質量規則的修改。微件可包括特定實體的所有信息,包括與實體相關的數據的元數據,待應用於與實體相關的數據的一組或多組公共規則,和這種規則的定製特徵。通過確定數據模式和與模式中的數據相關的規則,可以生成實體微件。要理解上面說明和在附圖中圖解所示的實施例僅僅表示實現根據應用程式的要求和/或用戶規範或偏好,改寫待應用於數據的數據質量規則的實施例的許多方式中的一些方式。本發明實施例的布局或環境可包括按照任何期望的方式布置的任何數目的計算機或其它處理系統(例如,客戶端或最終用戶系統,伺服器系統等)和資料庫或其它儲存庫,本發明實施例可以適用於任何期望類型的計算環境(例如,雲計算、客戶端-伺服器、網絡計算、大型機、獨立系統等)。本發明實施例採用的計算機或其它處理系統可用任意數目的任何個人或其它類型的計算機或處理系統(IBM兼容型、膝上型、PDA、移動裝置等)實現,並且可以包括任何可從市場上獲得的作業系統,和任何可從市場上獲得的或者定製的軟體 (例如,瀏覽器軟體、通信軟體、伺服器軟體、清理和數據質量分析軟體等)。這些系統可以包括任何類型的監視器和輸入裝置(例如,鍵盤、滑鼠、語音識別等),以輸入和/或查看信肩、O應明白的是本發明實施例的軟體(例如,數據集市、間隔(gap)報告模塊、規則模板模塊、例示規則模塊等)可以用任何期望的計算機語言實現,並可由計算機領域的普通技術人員根據包含在說明書中的功能說明和附圖中圖解說明的流程圖開發。此外,這裡對執行各種功能的軟體的任何引用通常指的是在軟體控制下,執行這些功能的計算機系統或處理器。另一方面,本發明實施例的計算機系統可用任何類型的硬體和/或其它處理電路來實現。計算機或其它處理系統的各種功能可以任何方式分布在任意數目的軟體和/或硬體模塊或單元、處理或計算機系統和/或電路之間,其中計算機或處理系統可以被布置成在本地或者彼此遠離,並通過任何適當的通信介質(例如LAN、WAN、企業內部網、網際網路、硬連線、數據機連接、無線等)通信。例如,本發明實施例的功能可以任何方式分布在各種最終用戶/客戶端和伺服器系統,和/或任何其它中間處理裝置之間。可按照實現這裡說明的功能的任何方式,修改以上說明和在流程圖中圖解所示的軟體和/或算法。另外,可按照完成期望操作的任何順序執行流程圖或說明中的功能。本發明實施例的軟體可存在於可記錄介質(例如,磁或光介質、磁光介質、軟盤、CD-ROM、DVD、存儲裝置等),供在獨立系統或者用網絡或其它通信介質連接的系統上使用。通信網絡可以用任意數目的任何類型的通信網絡(例如,LAN、WAN、網際網路、企業內部網、VPN等)實現。本發明實施例的計算機或其它處理系統可包括藉助任何常規協議或者其它協議,通過網絡通信的任何常規通信裝置或者其它通信裝置。計算機或其它處理系統可以利用任何類型的連接(例如,有線、無線等)接入網絡。本地通信介質可以用任何適當的介質(例如,區域網(LAN)、硬連線、無線鏈路、企業內部網等)實現。系統可以採用任何數目的任意常規或者其它資料庫、數據倉庫或存儲結構(例如,文件、資料庫、數據結構、數據或其它儲存庫等)保存信息。資料庫結構可以用任何數目的任意常規或者其它資料庫、數據倉庫或存儲結構(例如,文件、資料庫、數據結構、數據或其它儲存庫等)實現,以保存信息。資料庫和/或其它存儲結構可以遠離計算機或其它處理系統,或者在計算機或其它處理系統本地,並可以保存任何期望的數據。 本發明的實施例可用於分析代表任何信息的任意類型(例如,布爾、字符、字母數字、符號等)的數據。此外,本發明實施例可用於分析來自任何類型的存儲單元、系統或裝置(例如,資料庫、文件、存儲裝置、數據結構、處理裝置、各種固定或移動計算機或處理系統或裝置,等等)的數據。從一個或多個數據集分析的數據可以是任何大小,並包括任何類型的數據和元數據。本發明實施例可以採用任意數目的任何類型的用戶界面(例如,圖形用戶界面(GUI)、命令行、提示等)來獲得或提供信息(例如,獲得待進行的期望分析的信息,提供圖表或其它數據可視化,等等),其中所述界面可包括按照任何方式排列的任意信息。所述界面可包括布置在任意位置以通過任何適當的輸入裝置(例如,滑鼠、鍵盤等)輸入/顯示信息和啟動期望動作的任意數目的任何類型的輸入或執行機構(例如,按鈕、圖標、欄、框、連結等)。界面屏幕可包括按照任何方式,在屏幕之間導航的任何適當的執行器(例如,連結、選項卡等)。本發明的實施例並不局限於以上說明的特定任務或算法,相反可以用於為任何類型的處理,分析和生成來自任何數據源的數據的可視化顯示。
這裡使用的術語只是用於說明特定的實施例,並不意圖限制本發明。這裡使用的單數形式意圖還包括複數形式,除非上下文明確地另有所示。另外要明白當用在說明書中時,術語「包括」、「包含」、「具有」等指定陳述的特徵、整數、步驟、操作、元件和/或組件的存在,但不排除存在或增加一個或多個其它特徵、整數、步驟、操作、元件、組件和/或它們的群體。以下的權利要求中的所有裝置或步驟加功能要素的對應結構、材料、動作和等同物意圖包括與明確主張的其它要求保護的要素結合地實現功能的任何結構、材料或動作。本發明的說明只是出於舉例說明的目的給出的,而不是窮盡的,也不意圖把本發明局限於公開的形式。對本領域的普通技術人員來說,許多修改和變化是顯而易見的,而不脫離本發明的範圍和精神。選擇和說明實施例是為了更好地解釋本發明的原理和實際應用,和使本領域的其他普通技術人員能夠理解本發明的具有適合於預期的特定應用的各種修改的各個實施例。本領域的技術人員會理解,本發明的各個方面可被具體體現成系統、方法或電腦程式產品。因而,本發明的各個方面可以採取純硬體實施例,純軟體實施例(包括固件、駐留軟體、微代碼等),或者結合這裡通常都可被稱為「電路」、「模塊」或「系統」的軟體和硬體特徵的實施例的形式。此外,本發明的各個方面可以採取包含在一個或多個計算機可讀介質中的電腦程式產品的形式,所述一個或多個計算機可讀介質具有包含於其中的計算機可讀程序代碼。可以利用一個或多個計算機可讀介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或計算機可讀存儲介質。計算機可讀存儲介質可以是例如但不限於電、磁、光、電磁、紅外或半導體系統、設備或裝置,或者它們的任意適當組合。計算機可讀存儲介質的更具體例子(非窮舉列表)可包括具有一條或多條導線的電連接、可攜式計算機磁碟、硬碟、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦可編程只讀存儲器(EPR0M或閃速存儲器)、光纖、可攜式光碟只讀存儲器(CD-ROM)、光存儲裝置、磁存儲裝置,或者它們的任意適當組合。在本文的上下文中,計算機可讀存儲介質可以是能夠包含或保存供指令執行系統、設備或裝置使用的,或者結合指令執行系統、設備或裝置使用的程序的任何有形介質。
計算機可讀信號介質可包括計算機可讀程序代碼包含在其中,例如,包含在基帶中,或者體現為載波的一部分的傳播數據信號。這種傳播信號可以採取任意各種形式,包括但不限於電磁、光,或者它們的任意適當組合。計算機可讀信號介質可以是不是計算機可讀存儲介質但能夠傳遞、傳播或傳送供指令執行系統、設備或裝置使用的,或者結合指令執行系統、設備或裝置使用的程序的任何計算機可讀介質。包含在計算機可讀介質上的程序代碼可利用任何適當的介質傳送,包括但不限於無線、有線、光纜、RF等,或者它們的任何適當組合。可用一種或多種程式語言,包括諸如Java、Smalltalk、C++之類的面向對象的程式語言,和諸如「C」程式語言或類似程式語言之類的常規過程程式語言的任意組合,編寫執行本發明的各個方面的操作的電腦程式代碼。計算機可讀程序代碼可完全在用戶的計算機上運行,部分在用戶的計算機上運行,作為獨立的軟體包,部分在用戶的計算機上運行並且部分在遠程計算機上運行,或者完全在遠程計算機或伺服器上運行。在後一情況下,遠程計算機可通過任意類型的網絡,包括區域網(LAN)或廣域網(WAN),連接到用戶的計算機,或者可實現與外部計算機的連接(例如,利用網際網路服務提供商,經網際網路實現與外部計 算機的連接)。參考按照本發明的各個實施例的方法、設備(系統)和電腦程式產品的流程圖說明和/或方框圖,說明了本發明的各個方面。要明白流程圖說明和/或方框圖的每個方框,以及流程圖說明和/或方框圖中的各個方框的組合可用電腦程式指令實現。電腦程式指令可被提供給通用計算機、專用計算機或者其它可編程數據處理設備的處理器,從而產生機器,以致藉助計算機或其它可編程數據處理設備的處理器運行的指令產生實現在流程圖和/或方框圖的一個或多個方框中指定的功能/動作的裝置。電腦程式指令也可被保存在計算機可讀介質中,所述計算機可讀介質能夠指令計算機、其它可編程數據處理設備或者其它裝置按特定方式運行,以致保存在計算機可讀介質中的指令產生製成品,所述製成品包括實現在流程圖和/或方框圖的一個或多個方框中指定的功能/動作的指令。電腦程式指令也可被加載到計算機、其它可編程數據處理設備或其它裝置上,使得在計算機、其它可編程設備或其它裝置上執行一系列的操作步驟,從而產生計算機實現的處理,以致在計算機或其它可編程設備上執行的指令提供實現在流程圖和/或方框圖的一個或多個方框中指定的功能/動作的處理。附圖中的流程圖和方框解說明按照本發明的各個實施例的系統、方法和電腦程式產品的可能實現的體系結構、功能和操作。在這方面,流程圖或方框圖中的每個方框可代表包含實現指定邏輯功能的一個或多個可執行指令的模塊、程序段或一部分代碼。另外應注意,在一些備選實現中,在方框中表示的功能可不按照附圖中所示的順序發生。例如,接連表示的兩個方框事實上可以基本同時地執行,或者各個方框有時可按照相反的順序執行,取決於所涉及的功能。另外要注意方框圖和/或流程圖說明的每個方框,以及方框圖和/或流程圖說明中的各個方框的組合可用實現指定功能或動作的基於專用硬體的系統,或者專用硬體和計算機指令的組合實現。
權利要求
1.一種用於對從至少一個數據源獲得的數據集應用數據質量規則的計算機實現方法,包括 連同一組公共規則一起,從所述至少一個數據源取回數據,所述一組公共規則被配置成以按照該組公共規則中的一條或多條預定的數據質量規則的方式,格式化取回的數據; 利用至少一個可編輯微件,調整至少一條預定的數據質量規則,以形成適合於供指定應用程式使用的一組修改的數據質量規則;和 把所述一組修改的數據質量規則應用於取回的數據。
2.按照權利要求I所述的方法,其中每個微件與定義數據記錄的類別的實體相關,並且所述一組修改的數據質量規則被應用於取回的數據的各個記錄或各列。
3.按照權利要求I所述的方法,還包括 在指定應用程式的運行期間,為至少一個微件編輯所述一組修改的數據質量規則。
4.按照權利要求I所述的方法,還包括 通過從所述至少一個數據源的數據表中選擇屬性來生成微件,並利用所述微件來分組選擇的屬性。
5.按照權利要求4所述的方法,其中每個可編輯微件便於獨立於與該微件相關的一個屬性,修改應用於與該微件相關的另一個屬性的預定數據質量規則。
6.按照權利要求4所述的方法,其中每個可編輯微件包含列舉與該微件相關的屬性的第一圖形用戶界面,和包含便於修改預定數據質量規則的至少一個可編輯欄的至少一個另外的圖形用戶界面。
7.按照權利要求I所述的方法,其中所述一組公共規則被提供給第一客戶端和第二客戶端,所述第一客戶端利用第一可編輯微件調整至少一個預定的數據質量規則,以形成第一組修改的數據質量規則,以及所述第二客戶端利用第二可編輯微件調整至少一個預定的數據質量規則,以形成與所述第一組修改的數據質量規則不同的第二組修改的數據質量規則。
8.一種用於對從至少一個數據源獲得的數據集應用數據質量規則的系統,所述系統包括 連同一組公共規則一起,從所述至少一個數據源取回數據的源系統,所述一組公共規則被配置成以按照該組公共規則中的一條或多條預定的數據質量規則的方式,格式化取回的數據;和 從源系統接收取回的數據和一組公共規則的客戶端,其中所述客戶端包括微件模塊,所述微件模塊包含至少一個可編輯微件,以及所述客戶端還配置有邏輯模塊,用於 利用所述至少一個可編輯微件,調整至少一條預定的數據質量規則,以形成適合於供客戶端的指定應用程式使用的一組修改的數據質量規則;和 把所述一組修改的數據質量規則應用於取回的數據。
9.按照權利要求8所述的系統,其中每個微件與定義數據記錄的類別的實體相關,以及所述客戶端配置有把所述一組修改的數據質量規則應用於取回的數據的各個記錄或各列的邏輯模塊。
10.按照權利要求8所述的系統,其中所述客戶端還配置有在客戶端運行指定應用程式期間,為至少一個微件編輯所述一組修改的數據質量規則的邏輯模塊。
11.按照權利要求8所述的系統,其中所述客戶端還配置有通過從所述至少一個數據源的數據表中選擇屬性來生成微件,並利用所述微件來分組選擇的屬性的邏輯模塊。
12.按照權利要求11所述的系統,其中每個可編輯微件便於獨立於與該微件相關的一個屬性,修改應用於與該微件相關的另一個屬性的預定數據質量規則。
13.按照權利要求11所述的系統,其中每個可編輯微件包含列舉與該微件相關的屬性的第一圖形用戶界面,和包含便於修改預定數據質量規則的至少一個可編輯欄的至少一個另外的圖形用戶界面。
14.按照權利要求8所述的系統,其中所述源系統把從所述至少一個數據源取回的數據和所述一組公共規則提供給多個客戶端。
全文摘要
本發明涉及根據用戶應用程式要求修改數據質量規則的方法和系統。在把數據質量規則應用於從數據源獲得的數據集期間,連同一組公共規則一起,從數據源取回數據,所述一組公共規則被配置成以按照該組公共規則中的一條或多條預定的數據質量規則的方式,格式化取回的數據。利用至少一個可編輯微件,調整至少一條預定的數據質量規則,以形成適合於供指定應用程式使用的一組修改的數據質量規則。所述一組修改的數據質量規則被應用於取回的數據。
文檔編號G06F9/44GK102915237SQ20121022495
公開日2013年2月6日 申請日期2012年6月29日 優先權日2011年6月30日
發明者M·N·達尼, A·古普塔, M·K·莫哈尼亞, G·溫卡塔查利亞赫 申請人:國際商業機器公司