一種數據融合方法及裝置與流程
2023-05-19 03:27:51 2

本發明涉及計算機技術領域,特別涉及一種數據融合方法及裝置。
背景技術:
隨著信息技術與網際網路的不斷發展,同一業務對象(如企事業單位)在不同組織(如政府部門)中均可能會生成如圖像、視頻、音頻、文本等大規模的數據。與此同時,為能夠更加全面的實現對同一業務對象的監管,如何對各個組織中存儲的同一業務對象的數據進行融合已成為目前比較關注的問題。
目前,在對同一業務對象的數據進行融合時,主要是通過將各個組織中分別存儲的有關同一業務對象的數據都集中在一起。
但是,在某些組織中,雖然針對同一業務對象使用的欄位主鍵不同,然而這些欄位主鍵對應的數據卻是相同的,因此,如果只是將各個組織中存儲的相關數據全部集中在一起,將會造成數據冗餘。
技術實現要素:
本發明實施例提供了一種數據融合方法及裝置,能夠有效降低數據冗餘。
第一方面,本發明實施例提供了一種數據融合方法,預先構建至少一組關聯欄位主鍵,包括:
獲取目標業務對象的至少兩個待融合數據;
針對於每一個所述待融合數據,均執行A1至A2:
A1:確定所述待融合數據對應的至少一個參考欄位主鍵;
A2:根據確定的每一個所述參考欄位主鍵,將所述待融合數據拆分為至少一個欄位,其中,所述至少一個參考欄位主鍵和所述至少一個欄位一一對應;
根據所述至少一組關聯欄位主鍵,從確定的至少兩個所述參考欄位主鍵中確定出至少兩個目標欄位主鍵,其中,所述至少兩個目標欄位主鍵中的任意兩個所述目標欄位主鍵均不在同一組所述關聯欄位主鍵中;
利用每一個所述目標欄位主鍵分別對應的欄位組合成融合數據。
優選地,
在所述根據所述至少一組關聯欄位主鍵,從確定的至少兩個所述參考欄位主鍵中確定出至少兩個目標欄位主鍵之後,進一步包括:
檢測每一個所述目標欄位主鍵分別對應的欄位是否為結構化數據,如果是,則執行N1,否則,執行N2;
N1:確定所述欄位為第一欄位;
N2:確定所述欄位為第二欄位;
確定所述第二欄位的第一數量;
所述利用每一個所述目標欄位主鍵分別對應的欄位組合成融合數據,包括:
當所述第一數量為0時,利用各個所述第一欄位組合成融合數據。
優選地,
進一步包括:
所述確定所述第二欄位的第一數量,進一步包括:確定所述第一欄位的第二數量;
所述利用每一個所述目標欄位主鍵分別對應的欄位組合成融合數據,包括:
當所述第二數量為0時,確定各個所述第二欄位分別對應的至少一個第一索引信息;
利用各個所述第二欄位分別對應的所述至少一個第一索引信息和對應的目標欄位主鍵組合成融合數據。
優選地,
進一步包括:
所述確定所述第二欄位的第一數量,進一步包括:確定所述第一欄位的第二數量;
所述利用每一個所述目標欄位主鍵分別對應的欄位組合成融合數據,包括:
當所述第一數量不小於1且所述第二數量不小於1時,確定各個所述第二欄位分別對應的至少一個第二索引信息;
利用所述至少一個所述第一欄位、各個所述第二欄位分別對應的所述至少一個第二索引信息及對應的目標欄位主鍵組合成融合數據。
優選地,
進一步包括:
根據預設的至少一種數據轉換規則,分別將每一個所述目標欄位主鍵對應的欄位轉換為目標欄位;
所述利用每一個所述目標欄位主鍵分別對應的欄位組合成融合數據,包括:
利用各個所述目標欄位組合成融合數據。
優選地,
在所述利用每一個所述目標欄位主鍵分別對應的欄位組合成融合數據之後,進一步包括:
根據預設的至少一種展示模型,對所述融合數據進行展示;其中,所述至少一種展示模型包括關係圖、合弦圖、力導向圖、樹狀圖、列表和時間軸中的任意一種或多種。
第二方面,本發明實施例提供了一種數據融合裝置,包括:
構建單元,用於預先構建至少一組關聯欄位主鍵;
獲取單元,用於獲取目標業務對象的至少兩個待融合數據;
第一確定單元,用於針對於每一個所述待融合數據,確定所述待融合數據對應的至少一個參考欄位主鍵;
拆分單元,用於根據確定的每一個所述參考欄位主鍵,將所述待融合數據拆分為至少一個欄位,其中,所述至少一個參考欄位主鍵和所述至少一個欄位一一對應;
第二確定單元,用於根據所述至少一組關聯欄位主鍵,從確定的至少兩個所述參考欄位主鍵中確定出至少兩個目標欄位主鍵,其中,所述至少兩個目標欄位主鍵中的任意兩個所述目標欄位主鍵均不在同一組所述關聯欄位主鍵中;
融合單元,用於利用每一個所述目標欄位主鍵分別對應的欄位組合成融合數據。
優選地,
進一步包括:
第三確定單元,用於檢測每一個所述目標欄位主鍵分別對應的欄位是否為結構化數據,如果是,則確定所述欄位為第一欄位,否則,確定所述欄位為第二欄位;
欄位數量確定單元,用於確定所述第二欄位的第一數量;
所述融合單元,具體用於當所述第一數量為0時,利用各個所述第一欄位組合成融合數據。
優選地,
進一步包括:
所述欄位數量確定單元,進一步用於確定所述第一欄位的第二數量;
所述融合單元,具體用於當所述第二數量為0時,確定各個所述第二欄位分別對應的至少一個第一索引信息;利用各個所述第二欄位分別對應的所述至少一個第一索引信息和對應的目標欄位主鍵組合成融合數據;
優選地,
所述欄位數量確定單元,進一步用於確定所述第一欄位的第二數量;
所述融合單元,具體用於當所述第一數量不小於1且所述第二數量不小於1時,確定各個所述第二欄位分別對應的至少一個第二索引信息;利用所述至少一個所述第一欄位、各個所述第二欄位分別對應的所述至少一個第二索引信息及對應的目標欄位主鍵組合成融合數據。
優選地,
進一步包括:
數據展示單元,用於根據預設的至少一種展示模型,對所述融合數據進行展示;其中,所述至少一種展示模型包括關係圖、合弦圖、力導向圖、樹狀圖、列表和時間軸中的任意一種。
本發明實施例提供了一種數據融合方法及裝置,首先是構建出至少一組關聯欄位主鍵,其中,每一組關聯欄位主鍵中包括的各個關聯欄位主鍵相互關聯,也即表示對應相同的數據,其次在獲取目標業務對象對應的各個待融合數據後,通過確定出每一個待融合數據對應的參考欄位主鍵,一方面,可根據預先構建的至少一組關聯欄位主鍵,從各個參考欄位主鍵中確定出不再同一組關聯欄位主鍵中的各個目標欄位主鍵,另一方面可通過參考欄位主鍵將對應的待融合數據拆分成欄位,最終,只將所有目標欄位主鍵分別對應的欄位融合在一起,而避免將參考欄位主鍵不同當對應相同數據的欄位融合進去,因此,有效降低了數據冗餘。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本發明一個實施例提供的一種數據融合方法的流程圖;
圖2是本發明另一個實施例提供的一種數據融合方法的流程圖;
圖3是本發明實施例提供的數據融合裝置所在設備的硬體架構圖;
圖4是本發明實施例提供的一種數據融合裝置的結構示意圖;
圖5是本發明另一個實施例提供的一種數據融合裝置的結構示意圖;
圖6是本發明又一個實施例提供的一種數據融合裝置的結構示意圖。
具體實施方式
為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例,基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動的前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
如圖1所示,本發明實施例提供了一種數據融合方法,該方法可以包括以下步驟:
步驟101:預先構建至少一組關聯欄位主鍵。
步驟102:獲取目標業務對象的至少兩個待融合數據。
步驟103:針對於每一個所述待融合數據,確定所述待融合數據對應的至少一個參考欄位主鍵。
步驟104:根據確定的每一個所述參考欄位主鍵,將所述待融合數據拆分為至少一個欄位,其中,所述至少一個參考欄位主鍵和所述至少一個欄位一一對應。
步驟105:根據所述至少一組關聯欄位主鍵,從確定的至少兩個所述參考欄位主鍵中確定出至少兩個目標欄位主鍵,其中,所述至少兩個目標欄位主鍵中的任意兩個所述目標欄位主鍵均不在同一組所述關聯欄位主鍵中。
步驟106:利用每一個所述目標欄位主鍵分別對應的欄位組合成融合數據。
在本發明實施例中,首先是構建出至少一組關聯欄位主鍵,其中,每一組關聯欄位主鍵中包括的各個關聯欄位主鍵相互關聯,也即表示對應相同的數據,其次在獲取目標業務對象對應的各個待融合數據後,通過確定出每一個待融合數據對應的參考欄位主鍵,一方面,可根據預先構建的至少一組關聯欄位主鍵,從各個參考欄位主鍵中確定出不再同一組關聯欄位主鍵中的各個目標欄位主鍵,另一方面可通過參考欄位主鍵將對應的待融合數據拆分成欄位,最終,只將所有目標欄位主鍵分別對應的欄位融合在一起,而避免將參考欄位主鍵不同當對應相同數據的欄位融合進去,因此,有效降低了數據冗餘。
在本發明一個實施例中,在所述步驟105之後,進一步包括:檢測每一個所述目標欄位主鍵分別對應的欄位是否為結構化數據,如果是,則執行N1,否則,執行N2;
N1:確定所述欄位為第一欄位;
N2:確定所述欄位為第二欄位;
確定所述第二欄位的第一數量;
所述步驟106的具體實施方式包括:當所述第一數量為0時,利用各個所述第一欄位組合成融合數據。
在本發明實施例中,每個欄位包含一個欄位主鍵及該欄位主鍵對應的數據,如,欄位a(如該欄位為工商局的資料庫表格中的待融合數據拆分而來)中包含欄位主鍵「企業註冊日期」及「2012/9/3/08:00」,其中,「2012/9/3/08:00」為結構化數據;再如,欄位b(如該欄位為稅務局的資料庫表格中的待融合數據拆分而來)中包含欄位主鍵「企業繳稅金額」及「5萬元」,其中數據「5萬元」為結構化數據。由於第二欄位的數量為0,欄位a和欄位b為非關聯欄位,且如果每個欄位均對應一列,那麼最終組合而成的融合數據即為欄位a和欄位b組成的兩列。
在本發明一個實施例中,所述確定所述第二欄位的第一數量,進一步包括:確定所述第一欄位的第二數量;所述步驟106的具體實施方式包括:當所述第二數量為0時,確定各個所述第二欄位分別對應的至少一個第一索引信息;利用各個所述第二欄位分別對應的所述至少一個第一索引信息和對應的目標欄位主鍵組合成融合數據。
例如,欄位c(如該欄位來源於網際網路數據)中包含欄位主鍵「企業信用」及對應的一段播放視頻,其中該播放視頻為非結構化數據;再如欄位d(如該欄位來源於某委辦局)中包含欄位主鍵「企業新聞」及對應的一張圖像,其中該圖像為非結構化數據。由於第一欄位的數量為0,欄位c和欄位d為非關聯的欄位,那麼最終在進行數據融合時,應分別針對欄位c中的播放視頻及欄位d中的圖像分別提取出至少一個索引信息,例如,針對播放視頻共提取出兩個索引信息,並分別為「視頻提交人:張某某」和「提交日期:2013/1/1/08:00」,針對圖像共提取出一個索引信息,為「圖像提交人:李某」,這樣,最終組合而成的融合數據,即為「企業信用」與對應的「視頻提交人:張某某」、「提交日期:2013/1/1/08:00」,以及「企業新聞」與對應的「圖像提交人:李某」。
在本發明一個實施例中,所述確定所述第二欄位的第一數量,進一步包括:確定所述第一欄位的第二數量;所述步驟106的具體實施方式包括:當所述第一數量不小於1且所述第二數量不小於1時,確定各個所述第二欄位分別對應的至少一個第二索引信息;利用所述至少一個所述第一欄位、各個所述第二欄位分別對應的所述至少一個第二索引信息及對應的目標欄位主鍵組合成融合數據。
例如,以上述實施例中的欄位a及欄位c為例,在進行數據融合時,由於欄位a屬於結構化數據,而欄位c屬於非結構化數據,也即第一欄位的數量為1,第二欄位的數量為1,因此,應先將欄位c按照上述實施例提取出索引信息,那麼在本發明實施例中,最終由欄位a,以及欄位主鍵「企業信用」與對應的兩個索引信息「視頻提交人:張某某」、「提交日期:2013/1/1/08:00」組合而成。其中,欄位a及欄位c也為非關聯的欄位,且可把欄位a作為融合數據的第1列(第一行為企業註冊日期、第二行為2012/9/3/08:00),而將企業信用作為第2列的第一行,視頻提交人:張某某作為第2列的第二行,提交日期:2013/1/1/08:00作為第2列的第三行。針對多個欄位融合,可依次類推…
需要說明的是,融合數據的組成形式並不局限於上述各個實施例,還可包括其他多種可以實現的組成形式。
在本發明一個實施例中,為了能夠使數據的格式統一,進一步包括:根據預設的至少一種數據轉換規則,分別將每一個所述目標欄位主鍵對應的欄位轉換為目標欄位;所述步驟106的具體實施方式可包括:利用各個所述目標欄位組合成融合數據。
例如,針對日期設置的數據轉換規則為年/月/日/時分:秒毫秒,假設拆分得到的欄位e中記錄的企業註冊日期為00:00/2/3/2016,欄位f中記錄的企業繳稅日期為2016/3/1/09:00,那麼為使融合數據中所有日期的格式統一,則需將欄位e中記錄的企業註冊日期按照設置的標準:年/月/日/時分:秒毫秒,轉換為2016/3/2/00:00,由於欄位f中記錄的日期格式與規則相同,因此,無需在進行轉換。之後,由完成轉換的欄位e與欄位f組合成融合數據(欄位e與欄位f為非關聯的欄位)。那麼針對其他的各個欄位中記錄的與標準不相同的日期,與欄位e的轉換原理相同,不再贅述。
再如,針對性別設置的數據轉換規則為M(表示男)、F(表示女),假設拆分得到的欄位g中記錄的企業合法人的性別用0(表示男)、1表示(表示女),欄位h中記錄的企業納稅人的性別用M(表示男)、F(表示女)表示,那麼為使融合數據中所有性別表示統一,則需按照設置的標準M和F,將欄位g中記錄的企業合法人的性別0轉換為M,將性別1轉換為F,但是由於欄位h中記錄的性別表示與規則相同,因此,無需在進行轉換。之後,由完成轉換的欄位g及符合標準的欄位h組合成融合數據(欄位g和欄位h為非關聯的欄位)。
在本發明一個實施例中,在所述步驟106之後,可進一步包括:根據預設的至少一種展示模型,對所述融合數據進行展示;其中,所述至少一種展示模型包括關係圖、合弦圖、力導向圖、樹狀圖、列表和時間軸中的任意一種。
在本發明實施例中,在將各個待融合數據實現融合之後,可向每一個組織內部人員(如政府管理人員)提供一個數據檢索系統,如,政府管理人員可通過輸入關鍵字,如企業名稱、法人姓名、企業註冊號以及組織機構代碼等以列表的形式將某企業的所有融合數據進行展示。例如,針對某企業的股東、投資、高管、法院判決公告、歷史股東等維度的文字信息可以關係圖、合弦圖、力導向圖、樹狀圖等關聯圖的形式進行展示,而且還可實現不同關聯圖之間的轉換。再如,針對企業的榮譽事件、財資事件、違規事件、經營事件、資本運作事件等類列,系統可對每個類別的事件設立一個時間軸,最終將企業的事件以在時間軸上散點的形式展示。
除此之外,針對目標業務對象的融合數據的展示模型,並不局限於上述實施例中提到的關係圖、合弦圖、力導向圖、樹狀圖、列表和時間軸,還可包括其他多種展示模型。
下面將以目標業務對象為企業A、企業A共包括3個待融合數據為例,詳細說明本發明實施例提供的一種數據融合方法,如圖2所示,該方法可以包括以下步驟:
步驟201:預先構建N(≥1)組關聯欄位主鍵。
預先構建出N(≥1)組關聯欄位主鍵,那麼無論是本次針對企業A的數據進行融合,還是之後針對其它業務對象的數據進行融合,均可以利用這N組關聯欄位主鍵。可見,N的值應不宜過小,且每一組中的關聯欄位主鍵的數量也不宜太小。
在本發明實施例中,例如,共構建了3組關聯欄位主鍵,且這3組關聯欄位主鍵可以囊括企業A的相關待融合數據的所有可能關聯的欄位主鍵,其中,第1組關聯欄位主鍵包括X、M、P;第2組關聯欄位主鍵包括R、Z;第3組關聯欄位主鍵包括K、L。
步驟202:分別獲取企業A的待融合數據1、待融合數據2及待融合數據3。
例如,待融合數據1的來源可能是工商局、稅務局、住建局、環保局及食藥監局中的任意一個委辦局,那麼,如利用ETL(Extract-Transform-Load,數據抽取工具)工具從相應委辦局對應的數據源中抽取出有關企業A的所有待融合數據,而且還可通過對抽取出的待融合數據進行簡單的清洗加工,以對一些異常數據進行檢測與剔除,最後將剩餘得到的待融合數據1加載至預先定義的數據倉庫模型中。
再如,待融合數據2的來源可能是類似黨政機關、行政機構、司法機關等數據保密性要求較高的部門,此時,可通過與相應的政務外網進行連接,使用特定的安全系統接口採集相關部門中的待融合數據。而且還可通過安全系統接口實現待融合數據的更新及待融合數據質量校驗的功能。
又如,待融合數據3的來源可能是網際網路,此時可藉助大型網際網路搜尋引擎,通過爬取關鍵字的方式實現待融合數據3的獲取。
步驟203:確定待融合數據1對應的參考欄位主鍵為X、Y、Z,待融合數據2對應M、N,待融合數據3對應P、Q、R。
步驟204:根據X、Y、Z,將待融合數據1拆分為欄位x、y及z,根據M、N,將待融合數據2拆分為欄位m及n,根據P、Q、R,將待融合數據3拆分為欄位p、q及r。
以待融合數據1為例,待融合數據1中包括X、Y、Z共三個參考欄位主鍵,其中,每一個參考欄位主鍵均會對應一部分數據,例如,參考欄位主鍵X為「繳稅日期」,相對應的數據可能包括「2016/1/1/08:00」、「2017/1/1/08:00」,則將待融合數據1拆分出的欄位x(視為一列)中的這一列的第一行為繳稅日期,第二行和第三行分別為2016/1/1/08:00和2017/1/1/08:00。
步驟205:根據構建的N組關聯欄位主鍵,確定出不再同一組的5個目標欄位主鍵X、Y、Z、N及Q。
根據步驟201中的3組關聯欄位主鍵,可以得出,待融合數據1中的參考欄位主鍵X、待融合數據2中的參考欄位主鍵M及待融合數據3中的參考欄位主鍵P是關聯欄位主鍵,也就是說,這三個參考欄位主鍵對應的數據是相同的,根據上述步驟204,對應的均是2016/1/1/08:00和2017/1/1/08:00這兩個繳稅日期,因此,只需保留這三個參考欄位主鍵中的任意一個即可,但具體是保留哪一個,可在根據實際需要在上述步驟201中設置出來。
另外,待融合數據1中的參考欄位主鍵Z與待融合數據3中的參考欄位主鍵R是關聯的,因此與上述方法相同,保留其中一個。
在本發明實施例中,最終在參考欄位主鍵X、M、P中保留的是X,在參考欄位主鍵Z和P中保留的是Z,因此最後確定出的目標欄位主鍵為待融合數據1中的X、Y、Z,待融合數據2中的N及待融合數據3中的Q。
步驟206:檢測出欄位x、y及z均為結構化數據,欄位n及q為非結構化數據。
在本發明實施例中,是以既包括結構化數據以及非結構化數據為例。
步驟207:確定欄位n對應的兩個索引信息,欄位q對應的一個索引信息。
針對欄位n及欄位q中分別對應的非結構化數據,並不能直接進行融合,而是需要通過在每一個非結構化數據中抽取出相對應的索引要素。
例如,針對欄位n中抽取的兩個索引信息分別是「提交人:王某」及「提交日期2016/1/1/08:00」。
另外,為保證數據格式的統一,還可預先針對日期、性別等其它的數據轉換規則,以將欄位x、欄位y、欄位z中的相應數據,以及欄位n及欄位q分別對應的索引信息進行相應的數據轉換。
步驟208:將欄位x、y、z,欄位n的兩個索引信息和X,欄位q的一個索引信息及Q組合成融合數據。
在本發明實施例中,以欄位x、欄位y、欄位z分別對應一列為例,那麼在進行最終的數據融合時,可預先設置一個融合數據表,然後將欄位x、欄位y、欄位z作為該融合數據表的前三列,且每一列的第一行分別為目標欄位主鍵X、Y、Z,每一列的第二行、第三行…放置X、Y、Z分別對應的數據,那麼第4列的第一行可為目標欄位主鍵N,第4列的第二行和第三行可分別放置欄位n的兩個索引信息「提交人:王某」及「提交日期2016/1/1/08:00」,第5列的第一行可為目標欄位主鍵Q,第5列的第二行可為Q對應的一個索引信息。
如圖3、圖4所示,本發明實施例提供了一種一種數據融合裝置。裝置實施例可以通過軟體實現,也可以通過硬體或者軟硬體結合的方式實現。從硬體層面而言,如圖3所示,為本發明實施例提供的數據融合裝置所在設備的一種硬體結構圖,除了圖3所示的處理器、內存、網絡接口、以及非易失性存儲器之外,實施例中裝置所在的設備通常還可以包括其他硬體,如負責處理報文的轉發晶片等等。以軟體實現為例,如圖4所示,作為一個邏輯意義上的裝置,是通過其所在設備的CPU將非易失性存儲器中對應的電腦程式指令讀取到內存中運行形成的。本實施例提供的一種數據融合裝置,包括:
構建單元401,用於預先構建至少一組關聯欄位主鍵;
獲取單元402,用於獲取目標業務對象的至少兩個待融合數據;
第一確定單元403,用於針對於每一個所述待融合數據,確定所述待融合數據對應的至少一個參考欄位主鍵;
拆分單元404,用於根據確定的每一個所述參考欄位主鍵,將所述待融合數據拆分為至少一個欄位,其中,所述至少一個參考欄位主鍵和所述至少一個欄位一一對應;
第二確定單元405,用於根據所述至少一組關聯欄位主鍵,從確定的至少兩個所述參考欄位主鍵中確定出至少兩個目標欄位主鍵,其中,所述至少兩個目標欄位主鍵中的任意兩個所述目標欄位主鍵均不在同一組所述關聯欄位主鍵中;
融合單元406,用於利用每一個所述目標欄位主鍵分別對應的欄位組合成融合數據;
如圖5所示,在本發明一個實施例中,進一步包括:
進一步包括:
第三確定單元501,用於檢測每一個所述目標欄位主鍵分別對應的欄位是否為結構化數據,如果是,則確定所述欄位為第一欄位,否則,確定所述欄位為第二欄位;
欄位數量確定單元502,用於確定所述第二欄位的第一數量;
所述融合單元406,具體用於當所述第一數量為0時,利用各個所述第一欄位組合成融合數據。
在本發明一個實施例中,所述欄位數量確定單元502,進一步用於確定所述第一欄位的第二數量;
所述融合單元406,具體用於當所述第二數量為0時,確定各個所述第二欄位分別對應的至少一個第一索引信息;利用各個所述第二欄位分別對應的所述至少一個第一索引信息和對應的目標欄位主鍵組合成融合數據;
在本發明一個實施例中,所述欄位數量確定單元502,進一步用於確定所述第一欄位的第二數量;
所述融合單元406,具體用於當所述第一數量不小於1且所述第二數量不小於1時,確定各個所述第二欄位分別對應的至少一個第二索引信息;利用所述至少一個所述第一欄位、各個所述第二欄位分別對應的所述至少一個第二索引信息及對應的目標欄位主鍵組合成融合數據。
如圖6所示,在本發明一個實施例中,
進一步包括:
數據展示單元601,用於根據預設的至少一種展示模型,對所述融合數據進行展示;其中,所述至少一種展示模型包括關係圖、合弦圖、力導向圖、樹狀圖、列表和時間軸中的任意一種。
本發明實施例提供了一種可讀介質,包括執行指令,當存儲控制器的處理器執行所述執行指令時,所述存儲控制器執行上述各個實施例中的任意一個方法。
本發明實施例提供了一種存儲控制器,包括:處理器、存儲器和總線;
所述存儲器用於存儲執行指令,所述處理器與所述存儲器通過所述總線連接,當所述存儲控制器運行時,所述處理器執行所述存儲器存儲的所述執行指令,以使所述存儲控制器執行上述各個實施例中的任意一個方法。
上述裝置內的各單元之間的信息交互、執行過程等內容,由於與本發明方法實施例基於同一構思,具體內容可參見本發明方法實施例中的敘述,此處不再贅述。
綜上,本發明各個實施例至少具有如下有益效果:
1、在本發明實施例中,首先是構建出至少一組關聯欄位主鍵,其中,每一組關聯欄位主鍵中包括的各個關聯欄位主鍵相互關聯,也即表示對應相同的數據,其次在獲取目標業務對象對應的各個待融合數據後,通過確定出每一個待融合數據對應的參考欄位主鍵,一方面,可根據預先構建的至少一組關聯欄位主鍵,從各個參考欄位主鍵中確定出不再同一組關聯欄位主鍵中的各個目標欄位主鍵,另一方面可通過參考欄位主鍵將對應的待融合數據拆分成欄位,最終,只將所有目標欄位主鍵分別對應的欄位融合在一起,而避免將參考欄位主鍵不同當對應相同數據的欄位融合進去,因此,有效降低了數據冗餘,而且也便於對數據進行查看。
2、在本發明實施例中,通過將目標業務對象的來自不同數據源的待融合數據進行融合,打破了各個數據源之間孤立的數據存儲,從而也可提高對目標業務對象監管的準確性。
3、在本發明實施例中,在將目標業務對象的各個待融合數據融合之後,向各個組織內部人員提供了展示系統,該展示系統可根據接收到的不同的點擊觸發,以不同的展示模型展示目標業務對象的相關數據。
需要說明的是,在本文中,諸如第一和第二之類的關係術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關係或者順序。而且,術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句「包括一個〃·····」限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同因素。
本領域普通技術人員可以理解:實現上述方法實施例的全部或部分步驟可以通過程序指令相關的硬體來完成,前述的程序可以存儲在計算機可讀取的存儲介質中,該程序在執行時,執行包括上述方法實施例的步驟;而前述的存儲介質包括:ROM、RAM、磁碟或者光碟等各種可以存儲程序代碼的介質中。
最後需要說明的是:以上所述僅為本發明的較佳實施例,僅用於說明本發明的技術方案,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內所做的任何修改、等同替換、改進等,均包含在本發明的保護範圍內。