新四季網

一種智能電力客服系統的構建方法及系統與流程

2023-06-07 12:46:56

本發明涉及電力
技術領域:
,特別涉及一種智能電力客服系統的構建方法及系統。
背景技術:
:隨著電力體制改革的持續推進以及全社會對電力的關注度的提高,電力客戶數量快速增長,用電需求趨於多元化,用戶更加注重服務體驗,渴望得到更便捷、多渠道、多元化、更高效的服務,對客戶服務的要求越來越高。基於網際網路、尤其是移動網際網路的高速發展,催生了大量的客服需求,對客服人員的管理提出了更高要求。目前,傳統的客服中心,客服人員通常是根據產品說明手冊或者電子知識庫作為業務支撐。當客戶來電詢問,而客服人員的記憶中又無相關知識點時,就會從產品說明手冊或者電子知識庫中尋找答案,以響應客戶對於業務問題的服務需求。但是,客服人員從產品說明手冊或者電子知識庫中對眾多的業務知識和內容進行查找時,由於業務水平參差不齊,對業務問題分類的維度、問題類別、問題等級以及答案的模糊匹配程度等的把握不一,容易導致客戶等待的時間過長甚至找不到答案的情況發生,而且不同的客服人員針對同一個問題可能會有多個版本的解答,耗費大量人力物力卻導致用戶的體驗不佳。技術實現要素:有鑑於此,本發明提供了一種智能電力客服系統的構建方法及系統,用於構建智能電力客服系統,以縮短客戶的等待時間,並實現對業務問題的準確解答,提升用戶體驗。為實現上述目的,本發明提供如下技術方案:一種智能電力客服系統的構建方法,包括:採集電力業務數據,根據所述電力業務數據建立電力詞庫;所述電力詞庫包括通用詞庫、行業詞庫、近義詞庫和包含詞庫;採集電力知識數據,根據所述電力知識數據建立電力知識庫;所述電力知識庫包括專業知識庫和本體庫;根據電力領域的電力實體、電力實體之間的關聯關係以及每個電力實體的屬性及屬性值,建立電力知識圖譜;根據所述電力詞庫、電力知識庫和所述電力知識圖譜,構建智能電力客服系統。優選地,所述採集電力業務數據,根據所述電力業務數據建立電力詞庫,包括:從通用已開放詞庫數據、業務資料數據、網站數據和外部數據中採集電力業務數據,並對採集的所述電力業務數據進行匯總;對所述電力業務數據進行數據處理;所述數據處理包括新詞抽取處理、詞性標註處理、詞頻統計處理以及權重計算處理;對經過所述數據處理之後的所述電力業務數據進行分類,並根據所述分類分別構建所述通用詞庫、所述行業詞庫、所述近義詞庫和所述包含詞庫。優選地,所述採集電力知識數據,根據所述電力知識數據建立電力知識庫,包括:採集所述電力領域的標準問題和標準答案,按照預設的分級標準使所述標準問題和所述標準答案分布在不同的目錄層級,構建所述專業知識庫;基於動態模板構建語義表達式,並按照所述語義表達式中的本體的類別和內容,使所述語義表達式中的本體分布在不同的目錄層級,構建所述本體庫。優選地,所述根據電力領域的電力實體、電力實體之間的關係以及每個電力實體的屬性及屬性值,建立電力知識圖譜,包括:為每個所述電力實體設定一個標識符,並確定每個所述電力實體的屬性、屬性值及各個所述電力實體之間的關聯關係;根據所述標識符、屬性、屬性值及所述關聯關係進行實體對齊、知識圖譜模式構建、屬性和屬性值決策、屬性值推理、關係推理以及實體重要性排序,建立所述電力知識圖譜;所述電力知識圖譜中的節點為各個所述電力實體,所述電力知識圖譜中的邊為各個所述電力實體之間的關聯關係。優選地,還包括:對所述智能電力客服系統中的所述電力詞庫、所述電力知識庫和所述電力知識圖譜進行維護更新。一種智能電力客服系統的構建系統,包括:詞庫建立模塊,用於採集電力業務數據,根據所述電力業務數據建立電力詞庫;所述電力詞庫包括通用詞庫、行業詞庫、近義詞庫和包含詞庫;知識庫建立模塊,用於採集電力知識數據,根據所述電力知識數據建立電力知識庫;所述電力知識庫包括專業知識庫和本體庫;圖譜建立模塊,用於根據電力領域的電力實體、電力實體之間的關聯關係以及每個電力實體的屬性及屬性值,建立電力知識圖譜;系統構建模塊,用於根據所述電力詞庫、電力知識庫和所述電力知識圖譜,構建智能電力客服系統。優選地,所述詞庫建立模塊,包括:採集單元,用於從通用已開放詞庫數據、業務資料數據、網站數據和外部數據中採集電力業務數據,並對採集的所述電力業務數據進行匯總;對所述電力業務數據進行數據處理;所述數據處理包括新詞抽取處理、詞性標註處理、詞頻統計處理以及權重計算處理;分類單元,用於對經過所述數據處理之後的所述電力業務數據進行分類,並根據所述分類分別構建所述通用詞庫、所述行業詞庫、所述近義詞庫和所述包含詞庫。優選地,所述知識庫建立模塊,包括:專業知識庫構建單元,用於採集所述電力領域的標準問題和標準答案,按照預設的分級標準使所述標準問題和所述標準答案分布在不同的目錄層級,構建所述專業知識庫;本體庫構建單元,用於基於動態模板構建語義表達式,並按照所述語義表達式中的本體的類別和內容,使所述語義表達式中的本體分布在不同的目錄層級,構建所述本體庫。優選地,所述圖譜建立模塊,包括:確定單元,用於為每個所述電力實體設定一個標識符,並確定每個所述電力實體的屬性、屬性值及各個所述電力實體之間的關聯關係;建立單元,用於根據所述標識符、屬性、屬性值及所述關聯關係進行實體對齊、知識圖譜模式構建、屬性和屬性值決策、屬性值推理、關係推理以及實體重要性排序,建立所述電力知識圖譜;所述電力知識圖譜中的節點為各個所述電力實體,所述電力知識圖譜中的邊為各個所述電力實體之間的關聯關係。優選地,還包括:更新模塊,用於對所述智能電力客服系統中的所述電力詞庫、所述電力知識庫和所述電力知識圖譜進行維護更新。通過本申請提供的智能電力客服系統的構建方法及系統,採集電力業務數據,根據所述電力業務數據建立電力詞庫;所述電力詞庫包括通用詞庫、行業詞庫、近義詞庫和包含詞庫;採集電力知識數據,根據所述電力知識數據建立電力知識庫;所述電力知識庫包括專業知識庫和本體庫;根據電力領域的電力實體、電力實體之間的關聯關係以及每個電力實體的屬性及屬性值,建立電力知識圖譜;根據所述電力詞庫、電力知識庫和所述電力知識圖譜,構建智能電力客服系統。可見,本申請實施例提供的技術方案,基於電力業務數據、電力知識數據和電力實體構建電力詞庫、電力知識庫和電力知識圖譜,能夠整合自然語言處理和人機互動技術,並涵蓋電力領域的各種業務和知識,為構建出的智能電力客服系統提供基礎支撐,能夠讓構建的智能電力客服系統更清楚用戶的意圖,直接提供給用戶準確的答案,可以縮短客戶的等待時間,並實現對業務問題的準確解答,從而提升用戶體驗。附圖說明為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1是本發明第一具體實施例提供的智能電力客服系統的構建方法的流程示意圖;圖2是本發明第二具體實施例提供的智能電力客服系統的構建系統的結構示意圖。具體實施方式相關術語解釋:詞庫:詞庫是詞語資料的集合,存貯於資料庫中以備特定的程序檢索調用;知識庫:知識庫是知識工程中結構化,易操作,易利用,全面有組織的知識集群,是針對某一(或某些)領域問題求解的需要,採用某種(或若干)知識表示方式在計算機存儲器中存儲、組織、管理和使用的互相聯繫的知識片集合;這些知識片包括與領域相關的理論知識、事實數據,由專家經驗得到的啟發式知識,如某領域內有關的定義、定理和運算法則以及常識性知識等;知識圖譜:知識圖譜本質上是語義網絡,是一種基於圖的數據結構,根據專家設計的規則與不同種類的實體連接所組成的關係網絡;知識圖譜提供了從「關係」的角度去分析問題的能力。下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。請參閱圖1,圖1是本發明第一具體實施例提供的電力客服系統的構建方法的流程示意圖。本發明第一具體實施例提供的電力客服系統的構建方法,包括以下步驟:S101:採集電力業務數據,根據所述電力業務數據建立電力詞庫;所述電力詞庫包括通用詞庫、行業詞庫、近義詞庫和包含詞庫;在本申請實施例中,所述採集電力業務數據,根據所述電力業務數據建立電力詞庫,包括:從通用已開放詞庫數據、業務資料數據、網站數據和外部數據中採集電力業務數據,並對採集的所述電力業務數據進行匯總;對所述電力業務數據進行數據處理;所述數據處理包括新詞抽取處理、詞性標註處理、詞頻統計處理以及權重計算處理;對經過所述數據處理之後的所述電力業務數據進行分類,並根據所述分類分別構建所述通用詞庫、所述行業詞庫、所述近義詞庫和所述包含詞庫。電力詞庫作為典型知識庫的專業業務知識一部分,是服務於業務管理、客服代表、廠家部門及用電客戶群體的多方面的電力專業信息。通過詞庫建設是進行文本挖掘的基礎,為電力客服服務中心提升服務能力提供支撐。本申請實施例提供的方法中涉及到的對電力詞庫的建設與維護如下:電力詞庫構建主要包含數據來源、數據處理以及詞庫建設3個方面,下面將分別針對上述3個方面進行詳細闡述,具體如下:1)數據來源。電力詞庫的主要來源包含通用已開放詞庫、業務資料數據、網站數據和其他外部數據。需要利用數據採集技術,即利用第三方工具對可能使用的文本中的詞進行匯總。常用以下主要2種採集方式:一是自動採集。通過將95598業務支持系統等的文本數據進行採集,實現文本正文內容的自動提取。圍繞電力客戶服務的各種業務,通過採集業務系統中的文本數據,為構建詞庫提供基礎支撐,為後續智能問答查詢等提高效率提供鋪墊。二是手動添加。當然除了自動採集,也可由用戶人工自由輸入任意的詞彙。作為自動化採集的有效補充手段,人工方式是建設詞庫的一個重要方法。經過自動採集和手動採集後,此時的數據的特點是分散的、異構的、不確定的、冗餘的、不完備的和含噪音的,還不能直接用來構建詞庫,需要對這些數據進行處理後才能使用。2)數據處理。將各種分散的文本數據來源進行整合,將非結構化數據和結構化數據進行異構到同構的轉化,將來源廣泛且不一致的不確定數據進行清晰化操作,將自動採集到的數據進行人工自定義添加保證其完備性,將數據中的錯誤或引起歧義的數據清洗形成詞庫建設的可靠來源。一是新詞抽取。其中自動化更新中最重要的一個就是新詞發現。二是詞性標註。詞性標註的效果直接影響著基於標註結果的各種信息處理的準確度。詞性標註主要將詞語歸類為名詞、動詞、助詞、副詞、連詞、介詞、形容詞、時間詞、代詞、數詞、量詞、前綴、後綴等;如通過詞語詞性的標註要準確識別出「國家電網客戶服務中心」是一個組織機構名稱,是一個特殊名詞。三是統計詞頻。從中文文章中拆分出單詞後,將詞語在各個數據來源文本中出現的頻次進行統計,可以幫助更好地分析文章句子語義。詞頻排序之後可以導出txt文檔,以備繼續作進一步統計分析。四是權重計算。權重是指詞語在整體詞庫中的相對重要程度。考慮詞語的業務使用場景以及詞語的出現頻率等,並在此基礎上給出詞庫中的詞語權重計算方法。3)詞庫建設。按照使用意圖進行分類建設,主要包括:通用詞庫、行業詞庫、近義詞庫和包含詞庫。詞庫建設的一個重點就是為了能夠實現和客戶服務領域的應用的無縫對接。一是通用詞庫。在電力詞庫的建設和使用中,是不可能完全脫離現有各種通用詞庫的。現有通用詞庫的詞彙是詞庫選詞的主要來源,否則就會造成不必要的重複勞動;通用詞庫主要是基於外部開放的詞庫進行自動獲取,其目的在於覆蓋各種範圍的漢語詞彙,為智能問答、語音質檢等提供完備支撐。詞語詞性頻次是v.50現在n.30山西n.25多少n.35家庭n.10………表1通用詞庫二是行業詞庫。在電力詞庫的建設和使用中,最重要和核心的是構建行業詞庫。行業詞庫的與實際電力業務密切相關,構建一個符合當前業務場景的專用詞表非常重要,多通過人工的方式進行構建,涵蓋發電、輸電、變電、配電、電力調度和售電等全鏈條的行業詞彙。如電價、變電器、電壓、新能源等。分詞基礎是分詞詞庫,客戶服務中心大數據場景建設中涉及大量文本挖掘內容,電力行業詞庫可增加用戶自定義詞,提高文本分詞結果準確性。詞語詞性頻次電價n.25電量n.10電費n.20居民n.5充電樁n.8………表2行業詞庫三是近義詞庫。將現有的各種漢語詞彙匯集在一起,去除重複,遇到對同一概念的表達意義一致的情況,採用具有等同關係的詞語聯繫起來,從而達到詞庫同義性的要求。即從通用詞庫、行業詞庫中梳理出近義詞,在業務中這些詞可以被互相替代,其中最典型的詞被稱為近義詞中的代表詞。如(目前、現在),(居民、家庭),(電價、電力價格)等。代表詞近義詞…近義詞目前目前…現在居民居民…家庭…………表3近義詞庫近義詞基於模式的方法可以抽取到一部分。比如在語料中設置規則「A的簡稱是B」、「A和B是近義詞」、「A的近義詞是B」、「A的原名是B」等,自動檢索語料,從中抽取出近義詞(見下表4)。模式示例A1又叫A2元宵節又叫上元節A1又稱A2元宵節又稱上元節A1簡稱A2上海簡稱滬A1又名A2荷花又名蓮花A1俗稱A2計算機俗稱電腦A1原名A2老舍原名舒慶春A1是A2的近義詞喜歡是喜愛的近義詞A1是A2的近義詞美麗是漂亮的近義詞A1是A2的簡稱滬是上海的簡稱表4近義詞提取規則除此之外,電力領域專業人員可根據實際業務需求,手動提取標註出敏感詞近義詞詞庫、情感詞近義詞詞庫等,支撐客戶服務水平的提升。四是包含詞庫。包含詞是具備某類相似特徵的詞的組合,如覆蓋省名集合、市名集合、縣名集合、區名集合、街道名集合等,如覆蓋百家姓等各種姓氏集合。目前語音識別引擎在錄音轉譯時對姓氏詞、電力行業詞、地址地名等行業詞轉譯不準確,通過電力包含詞庫建設,形成電力姓氏以及地址/地名庫等供語音識別引擎使用,有助於提高語音識別準確率。集合名元素…元素省名山西…西藏姓氏張…劉…………表5包含詞庫包含詞基於模式的方法可以抽取到一部分。比如在語料中設置規則「A包含A1、A2,……」、「A1、A2,……是A的子集」、「A1、A2,……屬於A」等,自動檢索語料,從中抽取出包含詞。表6包含詞提取規則除此之外,電力領域專業人員可根據實際業務需求,手動提取標註出市名包含詞庫、區名包含詞庫和街道包含詞庫等,輔助在線服務水平的提升。舉例詞庫的應用。根據詞庫可以進行用戶問題文本的分詞。如電力詞庫中已有詞語「山西」、「現在」、「電價」、「家庭」、「居民」、「是」、「多少」(見通用詞庫表、行業詞庫表、近義詞庫表和包含詞庫表),若在業務場景中出現一句話「山西現在家庭電價是多少」,需要根據詞庫完成分詞。以最大正向匹配算法為例,首先將這句話進行拆字,從左至右第一個字為「山」字,在詞庫中未查到。繼續往後追加為「山西」,在電力詞庫中找到對應的詞語。此時還不能確定「山西」是否為詞庫中以山西為前綴的最長的詞語,繼續往後追加直至「山西現在家庭電價是多少」為止都沒有查到更長的詞,此時輸出完成首個詞語「山西」的切詞。在剩餘「現在家庭電價是多少」中,循環上述步驟,依次可以拆出剩餘的詞。得到最終的分詞結果為「山西/現在/家庭/電價/是/多少」,聯繫我們的近義詞庫和包含詞庫,業務場景中的原話「山西現在家庭電價是多少」形成推薦語義「[省名|山西][現在][居民][電價][是][多少]」。詞庫的維護更新。詞庫的維護更新是保證一個詞庫的長期有效性。建設一個詞庫並不是一成不變的,需要對詞庫進行持續的長期維護。根據詞庫包含的內容和其特點,具體維護更新如下:通用詞庫。根據已有通用詞庫新詞完成通用詞提取,根據電力業務自身的更新擴展進而從文本語料中新出現的通用詞更新。行業詞庫。根據已有通用詞庫新行業詞提取形成一部分更新,根據電力業務自身的更新擴展進而從文本語料人工提取出新行業詞,或者根據新詞發現的詞語進行更新。包含詞庫。從更新後的通用詞庫和行業詞庫中提取新的包含詞,根據電力業務自身的更新擴展進而從文本語料中提取新的包含詞,基於規則的包含詞語更新等。近義詞庫。需要根據通用詞庫、行業詞庫和已有近義詞庫更新提取新的近義詞,根據電力業務自身的更新擴展進而從文本語料中提取新的近義詞,基於規則的近義詞語更新等。綜上所述,各種詞庫的更新支持自動更新和手動更新兩種方式。更新詞彙在加入相應的詞庫前需要進行人工審計,進而實現詞庫的更新維護。S102:採集電力知識數據,根據所述電力知識數據建立電力知識庫;所述電力知識庫包括專業知識庫和本體庫;在本申請實施例中,所述採集電力知識數據,根據所述電力知識數據建立電力知識庫,包括:採集所述電力領域的標準問題和標準答案,按照預設的分級標準使所述標準問題和所述標準答案分布在不同的目錄層級,構建所述專業知識庫;基於動態模板構建語義表達式,並按照所述語義表達式中的本體的類別和內容,使所述語義表達式中的本體分布在不同的目錄層級,構建所述本體庫。本申請實施例提供的方法中涉及到的對電力知識庫的建設與維護如下:電力知識庫作為智能在線客服系統的核心部分,是支撐座席人員快速響應用戶需求的重要環節,為客服中心提升服務水平意義重大。電力知識庫構建主要包含專業知識庫和本體庫建設2個方面,融合多種人工智慧技術和知識本體網絡構建技術,以成熟的本體知識體系為基礎,以強大的智能搜尋引擎為核心,支持內外部全渠道應用,突破了傳統客服知識管理平臺只能管理非結構化知識、知識搜索效率低、知識積累無體系、知識關聯少等弊端,真正實現了知識應用智能化、知識管理統一化、知識展現個性化,充分滿足企業未來的知識應用需求。下面將分別針對上述2個方面進行詳細闡述,具體如下:1)專業知識庫。電力領域專業人員根據自身經驗,設計出專業知識的目錄和層級分布,按照業務實際,將知識分布在一級菜單、二級菜單、三級菜單、……等,目錄的最終級菜單上包含若干個標準問題和標準答案。標準問的示例如「山西居民生活用電電價標準」,標準答的示例如「居民電量雙月處於第一檔[0-340度]:電壓等級不滿1千伏的每千瓦時電價0.477元,其餘電壓等級的每千瓦時電價0.467元;居民電量雙月處於第二檔[341-520度]:電壓等級不滿1千伏的每千瓦時電價0.527元,其餘電壓等級0.517元;居民電量雙月處於第三檔520度以上:電壓等級不滿1千伏的每千瓦時電價0.777元,其餘電壓等級0.767元」。2)本體庫。基於動態模板的知識智能化採編發布,本體庫專家根據自身經驗,設計出本體庫的目錄和層級分布。將本體按照類別和所屬內容分布在一級菜單、二級菜單、三級菜單、……等,目錄的最終級菜單上包含若干個語義表達式。語義表達式的示例如「[XXX][執行][電價][標準]」、「[XXX][電價][多少]」、「[XXX][電價][貴]」,其中[XXX]為語義塊,語義塊示例為「[山西]」「[居民]」等。語義塊和語義表達式的結合產生的動態擴展問題。當用戶利用電力智能在線客服系統的知識庫進行查詢時,首先系統會根據詞庫將用戶的原始問題進行拆分和理解,形成推薦語義表達式,示例如下:[省名|山西][目前][居民][電價][是][多少]之後,系統會對比推薦語義表達式和知識庫中標準問、動態擴展問的相似度,按照相似度從高到低排序,設置輸出閾值後就直接輸出高於閾值的最佳標準問題以及標準答案。知識庫的維護更新。知識庫的維護更新是保證一個知識庫的長期有效性。建設一個知識庫並不是一撮而就的,需要對知識庫進行持續的長期維護。根據知識庫包含的內容和其特點,具體維護更新如下:專業知識庫。由於結構化和半結構化的數據源中的專業業務知識有更新,或者因為專業業務知識更新引起的。已有目錄下標準問、標準答修改,直接替換後更新;已有某目錄刪除,則下級目錄及所屬內容刪除;已有某標準問、標準答刪除,直接刪除;新增目錄、標準問、標準答,進行衝突檢測,之後人工審核更新。本體庫。因為專業業務知識更新引起的、因為本體庫自身的結構、內容優化引起的更新。已有目錄下語義表達式修改,直接替換後更新。已有某目錄刪除,則下級目錄及所屬內容刪除。已有某語義表達式刪除,直接刪除。新增目錄、語義表達式,進行衝突檢測,之後人工審核更新。綜上所述,電力知識庫的更新支持基本需要手動方式更新。更新內容在加入相應的專業知識庫和本體庫前需要進行人工審計,進而實現知識庫的更新維護。S103:根據電力領域的電力實體、電力實體之間的關聯關係以及每個電力實體的屬性及屬性值,建立電力知識圖譜;在本申請實施例中,所述根據電力領域的電力實體、電力實體之間的關係以及每個電力實體的屬性及屬性值,建立電力知識圖譜,包括:為每個所述電力實體設定一個標識符,並確定每個所述電力實體的屬性、屬性值及各個所述電力實體之間的關聯關係;根據所述標識符、屬性、屬性值及所述關聯關係進行實體對齊、知識圖譜模式構建、屬性和屬性值決策、屬性值推理、關係推理以及實體重要性排序,建立所述電力知識圖譜;所述電力知識圖譜中的節點為各個所述電力實體,所述電力知識圖譜中的邊為各個所述電力實體之間的關聯關係。本申請實施例提供的方法中涉及到的對電力知識圖譜的建設與維護如下:電力知識圖譜作為智能在線客服系統的含金量最高級內容,是支撐座席人員快速響應用戶需求的不可或缺環節,為客服服務水平產生質的飛越作用顯著。知識圖譜旨在描述真實世界中存在的各種實體或概念,可被看作是一張巨大的圖,圖中的節點表示實體或概念,而圖中的邊則由屬性或關係構成。其中:1)實體。每個實體或概念用一個全局唯一確定的ID來標識,稱為它們的標識符。最典型的包括人名、地名、機構名等三類通用實體。對於電力行業,除了通用實體外,存在更豐富的實體,如變壓器、變電站、輸電線路、配網、主網、充電樁等等。2)屬性-值。每個屬性-值對用來刻畫實體的內在特性。屬性值範圍包括:數值型(如年齡),枚舉型(如民族、星座),短文本(如出生地),長文本(如簡介);3)關係。而關係用來連接兩個實體,刻畫它們之間的關聯。典型的關係抽取方法採用自的思想,按照「模板生成實例抽取」的流程不斷迭代直至收斂。例如,最初可以通過「X是Y的總部地址」模板抽取出(國家電網,總部地址,北京)三元組實例;然後根據三元組中的實體對「國家電網-北京」可以發現更多的匹配模板,如「Y的總部地址是X」、「X是Y的中心」等;進而用新發現的模板抽取更多新的三元組實例,通過反覆迭代不斷抽取新的實例與模板。還可以通過識別表達語義關係的短語來抽取實體間關係。例如,通過句法分析,可以從文本中發現「國家電網」與「北京」的如下關係:(國家電網,總部位於,北京)、(國家電網,總部設置於,北京)、以及(國家電網,將其總部建於,北京)。通過這種方法抽取出的實體間關係非常豐富而自由,一般是一個以動詞為核心的短語。電力知識圖譜通過整合海量的電力業務的碎片化信息,對搜索結果進行重新優化計算,將核心的信息展現給用戶。而這就與傳統的「關鍵詞搜索」區別較大,不是單純的抓取知識數據,而是引入「語義理解」技術,使得用戶查詢搜索更加精準,權威和全面,提升用戶的查詢體驗,這一切都離不開下述幾種技術的支持:一是實體對齊。旨在發現具有不同ID但卻代表真實世界中同一對象的那些實體,並將這些實體歸併為一個具有全局唯一標識的實體對象添加到知識圖譜中。實體對齊普遍採用的方法是聚類,關鍵在於定義合適的相似度度量。這些相似度度量遵循如下觀察:具有相同描述的實體可能代表同一實體(字符相似);具有相同屬性-值的實體可能代表相同對象(屬性相似);具有相同鄰居的實體可能指向同一個對象(結構相似)。這種自動化方法無法保證100%的準確率,所以這些方法的產出結果將作為候選供人工進一步審核和過濾。二是知識圖譜模式構建。模式是對知識的提煉,而且遵循預先給定的模式有助於知識的標準化,更利於查詢等後續處理。為知識圖譜構建模式相當於為其建立本體。最基本的本體包括概念、概念層次、屬性、屬性值類型、關係、關係定義域概念集以及關係值域概念集。在此基礎上,我們可以額外添加規則或公理來表示模式層更複雜的約束關係。模式定義了領域,類別和實體。每個領域有若干類別,每個類別包含多個實體且和多個屬性值關聯,這些屬性值規定了屬於當前類別的那些實體需要包含的屬性和關係。三是屬性-值決策。有一些實體會同時屬於兩個互斥的類別(如男女)或某個實體所對應的一個屬性對應多個值。這樣就會出現不一致性。這些互斥的類別對以及屬性-值以看作是模式層的知識,通常規模不是很大,可以通過手工指定規則來定義。而由於不一致性的檢測要面對大規模的實體及相關事實,純手工的方法將不再可行。一個簡單有效的方法充分考慮數據源的可靠性以及不同信息在各個數據源中出現的頻度等因素來決定最終選用哪個類別或哪個屬性值。也就是說,我們優先採用那些可靠性高的數據源(如電力法律類或業務標準中的結構化數據)抽取得到的事實。另外,如果一個實體在多個數據源中都被識別為某個類別的實例,或實體某個屬性在多個數據源中都對應相同的值,那麼傾向於最終選擇該類別和該值。四是推理。被廣泛用於發現隱含知識。推理功能一般通過可擴展的規則引擎來完成。知識圖譜上的規則一般涉及兩大類。一類是針對屬性的,即通過數值計算來獲取其屬性值。例如:知識圖譜中包含某人的電量及電價數據,在計算其繳納電費時,可以通過電量乘以電價獲取其電費。這類規則對於那些屬性值隨其他因素發生改變的情況特別有用。另一類是針對關係的,即通過鏈式規則發現實體間的隱含關係。例如,可以定義規定:嶽父是妻子的父親。利用這條規則,當已知姚明的妻子(葉莉)和葉莉的父親(葉發)時,可以推出姚明的嶽父是葉發。結合用戶上下文語義進行知識推理和擴展,能適應客戶更加複雜化的提問方式。例如,當山西省電力用戶在智能在線客服系統中先後查詢「山西現在家庭電價是多少?」和「近2月沒超340度,但上月交的電費貴了20多元」,系統輸出的答案是「居民電費是由電量和電價相乘計算得到。當前您執行雙月第一檔電價,電價沒有變化,電價最高為每千瓦時0.477元。您的電費增加了20多元,是電量至少增加了40度」,這是結合上下文推理的答案。除了這樣的「一問一答」,用戶還可以繼續與系統對話,問它又一個問題「電量怎麼會變化這麼大呢?」,系統最終回答「居民電量增加的原因主要包括:已有用電器線路老化、新購用電器增加功率以及被盜電」。這樣可以讓用戶使用自然語言進行搜索,並且採用多輪交互的方式來逐步澄清和滿足需求,從而完成深度決策型的搜索任務。五是實體重要性排序。智能在線客服系統識別用戶查詢中提到的實體,並通過知識卡片展現該實體的結構化摘要。當查詢涉及多個實體時,系統將選擇與查詢更相關且更重要的實體來展示。知識圖譜中的節點從單一的網頁變成了各種類型的實體,而圖中的邊也由連接網頁的超連結變成豐富的各種語義關係。由於不同的實體和語義關係的流行程度以及抽取的置信度均不同,而這些因素將影響實體重要性的最終計算結果。電力知識圖譜的維護更新。知識圖譜的維護更新是保證一個知識圖譜的長期有效性。建設一個知識圖譜需要不斷地去完善和優化,因為加入到知識圖譜中的數據不是一成不變的。如實體類型對應的實例往往是動態變化的(中國國家主席隨著時間的推移可能對應不同的人)。需要對知識圖譜進行持續的長期維護。根據知識圖譜包含的內容和其特點,具體維護更新如下:數據層的更新。結構化和半結構化的數據源中的知識有更新。對於實體、關係、屬性、值的自身內容的更新,由於它們的變更影響的僅是當前內容本身,可以直接替換或者利用編輯器進行編輯修改等操作即可。數據模式的更新。因為使用的自動學習算法在語料添加、算法改進等方面變化時,所學習的知識發生變化,這些知識變化規約到數據模式層的變化。知識圖譜的數據模式為了保證其質量,由專業團隊審核和維護。為了提高電力知識圖譜的覆蓋率,需要藉助自動化算法從各種電力業務數據源抽取新的類型信息(也包含關聯的屬性信息),這些類型信息通過一個稱為概念的數據結構保存。它們不是馬上被加入到知識圖譜數據模式中。有些今天生成後第二天就被刪除了,有些則能長期的保留在概念中,如果概念中的某一種類型能夠長期的保留,發展到一定程度後,由專業的人員進行決策和命名並最終成為一種新的類型。如果是對現有實體、關係、屬性(包括屬性類型,值類型,值域)的添加,系統檢測到衝突以後,由人工進行處理即可。若無檢測到衝突,直接增加即可;如果是對對現有實體、關係、屬性(包括屬性類型,值類型,值域)的刪除:刪除實體時去除實體及所屬的關係、屬性等全部內容;刪除關係時直接刪除關係即可,去掉連結。刪除屬性時,屬性屬於的所有實體中該屬性全部被移除。綜上所述,電力知識圖譜的更新需要人工參與結合程序自動方式同時使用。更新內容在加入相應的知識圖譜前需要進行人工審計,進而實現知識圖譜的更新維護。S104:根據所述電力詞庫、電力知識庫和所述電力知識圖譜,構建智能電力客服系統。在本申請實施例中,建立所述電力詞庫、電力知識庫和所述電力知識圖譜後,就可以根據所述電力詞庫、電力知識庫和所述電力知識圖譜,構建智能電力客服系統。依託網際網路技術、人工智慧語技術、自然語言處理技術等,適用於電網公司客戶服務中心的智能電力客服系統可以根據用戶的提問向用戶輸出對應的標準答案。智能電力客服系統內嵌電力詞庫,電力知識庫和電力知識圖譜,可以將來自微信、網站、移動端APP等多個渠道的問題匯總到同一個智能進行管理,支持對客戶諮詢自然語言的多層次語義分析、支持跨業務的語義檢索、支持用戶上下文的知識推理、支持電力業務信息和關聯知識融合,真正做到智能在線客服。只要電力客戶服務中心在後臺將相關問題及編輯好的答案收錄到智能問答系統當中,就可以一勞永逸的自動為用戶提供日夜無休的匹配解答。這種智能在線客服將會是非常受用戶喜歡的一種服務方式。智能電力客服系統利用海量的數據積累與數據處理能力,解決了人工重複回答、客服人員不足等問題,保證人工客服僅專注於解決用戶個性化問題,為企業節省大比例的人工客服成本。本發明能快速準確洞悉用戶意圖,並自組答案為用戶解答,大幅提升客服工作效率。相比現有的電子知識庫,本發明主要體現出以下優勢:第一電力詞庫。基於語義而非詞形的語言詞典結構,涵蓋範圍廣且包含詞彙的詞性、頻次等內容,為電力智能在線客服提供基礎支撐;第二多層次、多視角、細粒度的電力知識庫。利用成熟的本體理論,創建知識本體,並將語言知識庫和業務知識庫分離,利用語義規則關聯語言知識和業務知識,基於語義模型的句子相似度計算技術推算關聯知識,建立電力客服領域本體的動態多維度智能知識庫模型,有利於電力知識的結構化管理和精細化維護。第三最全面、最有深度和廣度的電力知識圖譜。整合自然語言處理和人機互動技術,構建電力知識圖譜。電力知識圖譜通過建立實體之間的屬性與關係,讓智能在線客服系統更懂用戶的意圖,提供用戶直接答案,解答用戶的疑惑。藉助於知識圖譜,結合用戶行為信息,為用戶提供更符合當前場景的搜索結果。通過知識圖譜梳理業務脈絡,為用戶在廣度和深度上提供多維度的內容。通過電力知識圖譜建立實體之間的關聯,擴展用戶搜索結果,發現更多內容,為用戶提供更豐富的相關信息推薦。電力智能在線客服系統的上線不僅可以為企業提供細粒度知識管理技術,還能為企業與海量用戶之間的溝通建立一種基於自然語言的快捷有效的技術手段,還可以為廣大用電群體提供新的問題解決渠道,更為特殊的用電群體帶來了新技術的福音。智能在線客服系統的開通,也可以讓聽說障礙人士及時得到幫助。只要電力客戶服務中心開啟系統的在線即時互動方式,這種溝通方式可以有效地填補「幫助中心」所不具備的親和力,同時又比電話服務更為自由開放,符合用電用戶的需求,且能用最少的人力,為客戶提供最滿意的服務。請參閱圖2,圖2是本發明第二具體實施例提供的電力客服系統的構建系統的結構示意圖。本發明第二具體實施例提供的電力客服系統的構建系統,包括:詞庫建立模塊1,用於採集電力業務數據,根據所述電力業務數據建立電力詞庫;所述電力詞庫包括通用詞庫、行業詞庫、近義詞庫和包含詞庫;知識庫建立模塊2,用於採集電力知識數據,根據所述電力知識數據建立電力知識庫;所述電力知識庫包括專業知識庫和本體庫;圖譜建立模塊3,用於根據電力領域的電力實體、電力實體之間的關聯關係以及每個電力實體的屬性及屬性值,建立電力知識圖譜;系統構建模塊4,用於根據所述電力詞庫、電力知識庫和所述電力知識圖譜,構建智能電力客服系統。優選地,所述詞庫建立模塊1,包括:採集單元,用於從通用已開放詞庫數據、業務資料數據、網站數據和外部數據中採集電力業務數據,並對採集的所述電力業務數據進行匯總;對所述電力業務數據進行數據處理;所述數據處理包括新詞抽取處理、詞性標註處理、詞頻統計處理以及權重計算處理;分類單元,用於對經過所述數據處理之後的所述電力業務數據進行分類,並根據所述分類分別構建所述通用詞庫、所述行業詞庫、所述近義詞庫和所述包含詞庫。優選地,所述知識庫建立模塊2,包括:專業知識庫構建單元,用於採集所述電力領域的標準問題和標準答案,按照預設的分級標準使所述標準問題和所述標準答案分布在不同的目錄層級,構建所述專業知識庫;本體庫構建單元,用於基於動態模板構建語義表達式,並按照所述語義表達式中的本體的類別和內容,使所述語義表達式中的本體分布在不同的目錄層級,構建所述本體庫。優選地,所述圖譜建立模塊3,包括:確定單元,用於為每個所述電力實體設定一個標識符,並確定每個所述電力實體的屬性、屬性值及各個所述電力實體之間的關聯關係;建立單元,用於根據所述標識符、屬性、屬性值及所述關聯關係進行實體對齊、知識圖譜模式構建、屬性和屬性值決策、屬性值推理、關係推理以及實體重要性排序,建立所述電力知識圖譜;所述電力知識圖譜中的節點為各個所述電力實體,所述電力知識圖譜中的邊為各個所述電力實體之間的關聯關係。優選地,還可以包括:更新模塊,用於對所述智能電力客服系統中的所述電力詞庫、所述電力知識庫和所述電力知識圖譜進行維護更新。本申請實施例提供的電力客服系統的構建系統,可以採用上述方法實施例中的電力客服系統的構建方法,具體功能可以參照上述方法實施例中的步驟描述,此處不再贅述。通過本申請提供的智能電力客服系統的構建方法及系統,採集電力業務數據,根據所述電力業務數據建立電力詞庫;所述電力詞庫包括通用詞庫、行業詞庫、近義詞庫和包含詞庫;採集電力知識數據,根據所述電力知識數據建立電力知識庫;所述電力知識庫包括專業知識庫和本體庫;根據電力領域的電力實體、電力實體之間的關聯關係以及每個電力實體的屬性及屬性值,建立電力知識圖譜;根據所述電力詞庫、電力知識庫和所述電力知識圖譜,構建智能電力客服系統。可見,本申請實施例提供的技術方案,基於電力業務數據、電力知識數據和電力實體構建電力詞庫、電力知識庫和電力知識圖譜,能夠整合自然語言處理和人機互動技術,並涵蓋電力領域的各種業務和知識,為構建出的智能電力客服系統提供基礎支撐,能夠讓構建的智能電力客服系統更清楚用戶的意圖,直接提供給用戶準確的答案,可以縮短客戶的等待時間,並實現對業務問題的準確解答,從而提升用戶體驗。為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請時可以把各單元的功能在同一個或多個軟體和/或硬體中實現。本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於裝置或系統實施例而言,由於其基本相似於方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。以上所描述的裝置及系統實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性勞動的情況下,即可以理解並實施。專業人員還可以進一步意識到,結合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬體、計算機軟體或者二者的結合來實現,為了清楚地說明硬體和軟體的可互換性,在上述說明中已經按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬體還是軟體方式來執行,取決於技術方案的特定應用和設計約束條件。專業技術人員可以對每個特定的應用來使用不同方法來實現所描述的功能,但是這種實現不應認為超出本發明的範圍。結合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬體、處理器執行的軟體模塊,或者二者的結合來實施。軟體模塊可以置於隨機存儲器(RAM)、內存、只讀存儲器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬碟、可移動磁碟、CD-ROM、或
技術領域:
內所公知的任意其它形式的存儲介質中。對所公開的實施例的上述說明,使本領域專業技術人員能夠實現或使用本發明。對這些實施例的多種修改對本領域的專業技術人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發明的精神或範圍的情況下,在其它實施例中實現。因此,本發明將不會被限制於本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的範圍。當前第1頁1&nbsp2&nbsp3&nbsp

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀