新四季網

基於多輪交互的意圖識別方法和裝置與流程

2023-05-29 18:55:11


本發明涉及自然語言處理
技術領域:
,尤其涉及一種基於多輪交互的意圖識別方法和裝置。
背景技術:
:隨著計算機技術的發展,自然語言處理(naturallanguageprocessing,nlp)的人機互動中產生一種重要的交互方式-多輪對話,多輪對話中通常有兩個或多個代理(agent),通過自然語言的方式交替進行多輪交互,從而使得對話持續。多輪對話例如,在電商平臺的用戶和客服之間,通過語音、文字等方式進行多輪的溝通和交流,以達到解決某種問題的目的。在多輪交互的過程中,需要對語句的意圖進行識別,即根據當前多輪交互的自然語言判斷用戶的真實意圖,輔助平臺更好的理解當前交互的語義,為後臺伺服器生成準確的自動回復提供基礎,以提升對話系統的自動化程度。相關技術中,採用機器監督學習模型根據當前語句的文本提取對應的特徵,進而通過事先訓練好的機器學習模型,將當前樣本分到某一類意圖上。這種方式下,對當前語句的意圖識別是基於單句的,即針對多輪交互中每一語句採用同樣的機器學習模型進行意圖識別,多輪交互的意圖識別效果不佳。技術實現要素:本發明旨在至少在一定程度上解決相關技術中的技術問題之一。為此,本發明的一個目的在於提出一種基於多輪交互的意圖識別方法,能夠有效提升多輪交互的意圖識別效果。本發明的另一個目的在於提出一種基於多輪交互的意圖識別裝置。為達到上述目的,本發明第一方面實施例提出的基於多輪交互的意圖識別方法,包括:獲取待識別的當前語句對應的多個分詞;獲取所述當前語句上文的多條語句中,每條語句對應的意圖;提取所述多個分詞之間的第一預設特徵,並提取多個意圖之間的第二預設特徵;基於所述第一預設特徵和所述第二預設特徵對所述當前語句的意圖進行識別。本發明第一方面實施例提出的基於多輪交互的意圖識別方法,通過獲取當前語句上文的多條語句中每條語句對應的意圖,而不僅僅是根據當前語句提取對應的特徵對意圖進行識別,由於一組多輪交互過程中,當前語句與上文的多條語句存在相關性,因此,能夠有效提升多輪交互的意圖識別效果。為達到上述目的,本發明第二方面實施例提出的基於多輪交互的意圖識別裝置,包括:分詞獲取模塊,用於獲取待識別的當前語句對應的多個分詞;意圖獲取模塊,用於獲取所述當前語句上文的多條語句中,每條語句對應的意圖;提取模塊,用於提取所述多個分詞之間的第一預設特徵,並提取多個意圖之間的第二預設特徵;識別模塊,用於基於所述第一預設特徵和所述第二預設特徵對所述當前語句的意圖進行識別。本發明第二方面實施例提出的基於多輪交互的意圖識別裝置,通過獲取當前語句上文的多條語句中每條語句對應的意圖,而不僅僅是根據當前語句提取對應的特徵對意圖進行識別,由於一組多輪交互過程中,當前語句與上文的多條語句存在相關性,因此,能夠有效提升多輪交互的意圖識別效果。本發明附加的方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發明的實踐了解到。附圖說明本發明上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得明顯和容易理解,其中:圖1是本發明一實施例提出的基於多輪交互的意圖識別方法的流程示意圖;圖2是本發明另一實施例提出的基於多輪交互的意圖識別方法的流程示意圖;圖3是本發明一實施例提出的基於多輪交互的意圖識別裝置的結構示意圖;圖4是本發明另一實施例提出的基於多輪交互的意圖識別裝置的結構示意圖。具體實施方式下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用於解釋本發明,而不能理解為對本發明的限制。相反,本發明的實施例包括落入所附加權利要求書的精神和內涵範圍內的所有變化、修改和等同物。圖1是本發明一實施例提出的基於多輪交互的意圖識別方法的流程示意圖。本實施例中基於多輪交互的意圖識別方法可以被配置在基於多輪交互的意圖識別裝置中。該基於多輪交互的意圖識別裝置可以設置在伺服器中,或者也可以設置在電子設備中,本發明實施例對此不作限制。其中,電子設備例如為個人電腦(personalcomputer,pc),雲端設備或者行動裝置,行動裝置例如智慧型手機,或者平板電腦等。需要說明的是,本發明實施例的執行主體,在硬體上可以例如為伺服器/電子設備中的中央處理器(centralprocessingunit,cpu),在軟體上可以例如為伺服器/電子設備中的應用程式,對此不作限制。該基於多輪交互的意圖識別方法可以應用在nlp的人機互動中。參見圖1,該方法包括:s11:獲取待識別的當前語句對應的多個分詞。其中,待識別的當前語句為多輪交互中,當前需要對其意圖進行識別的語句。該語句的具體形式可以例如為文本形式。分詞是將當前語句中連續的字符分割成詞。可選地,可以基於詞典匹配的分詞方法,或者也可以基於機器學習方法對當前語句進行分詞,得到對應的多個分詞,對此不作限制。例如,一個電商平臺用戶與客服之間的多輪交互可以如下表1示意:表1順序語句意圖用戶第1句你好!打招呼客服第1句您好,有什麼可以幫您?用戶第2句我要點個外賣。訂外賣客服第2句想吃什麼呢?用戶當前語句肯德基到家待識別意圖其中,待識別的當前語句為「肯德基到家」,進而,待識別的當前語句對應的多個分詞為「肯德基」「到」「家」,對此不作限制。s12:獲取當前語句上文的多條語句中,每條語句對應的意圖。在本發明的實施例中,當前語句上文的多條語句為在一組多輪交互過程中,當前語句之前的一條或者多條語句,通過獲取當前語句上文的多條語句中每條語句對應的意圖,而不僅僅是根據當前語句的文本提取對應的特徵,進而通過事先訓練好的機器學習模型,將當前樣本分到某一類意圖上,由於一組多輪交互過程中,當前語句與上文的多條語句存在相關性,因此,能夠有效提升多輪交互的意圖識別效果。例如,參考表1,當前語句上文的多條語句可以例如為,「你好!」「我要點個外賣。」,而與每條語句對應的意圖例如為,「打招呼」「訂外賣」。s13:提取多個分詞之間的第一預設特徵,並提取多個意圖之間的第二預設特徵。可選地,第一預設特徵和第二預設特徵為n-gram特徵,或者,也可以為其它能夠表徵相鄰字之間相關性的特徵,例如,也可以採用gram關聯矩陣對n-gram特徵進行統計與合併,並將合併處理後的特徵作為第一預設特徵或者第二預設特徵,對此不作限制。其中,根據外部指令對n-gram特徵中的n值進行設定,對此不作限制。本實施例中,通過提取多個分詞和多個意圖之間的n-gram特徵,算法實現簡便,採用n-gram特徵能夠表徵相鄰字之間相關性,不需要做特殊的特徵提取,使得該方法有很好的通用性。當n增大時,意圖識別的效果會提升,但同時會增加基於多輪交互的意圖識別方法的複雜度。因此,可以根據實際使用需求對n-gram特徵中的n值進行設定,實現平衡基於多輪交互的意圖識別方法的效率與複雜度,由於將多個分詞之間或者多個意圖之間的相關性納入意圖識別考量範疇,更好地識別出多輪交互中的意圖變換,從而提升意圖識別的準確率和召回率。例如,參見表1,假設n-gram特徵為2-gram特徵,則基於上述分詞「肯德基」「到」「家」,提取多個分詞之間的2-gram特徵,(肯德基,到)、(到,家),提取多個意圖之間的2-gram特徵:(打招呼,訂外賣)。s14:基於第一預設特徵和第二預設特徵對當前語句的意圖進行識別。可選地,可以基於adaboost分類器、第一預設特徵和第二預設特徵對當前語句的意圖進行識別。在本發明的實施例中,可以預先確定當前語句的多個可能的意圖,並基於第一預設特徵和第二預設特徵訓練多個不同的分類器(弱分類器),進而,將多個弱分類器集合起來,構成一個更強的最終分類器(強分類器),並對第一預設特徵和第二預設特徵迭代訓練,確定每個可能的意圖對應的置信度,通過該置信度對當前語句的意圖進行識別。在本發明的實施例中,參見表2,為基於adaboost分類器、第一預設特徵和第二預設特徵對當前語句的意圖進行識別得到的意圖結果。表2意圖置信度訂外賣0.7叫車0.2其他0.1由於意圖「訂外賣」的置信度最高,因此,可以將「訂外賣」作為對當前語句的意圖進行識別的結果。本實施例中,通過獲取當前語句上文的多條語句中每條語句對應的意圖,而不僅僅是根據當前語句提取對應的特徵對意圖進行識別,由於一組多輪交互過程中,當前語句與上文的多條語句存在相關性,因此,能夠有效提升多輪交互的意圖識別效果。圖2是本發明另一實施例提出的基於多輪交互的意圖識別方法的流程示意圖。參見圖2,該方法包括:s21:根據外部指令對n-gram特徵中的n值進行設定。其中,外部指令可以為用戶根據實際需求生成的,該外部指令用於觸發對n-gram特徵中的n值進行設定。在本發明的實施例中,當n增大時,意圖識別的效果會提升,但同時會增加基於多輪交互的意圖識別方法的複雜度。因此,可以根據實際使用需求對n-gram特徵中的n值進行設定,實現平衡基於多輪交互的意圖識別方法的效率與複雜度,並提升方法的靈活性和適用範圍。s22:獲取待識別的當前語句對應的多個分詞。其中,待識別的當前語句為多輪交互中,當前需要對其意圖進行識別的語句。該語句的具體形式可以例如為文本形式。分詞是將當前語句中連續的字符分割成詞。可選地,可以基於詞典匹配的分詞方法,或者也可以基於機器學習方法對當前語句進行分詞,得到對應的多個分詞,對此不作限制。例如,用s1,s2,...,sk表示多輪交互中已經發生的k輪交互,用i1,i2,...,ik表示對k輪交互中每條語句經過意圖識別模型所識別出來k個意圖,待識別的當前語句為sk+1,則對sk+1進行分詞得到的多個分詞可以表示為w1,w2,...,wn。s23:獲取當前語句上文的多條語句中,每條語句對應的意圖。參見上述示例,每條語句對應的意圖為i1,i2,...,ik。在本發明的實施例中,當前語句上文的多條語句為在一組多輪交互過程中,當前語句之前的一條或者多條語句,通過獲取當前語句上文的多條語句中每條語句對應的意圖,而不僅僅是根據當前語句的文本提取對應的特徵,進而通過事先訓練好的機器學習模型,將當前樣本分到某一類意圖上,由於一組多輪交互過程中,當前語句與上文的多條語句存在相關性,因此,能夠有效提升多輪交互的意圖識別效果。s24:提取多個分詞中相鄰的兩個分詞之間的n-gram特徵,並將相鄰的兩個分詞之間的n-gram特徵作為第一預設特徵。在本發明的實施例中,以n-gram特徵中的n值為2進行示例,對此不作限制。參見上述示例,對多個分詞w1,w2,...,wn,提取相鄰的兩個意圖之間的2-gram特徵為(w1,w2),(w2,w3),(w3,w4),...,(wn-1,wn),並將(w1,w2),(w2,w3),(w3,w4),...,(wn-1,wn)作為第一預設特徵。s25:提取多個意圖中相鄰的兩個意圖之間的n-gram特徵,並將相鄰的兩個意圖之間的n-gram特徵作為第二預設特徵。參見上述示例,對多個意圖i1,i2,...,ik,提取相鄰的兩個意圖之間的2-gram特徵為(i1,i2),(i2,i3),(i3,i4),...,(ik-1,ik),並將(i1,i2),(i2,i3),(i3,i4),...,(ik-1,ik)作為第二預設特徵。通過提取多個分詞和多個意圖之間的n-gram特徵,算法實現簡便,採用n-gram特徵能夠表徵相鄰字之間相關性,不需要做特殊的特徵提取,使得該方法有很好的通用性。s26:將第一預設特徵和第二預設特徵作為adaboost分類器的輸入。可以理解的是,基於adaboost分類器的算法原理,可以分別將每個第一預設特徵,以及每個第二預設特徵分別作為一個弱分類器的輸入,進而對該多個弱分類器進行訓練合成一個強分類器,對此不作限制。s27:通過adaboost分類器確定當前語句對應的多個可能的意圖中,置信度最高的意圖。s28:將置信度最高的意圖作為當前語句的意圖。在本發明的實施例中,可以預先確定當前語句的多個可能的意圖,並基於第一預設特徵和第二預設特徵訓練多個不同的分類器(弱分類器),進而,將多個弱分類器集合起來,構成一個更強的最終分類器(強分類器),並對第一預設特徵和第二預設特徵迭代訓練,確定每個可能的意圖對應的置信度,通過該置信度對當前語句的意圖進行識別。本實施例中,根據實際使用需求對n-gram特徵中的n值進行設定,實現平衡基於多輪交互的意圖識別方法的效率與複雜度,並提升方法的靈活性和適用範圍。通過獲取當前語句上文的多條語句中每條語句對應的意圖,而不僅僅是根據當前語句提取對應的特徵對意圖進行識別,由於一組多輪交互過程中,當前語句與上文的多條語句存在相關性,因此,能夠有效提升多輪交互的意圖識別效果。通過提取多個分詞和多個意圖之間的n-gram特徵,算法實現簡便,採用n-gram特徵能夠表徵相鄰字之間相關性,不需要做特殊的特徵提取,使得該方法有很好的通用性。圖3是本發明一實施例提出的基於多輪交互的意圖識別裝置的結構示意圖。參見圖3,該裝置300包括:分詞獲取模塊301、意圖獲取模塊302、提取模塊303,以及識別模塊304。其中,分詞獲取模塊301,用於獲取待識別的當前語句對應的多個分詞。意圖獲取模塊302,用於獲取當前語句上文的多條語句中,每條語句對應的意圖。提取模塊303,用於提取多個分詞之間的第一預設特徵,並提取多個意圖之間的第二預設特徵。可選地,第一預設特徵和第二預設特徵為n-gram特徵。可選地,一些實施例中,參見圖4,提取模塊303,包括:第一提取子模塊3031,用於提取多個分詞中相鄰的兩個分詞之間的n-gram特徵,並將相鄰的兩個分詞之間的n-gram特徵作為第一預設特徵。第二提取子模塊3032,用於提取多個意圖中相鄰的兩個意圖之間的n-gram特徵,並將相鄰的兩個意圖之間的n-gram特徵作為第二預設特徵。識別模塊304,用於基於第一預設特徵和第二預設特徵對當前語句的意圖進行識別。可選地,一些實施例中,參見圖4,識別模塊304,包括:輸入子模塊3041,用於將第一預設特徵和第二預設特徵作為adaboost分類器的輸入。確定子模塊3042,用於通過adaboost分類器確定當前語句對應的多個可能的意圖中,置信度最高的意圖。識別子模塊3043,用於將置信度最高的意圖作為當前語句的意圖。可選地,一些實施例中,參見圖4,該裝置300還包括:設定模塊305,用於根據外部指令對n-gram特徵中的n值進行設定。需要說明的是,前述圖1-圖2實施例中對基於多輪交互的意圖識別方法實施例的解釋說明也適用於該實施例的基於多輪交互的意圖識別裝置300,其實現原理類似,此處不再贅述。本實施例中,通過獲取當前語句上文的多條語句中每條語句對應的意圖,而不僅僅是根據當前語句提取對應的特徵對意圖進行識別,由於一組多輪交互過程中,當前語句與上文的多條語句存在相關性,因此,能夠有效提升多輪交互的意圖識別效果。需要說明的是,在本發明的描述中,術語「第一」、「第二」等僅用於描述目的,而不能理解為指示或暗示相對重要性。此外,在本發明的描述中,除非另有說明,「多個」的含義是兩個或兩個以上。流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用於實現特定邏輯功能或過程的步驟的可執行指令的代碼的模塊、片段或部分,並且本發明的優選實施方式的範圍包括另外的實現,其中可以不按所示出或討論的順序,包括根據所涉及的功能按基本同時的方式或按相反的順序,來執行功能,這應被本發明的實施例所屬
技術領域:
的技術人員所理解。應當理解,本發明的各部分可以用硬體、軟體、固件或它們的組合來實現。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執行系統執行的軟體或固件來實現。例如,如果用硬體來實現,和在另一實施方式中一樣,可用本領域公知的下列技術中的任一項或他們的組合來實現:具有用於對數據信號實現邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(pga),現場可編程門陣列(fpga)等。本
技術領域:
的普通技術人員可以理解實現上述實施例方法攜帶的全部或部分步驟是可以通過程序來指令相關的硬體完成,所述的程序可以存儲於一種計算機可讀存儲介質中,該程序在執行時,包括方法實施例的步驟之一或其組合。此外,在本發明各個實施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以採用硬體的形式實現,也可以採用軟體功能模塊的形式實現。所述集成的模塊如果以軟體功能模塊的形式實現並作為獨立的產品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中。上述提到的存儲介質可以是只讀存儲器,磁碟或光碟等。在本說明書的描述中,參考術語「一個實施例」、「一些實施例」、「示例」、「具體示例」、或「一些示例」等的描述意指結合該實施例或示例描述的具體特徵、結構、材料或者特點包含於本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特徵、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。儘管上面已經示出和描述了本發明的實施例,可以理解的是,上述實施例是示例性的,不能理解為對本發明的限制,本領域的普通技術人員在本發明的範圍內可以對上述實施例進行變化、修改、替換和變型。當前第1頁12

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀