新四季網

列表型知識的問答庫構建方法、作答方法、裝置及系統與流程

2023-09-15 03:06:25 2


本發明涉及語言信息處理技術領域,尤其涉及一種列表型知識的問答庫構建方法、作答方法、裝置及系統。



背景技術:

隨著網際網路技術的發展,人們對網絡的依賴逐漸加深,如圖1所示,當人們遇到問題時,習慣在網際網路上找到所需的答案。例如,人們在生活中常常遇到這樣的問題:「打火機可以帶上飛機嗎?」「髮膠可以帶上飛機嗎?」「酒精是乘飛機的違禁品嗎?」這類問題屬於判斷某個概念是否具有某一類屬性的問題,用戶在提問此類問題時,希望得到的回答形式是肯定回答或者是否定回答。

在現有技術公開了一種問答系統,,這種問答系統在接收到用戶輸入的問題時,首先從問題中提取全部關鍵詞,然後,根據這些關鍵詞,從問題庫中找出包含關鍵詞最多的問題,並將該包含關鍵詞最多的問題所對應的答案返回給用戶。例如,用戶提問:「鉛筆是乘飛機的違禁品嗎?」問答系統從問題中找到了「鉛筆」「飛機」「違禁品」三個關鍵詞,然後,問答系統根據這三個關鍵詞在問題庫中查找到一個包含「飛機」「違禁品」問題:「飛機的違禁品是什麼?」並返回給用戶與該問題對應的答案:「飛機違禁品有:煤油、汽油、雷管、炸藥、酒精……」。

從現有技術示出的一種問答系統可以看出,當用戶提出了一個判斷某個概念是否具有某一類屬性的問題時,現有技術的問答系統給出了一個陳述性的答案,將具有某一類屬性的全部同位概念都羅列了出來,並沒有針對某個概念是否具有某一類屬性給出肯定回答或者否定回答。因此,現有技術的問答系統在回答判斷某個概念是否具有某一類屬性的問題時,無法保證以正確的回答形式生成答案。



技術實現要素:

本發明提供了一種列表型知識的問答庫構建方法、作答方法、裝置及系統,以解決現有技術中存在的問題。

第一方面,本發明實施例提供了一種列表型知識問答庫構建方法,所述列表型知識問答庫包括多個列表型知識問答項,每個所述列表型知識問答項包括一個列表型知識表和一個關聯的問答模型,每個所述列表型知識表中包含多個同位概念;每個所述問答模型中包含多個預設問題信息,每個所述預設問題信息對應一個肯定答案和一個否定答案,所述方法包括:創建內容為空的列表型知識問答庫;創建所述列表型知識表的集合,所述列表型知識表的集合包含至少一個列表型知識表;創建所述問答模型的集合,所述問答模型的集合包含至少一個問答模型,每個所述問答模型包含識別信息;根據所述識別信息,查找所述表名與所述識別信息匹配的所述列表型知識表;對每一對匹配到的所述列表型知識表和所述問答模型關聯建立列表型知識問答項,生成列表型知識問答庫。

第二方面,本發明實施例提供了一種列表型知識的作答方法,所述方法包括:獲取用戶輸入的問題信息;從所述問題信息中獲取特徵信息;根據所述問題信息,確定所述問題信息中包含的知識類型;所述知識類型包括:列表型知識和其他型知識;如果所述問題信息中包含列表型知識,確定所述特徵信息是否存在於該所述問題信息關聯的列表型知識表中;如果是,則調用與所述問題信息對應的問答模型,生成肯定答案;如果否,則調用與所述問題信息對應的問答模型,生成否定答案。

第三方面,本發明實施例提供了一種列表型知識的答案生成裝置,所述裝置包括:第一獲取模塊,用於獲取用戶輸入的問題信息;第二獲取模塊,用於從所述問題信息中獲取特徵信息;第一確定模塊,用於根據所述問題信息,確定所述問題信息中包含的知識類型;所述知識類型包括:列表型知識和其他型知識;第二確定模塊,用於在所述問題信息中包含列表型知識時,確定所述特徵信息是否存在於該所述問題信息關聯的列表型知識表中;執行模塊,用於在所述第二確定模塊的輸出結果為是時,調用與所述問題信息對應的問答模型,生成肯定答案;以及,用於在所述第二確定模塊的輸出結果為否時,調用與所述問題信息對應的問答模型,生成否定答案。

第四方面,本發明實施例提供了一種列表型知識的問答系統,所述問答系統包括:用戶模塊,用於用戶提出問題和接收答案;數據存儲模塊,用於存儲列表型知識問答庫;處理模塊,用於根據用戶提問,生成肯定答案或者否定答案;傳輸模塊,用於實現用戶模塊、處理模塊和數據存儲模塊之間的數據傳輸;其中,所述處理模塊至少包括:處理器和程序存儲器;所述處理器被配置為:獲取用戶輸入的問題信息;從所述問題信息中獲取特徵信息;根據所述問題信息,確定所述問題信息中包含的知識類型;所述知識類型包括:列表型知識和其他型知識;如果所述問題信息中包含列表型知識,確定所述特徵信息是否存在於該所述問題信息關聯的列表型知識表中;如果是,則調用與所述問題信息對應的問答模型,生成肯定答案;如果否,則調用與所述問題信息對應的問答模型,生成否定答案。

本發明實施例提供的技術方案考慮到用戶在使用問答系統進行提問時,經常會提問判斷某個概念是否具有某一類屬性的問題,這種類型的問題,回答形式有肯定回答或者否定回答;因此,本發明實施例提供的技術方案在用戶提問時,獲取用戶輸入的問題信息;從所述問題信息中獲取特徵信息;根據所述問題信息,確定所述問題信息中包含的知識類型;所述知識類型包括:列表型知識和其他型知識;如果所述問題信息中包含列表型知識,確定所述特徵信息是否存在於該所述問題信息關聯的列表型知識表中;如果是,則調用與所述問題信息對應的問答模型,生成肯定答案;如果否,則調用與所述問題信息對應的問答模型,生成否定答案。從而,能夠實現從用戶提出的問題信息中,準確地確定出包含列表型知識的問題信息,並根據問題信息中的特徵信息是否是與問題信息關聯的列表型知識中的同位概念信息,生成與問題信息對應的肯定答案或否定答案,避免對列表型知識給出其他形式答案的情況,從而,保證了在回答包含列表型知識的問題時,以正確的回答形式生成答案。

附圖說明

為了更清楚地說明本發明的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,對於本領域普通技術人員而言,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。

圖1為現有技術問答系統的應用場景圖;

圖2為本發明列表型知識問答庫結構示意圖;

圖3為本發明實施例提供的一種列表型知識問答庫構建方法的流程圖;

圖4為本發明實施例生成的列表型知識問答庫內容示意圖;

圖5為本發明實施例提供的一種列表型知識的作答方法的第一實施例流程圖;

圖6為本發明實施例提供的一種列表型知識的作答方法的第一實施例步驟s230的流程圖;

圖7為本發明實施例提供的一種列表型知識的作答方法的第二實施例流程圖;

圖8為本發明實施例提供的一種列表型知識的作答方法的第二實施例步驟s230的流程圖;

圖9為本發明實施例提供的一種列表型知識的答案生成裝置框圖;

圖10為本發明實施例提供的一種列表型知識問答系統的示意圖。

具體實施方式

為了使本技術領域的人員更好地理解本發明中的技術方案,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本發明保護的範圍。

在知識系統中,某些概念具有某個共同的上位屬性,因此,可以將這些具有同一個上位屬性的概念以列表形式歸類,並稱之為列表型知識,如果把具有某個上位屬性的所有同位概念列舉在一個列表中,就構成了一個列表型知識表;對於列表型知識來說,存在於列表型知識表中的概念屬於肯定概念,不存在於列表型知識表中的概念屬於否定概念;如果對一個列表型知識表關聯一個用於判斷某個概念是否是該列表型知識表對應的上位屬性的問答模型,就構成了一項列表型知識問答項;如果把若干項列表型知識問答項集合到一個庫中,就構成了一個列表型知識問答庫。此外,對於否定概念,還可以在列表型知識表中建立否定概念表,此時,列表型知識表中同時存在肯定概念表和否定概念表。

參見圖2,為列表型知識問答庫結構示意圖。這個列表型知識問答庫具有多個列表型知識問答項,每個列表型知識問答項由一個列表型知識表和一個問答模型組成,每個列表型知識表中包含若干個同位概念,並以其上位屬性作為表名;每個問答模型中包含至少一個預設問題信息,每個預設問題信息對應設置有一個肯定答案和一個否定答案。

應當說明的是,預設問題信息可以為一個預設問題,每個預設問題對應設置一個肯定答案和一個否定答案。這種情況下,肯定答案和否定答案的具體表述可以針對不同問題設定。

此外,針對不同用戶提出的問題中可能會存在多個相似問題的情況,在列表型知識問答庫中,預設問題信息也可以為一個預設問題組,該預設問題組由多個相似的預設問題組成,並可選擇該預設問題組中的一個標準預設問題,作為該預設問題組的組名,標準預設問題可以通過對用戶提問的問題作統計,選擇出現頻率最高的問題作為標準預設問題;其餘作為標準預設問題對應的擴展預設問題。

例如:一個預設問題組包括如下相似問題:「#識別信息#是乘飛機的違禁品嗎」;「#識別信息#可以帶上飛機嗎」;「#識別信息#能帶上飛機嗎」······此時該預設問題組的肯定答案可以為「#識別信息#是乘飛機的違禁品,不可以帶上飛機」;其否定答案可以為「#識別信息#不是乘飛機的違禁品,可以帶上飛機」。

本發明實施例提供了一種列表型知識問答庫構建方法。圖3為本發明實施例提供的一種列表型知識問答庫構建方法的流程圖。如圖3所示,所述方法可以包括以下步驟:

在步驟s110中,創建所述列表型知識表的集合,所述列表型知識表的集合包含至少一個列表型知識表;

本實施例中,創建列表型知識表所需要的表名和同位概念,可以由用戶錄入或者從外部文件導入。

示例地,本實施例中提供的方法能夠識別以下格式的導入信息:

*飛機違禁品;汽油,煤油,柴油,酒精,雷管,炸藥,……,打火機*

*……;……,……,……,……,……,……*

以上信息中,星號、分號、逗號為列表型知識表的標識信息,兩個星號「*」之間的信息為列表型知識表的內容,兩個星號「*」之間的內容以表名信息開始,後用分號「;」隔開,分號「;」後的內容為同位概念信息,所有同位概念信息之間用逗號「,」隔開。

本實施例提供的方法中,處理器在接收到用戶導入的包含以上格式的信息後,能夠識別標識信息,並根據標識信息中對應的內容識別出表名和同位概念,並生成列表型知識表的集合。

在步驟s120中,創建所述問答模型的集合,所述問答模型的集合包含至少一個問答模型,每個所述問答模型包含識別信息;

本實施例中創建問答模型所需要的至少一個預設問題信息,以及每個預設問題信息對應一個肯定答案和一個否定答案可以由用戶錄入或者從外部文件導入。

示例地,本實施例中提供的方法能夠識別以下格式的導入信息:

以上信息中,兩個井號「#」之間的信息為識別信息;大括號、雙斜線、單斜線為問答模型的標識信息,其中,大括號之間的內容表示一個問答模型所包含的內容,兩個雙斜線「//」之間的信息表示一個預設問題信息以及該問題信息對應的肯定答案和否定答案,兩個雙斜線「//」之間的內容以預設問題信息開始,後用單斜線「/」隔開,單斜線「/」後的內容為預設問題信息對應的肯定答案和否定答案,兩個答案之間用單斜線「/」隔開。

示例地,本實施例中,如果要導入包含預設問題信息組的問答模型,可以通過導入以下格式為文件實現:

以上信息中,和為預設問題信息組的開始標識和結束標識,開始標識中的內容為標準預設問題信息,結束標識中的內容為該預設問題信息組的肯定答案和否定答案,其中,肯定答案和否定答案之間用「/」隔開,開始標識和結束標識之間的信息為預設問題信息組中的預設問題信息,預設問題信息之間用「/」隔開。本實例中,預設問題信息組的有益效果是,能夠實現對多個相似的預設問題信息進行聚合,並統一設置問答模型,能夠減少列表型知識問答庫的數據量,提高檢索效率。

本實施例提供的方法接收到用戶導入的包含以上格式的信息後,能夠識別標識信息,並根據標識信息中對應的內容識別出每個問答模型,以及每個問答模型中包含的每個預設問題信息和對應的肯定答案與否定答案,並生成包含至少一個問答模型的集合。

在步驟s130中,查找所述列表型知識表的集合中是否存在具有相同所述表名的所述列表型知識表;如果存在,則執行步驟s131,合併具有相同所述表名的所述列表型知識表。

本實施例中,步驟s130的作用是防止列表型知識表中出現表達相同列表型知識的列表型知識表,從而,能避免在對該列表型知識問答庫使用的過程中出現查詢結果不唯一的情況,避免錯誤發生。

在步驟s140中,根據所述識別信息,查找所述表名與所述識別信息匹配的所述列表型知識表。

本實施例中,問答模型的識別信息為預設問題信息中兩個井號「#」之間的信息。

示例地,在步驟s120的示例中,對於「#識別信息#是乘飛機的違禁品嗎」以及「#識別信息#可以帶上飛機嗎」來說,識別信息中的內容是「飛機違禁品」,因此,根據「飛機違禁品」查找到步驟s110中的表名「飛機違禁品」與識別信息匹配。

在步驟s150中,對每一對匹配到的所述列表型知識表和所述問答模型關聯建立列表型知識問答項,生成列表型知識問答庫。

示例地,本實施例生成的列表型知識問答庫內容示意圖,如圖4所示。

此外,在本實施例中,列表型知識表中還可以包含一個否定概念表,該否定概念表中包含了該列表型知識的否定概念。此形式的列表型知識表同時包含一個同位概念表和一個否定概念表。

示例地,對於「飛機違禁品」來說,它所對應的否定概念有:「毛巾,書本,眼鏡,衣服,……」等。對於這些否定概念來說,可以按照在步驟s120,在表名為「飛機違禁品」的列表型知識表中建立否定概念表。

本發明實施例提供了一種列表型知識的作答方法。

圖5為本發明實施例提供的一種列表型知識的作答方法的第一實施例流程圖。如圖5所示,所述方法可以包括以下步驟:

在步驟s210中,獲取用戶輸入的問題信息。

本實施例中,用戶輸入的問題信息可以通過用戶在pc、手機、平板等終端設備的文字鍵入、語音輸入等方式獲得。例如,本實施例中,用戶通過手機端文字輸入:「汽油是乘飛機的違禁品嗎」

在步驟s220中,從所述問題信息中獲取特徵信息;

本實施例中,特徵信息是用戶提出的問題信息中的一個名詞性概念信息,當用戶提出的問題信息包含列表型知識時,該特徵信息可能是問題信息包含的列表型知識的肯定概念或者否定概念。由於用戶對列表型知識提問時會用以下方式提問:「汽油能帶上飛機嗎?」「毛巾可以帶上飛機嗎」「大熊貓是哺乳動物嗎?」這些問題均會出現例如「能」「可以」「是」等在疑問句中表示判斷意義的判斷詞,此外,通過上述問題還可以看出,這些判斷詞前均出現了名詞性概念,且這些名詞性概念往往是各自的列表型知識中的肯定概念或者否定概念;因此,查找到問題信息中的判斷詞,就能準確地獲取問題信息中的特徵信息。

示例地,在步驟s220中,「汽油是乘飛機的違禁品嗎」包含判斷詞「是」,因此,本實施例從用戶提出的問題信息中提取了「是」前面的概念性名詞「汽油」,並作為該問題信息的特徵信息。

在步驟s230中,根據所述問題信息,確定所述問題信息中包含的知識類型;所述知識類型包括:列表型知識和其他型知識。

參見圖6,本實施例中,步驟s230具體包括以下步驟:

在步驟s2311中,將所述列表型知識問答庫中所有的預設問題信息分別與所述問題信息計算第一相似度值;

可選地,本實施例中,計算第一相似度值的方法可採用餘弦法。

示例地,本實施例採用餘弦法計算第一相似度值前,可預先對所有預設問題信息分別生成特徵向量,在對所有預設問題信息分別生成特徵向量時,首先去除預設問題信息中的識別信息,然後再進行計算,得到包含所有預設問題信息特徵向量的集合{v1,v2,v3……vn},當計算第一相似度值時,對問題信息生成特徵向量q,然後通過餘弦法得到第一相似度值,所述餘弦法可用以下公式表示(m表示向量維度,i表示第i個預設問題信息):

q={q1,q2,q3,……,qm}

vn={vn1,vn2,vn3,……,vnm}

sim(q,vi)=cos(q,vi)

本實施例中,如果問答模型中包含預設問題信息組,可對預設問題信息組的標準預設問題信息生成特徵向量,作為該預設問題信息組的特徵向量。

本實施例中,在執行步驟s2311後,最終得到一個第一相似度值計算結果的集合:

{sim(q,v1),sim(q,v2),sim(q,v3),……,sim(q,vn)}

該集合中每個第一相似度值對應了一個預設問題信息,由於問題信息中的詞頻不能為負數,因此,第一相似度值的範圍在[0,1]之間:

在步驟s2312中,將所有第一相似度值計算結果排序,確定最高第一相似度值。

示例地,根據試驗得到,本實施例對所有第一相似度值排序,最終確定最高第一相似度值sim(q,vi)=0.82,該最高第一相似度值對應的預設問題信息是:「#識別信息#是乘飛機的違禁品嗎」。

在步驟s2313中,確定所述最高第一相似度值是否高於第一預設分界值;如果所述最高相似度高於第一預設分界值,則所述問題信息中包含列表型知識;否則,所述問題信息中包含其他型知識。

示例地,本實施例中,第一預設分界值的大小決定了步驟s230在確定問題信息中包含的知識類型時的精度,所述第一預設分界值在[0,1]之間,更接近區間上限;第一預設分界值過大會導致將部分包含列表型知識的問題信息漏判;第一預設分界值過小,會導致將部分包含其他型知識的問題信息誤判成包含列表型知識的問題信息。第一預設分界值的合理值,可以通過對本方法進行復現試驗,採用多輪調試的方法確定。本實施例通過試驗將第一預設分界值設置為p=0.75。本實施例在步驟s2312中確定的最高第一相似度值為sim(q,vi)=0.82,由於sim(q,vi)=0.82>p=0.75,即所述最高第一相似度值高於第一預設分界值,因此,所述問題信息中包含列表型知識。

在步驟s240中,如果所述問題信息中包含所述列表型知識,確定所述特徵信息是否存在於該所述問題信息關聯的列表型知識表中。

示例地,本實施例在步驟s2312中確定了最高第一相似度值,以及最高第一相似度值對應的預設問題信息:「#識別信息#是乘飛機的違禁品嗎」,由於在列表型知識問答庫中,每個列表型知識問答項的列表型知識表和問答模型之間建立有關聯,因此,本實施例在執行步驟s240時,查詢所述特徵信息「汽油」是否是「#識別信息#是乘飛機的違禁品嗎」所在問答模型關聯的列表型知識表中的同位概念信息;查詢的結果是在列表型知識表中找到了同位概念信息「汽油」,因此,本實施例中,所述特徵信息是與所述問題信息關聯的列表型知識表中的同位概念信息。

在步驟s251和步驟s252中,根據步驟s240的結果相應地執行步驟s251或步驟s252。

示例地,本實施例在步驟s240中,「確定所述特徵信息是否是與所述問題信息關聯的列表型知識表中的同位概念信息」的結果為是,因此,執行步驟s251,在與所述問題信息對應的問答模型中,所述問題信息對應的預設問題信息為:「#識別信息#是乘飛機的違禁品嗎」,該預設問題信息的肯定回答為:「#識別信息#是乘飛機的違禁品」。因此,本實施例在步驟s251生成肯定答案:「汽油是乘飛機的違禁品」。

本實例中,如果預設問題信息為預設問題組,且用戶提出的問題信息是:「打火機可以帶上飛機嗎」時,在步驟s230中匹配到的是具有標準預設問題信息「#識別信息#可以帶上飛機嗎」的預設問題組,依然可以通過標準預設問題信息,執行步驟s240生成問題答案,且所有匹配到同一個預設問題信息組的問題信息,都適用於該預設問題信息組對應的肯定答案或者否定答案。

進一步地,本實施例提供的一種列表型知識的作答方法,在執行過程中還會遇到包含列表型知識否定概念的問題信息和包含其他型知識的問題信息。

示例地,對於包含列表型知識否定概念的問題信息,例如「毛巾可以帶上飛機嗎」,本實施例在步驟s210中,獲取用戶輸入的問題信息;在步驟s220中,根據問題信息中的判斷詞「可以」,獲取問題信息中的特徵信息「毛巾」;在步驟s230中,確定最高第一相似度值為sim(q,vi)=0.78,該最高第一相似度值對應的預設問題信息是:「#識別信息#可以帶上飛機嗎」,該最高相似度高於第一預設分界值p=0.75,因此,該問題信息中包含列表型知識;在步驟s240中,通過查詢確定,「毛巾」不是與「#識別信息#可以帶上飛機嗎」關聯的列表型知識表中的同位概念信息;根據步驟s240的確定結果,執行步驟s252,由於,與「毛巾可以帶上飛機嗎」對應的預設問題信息為「#識別信息#可以帶上飛機嗎」,且該預設問題信息的否定回答為:「#識別信息#不是乘飛機的違禁品,可以帶上飛機」;因此,本實施例在回答「毛巾可以帶上飛機嗎」時,在步驟s240生成否定答案:「毛巾不是乘飛機的違禁品,可以帶上飛機」。示例地,對於包含其他型知識的問題信息,例如「毛巾是怎樣製作的」,本實施例在步驟s210中,獲取用戶輸入的問題信息;在步驟s220中,根據問題信息中的判斷詞「是」,獲取問題信息中的特徵信息「毛巾」;但是,步驟s230中,確定最高第一相似度值為sim(q,vi)=0.09,低於第一預設分界值p=0.75,因此,該問題信息中包含其他型知識,執行本實施的步驟s260。

示例地,對於包含其他型知識的問題信息,例如「汽油的燃燒產物有哪些」,本實施例在步驟s210中,獲取用戶輸入的問題信息;在步驟s220中,由於該問題信息中不包含判斷詞,所以,本步驟獲取的特徵信息為空;步驟s230中,確定最高第一相似度值為sim(q,vi)=0.02,低於第一預設分界值p=0.75,因此,該問題信息包含其他型知識,執行本實施的步驟s260。

示例地,如果列表型知識庫的列表型知識表中同時包含肯定概念表和否定概念表,執行本步驟時,可以通過確定特徵信息是存在於列表型知識的同位概念表中還是否定概念表中的方法,調用與所述問題信息對應的問答模型。

示例地,當用戶提問「毛巾可以帶上飛機嗎」時,如果列表型知識表中同時包含肯定概念表和否定概念表,在執行步驟s240時,確定「毛巾」存在與列表型知識的否定概念表中,因此執行步驟s252。

在步驟s260中,如果所述問題信息中包含其他型知識,跳轉至其他作答方法。

本實施例提供的列表型知識的作答方法,能夠在用戶提出的問題信息中,準確地確定出包含列表型知識的問題信息,並根據問題信息中的特徵信息是否是與問題信息關聯的列表型知識中的同位概念信息,生成與問題信息對應的肯定答案或否定答案,避免對列表型知識給出其他形式答案的情況發生,從而,保證了在回答包含列表型知識的問題時,以正確的回答形式生成答案。

圖7為本發明實施例提供的一種列表型知識的作答方法的第二實施例流程圖。如圖7所示,本實施例與第一實施例的一個區別在於,在步驟s230之前增加步驟s310。

在步驟s310中,分析所述特徵信息的內容是否為空;如果為空,則所述問題信息中包含其他型知識。

示例地,對於用戶提出的問題信息:「汽油是乘飛機的違禁品嗎」「毛巾可以帶上飛機嗎」以及「毛巾是怎樣製作的」,在步驟s220中分別獲取到了特徵信息:「汽油」「毛巾」以及「毛巾」,這些特徵信息均不為空,因此執行步驟s230;對於用戶提出的問題信息:「汽油的燃燒產物有哪些」,在步驟s220中獲取到內容為空的特徵信息,因此,直接確定該問題信息中包含其他型知識,並執行步驟s260。

本實施例中,步驟s310的有益效果是,在執行步驟s230之前,先通過分析特徵信息的內容是否為空;找出一部分包含其他型知識的問題信息,並跳過步驟s230和步驟s240,直接執行步驟s260,減少答案生成過程中的計算量,提高答案生成速度。

如圖8所示,本實施例與第一實施例的另一個區別在於,在執行步驟s230時,採用的具體方法不同,本實施例中,步驟s230具體包括以下區別步驟:

在步驟s2321中,從所述問題信息中提取標籤信息;

示例地,本實施例中,用戶提出問題:「打火機是乘飛機的違禁品嗎」,在步驟s2321中,通過識別問題信息中的判斷詞,將「飛機的違禁品」作為標籤信息並提取。

在步驟s2322中,將所述標籤信息分別與列表型知識問答庫中的每個列表型知識表的表名計算第二相似度值;。

可選地,步驟s2322計算相似度也可以採用餘弦法,並可預先對所有列表型知識表的表名計算特徵向量ki,生成特徵向量的集合{k1,k2,k3……kn}。

本實施例中相似度計算方法可以參考步驟s2311執行,並得到一個相似度結果的集合:

{sim(b,k1),sim(b,k2),sim(b,k3),……,sim(b,kn)}。

其中,b為標籤信息的特徵向量。

在步驟s2323中,根據所述第二相似度值計算結果,確定最高第二相似度值所對應的目標列表型知識表。

示例地,本實施例中,根據第二相似度值計算結果,確定與本實施例中標籤信息「飛機的違禁品」具有最高第二相似度的表名是「飛機違禁品」,最高第二相似度值為該表名對應的列表型知識表即為目標列表型知識表。

在步驟s2324中,確定所述最高第二相似度值是否高於第二預設分界值;如果所述最高第二相似度值高於所述第二預設分界值,則所述問題信息中包含列表型知識;否則,所述問題信息中包含其他型知識。

示例地,本實施例中,第二預設分界值的大小決定了步驟s230在確定問題信息中包含的知識類型時的精度,所述第二預設分界值在[0,1]之間,更接近區間上限;第二預設分界值過大會導致將部分包含列表型知識的問題信息漏判;第二預設分界值過小,會導致將部分包含其他型知識的問題信息誤判成包含列表型知識的問題信息。第二預設分界值的合理值,可以通過對本方法進行復現試驗,採用多輪調試的方法確定。本實施例通過試驗將第二預設分界值設置為p2=0.72。本實施例中最高第二相似度值為sim(b,ki)=0.84,由於sim(b,ki)=0.84>p2=0.72,即所述最高第二相似度值高於第二預設分界值,因此,所述問題信息中包含列表型知識

在步驟s2325中,將所述目標列表型知識表關聯的所有預設問題信息分別與所述問題信息計算第三相似度值。本步驟中,第三相似度值計算方法參考步驟s2311,此處不在贅述。

在步驟s2336中,將所有第三相似度值計算結果排序,確定最高第三相似度值。本步驟中,確定最高第三相似度值的方法參考步驟s2312,此處不在贅述。

在步驟s2327中,確定與所述最高第三相似度值對應的預設問題信息。該預設問題信息關聯的列表型知識表即為所述問題信息關聯的列表型知識表。

本實例中的其他步驟與第一實施例相同。

本實施例步驟s230採用的方法,使用問題信息中的標籤信息與列表型知識表的表名計算相似度的方法,確定問題信息是否包含列表型知識,然後再從找到的列表型知識表對應的問答模型中匹配預設問題信息,能夠減少匹配預設問題信息時的計算量,提高匹配速度。

此外,在最高第二相似度值所對應的目標列表型知識表中只有一個肯定答案和一個否定答案的前提下(如預設問題信息為一個預設問題組),使用問題信息中的標籤信息與列表型知識表的表名計算相似度的方法,確定問題信息是否包含列表型知識,如果有,則進一步提取問題信息中的特徵信息(參見s220),然後再判斷提取出的特徵信息是否包含在最高第二相似度值所對應的目標列表型知識表中,如果包含,則生成肯定答案;如果不包含,則生成否定答案。這樣可進一步減少匹配預設問題信息時的計算量,提高匹配速度。

本實施例提供的列表型知識的作答方法,能夠在用戶提出的問題信息中,準確地確定出包含列表型知識的問題信息,並根據問題信息中的特徵信息是否為與問題信息關聯的列表型知識中的同位概念信息,生成與問題信息對應的肯定答案或否定答案,避免對列表型知識給出其他形式答案的情況發生,從而,保證了在回答包含列表型知識的問題時,以正確的回答形式生成答案。

本發明實施例提供了一種列表型知識的答案生成裝置。圖9為本發明實施例提供的一種列表型知識的答案生成裝置框圖。如圖9所示,所述裝置包括:

第一獲取模塊510,用於獲取用戶輸入的問題信息;

第二獲取模塊520,從所用戶信息中獲取特徵信息;

第一確定模塊530,用於根據所述問題信息,確定所述問題信息中包含的知識類型;所述知識類型包括:列表型知識和其他型知識;

第二確定模塊540,用於在所述問題信息中包含列表型知識時,確定所述特徵信息是否存在於該所述問題信息關聯的列表型知識表中;

執行模塊550,用於在所述第二確定模塊540的判斷結果為是時,調用與所述問題信息對應的問答模型,生成肯定答案;

以及,

用於在所述第二確定模塊540的判斷結果為否時,調用與所述問題信息對應的問答模型,生成否定答案;。

本實施例提供的列表型知識的答案生成裝置,能夠在用戶提出的問題信息中,準確地確定出包含列表型知識的問題信息,並根據問題信息中的特徵信息是否為與問題信息關聯的列表型知識中的同位概念信息,生成與問題信息對應的肯定答案或否定答案,避免對列表型知識給出其他形式答案的情況發生,從而,保證了在回答包含列表型知識的問題時,以正確的回答形式生成答案。

本發明實施例提供了一種列表型知識問答系統。圖10是本發明實施例提供了一種列表型知識問答系統的示意圖,如圖10所示,所述問答系統包括:

用戶模塊610,用於用戶提出問題和接收答案;

本實施例中,用戶模塊610可以是個人計算機,行動電話、平板設備、數字廣播終端以及其他具有信息輸入輸出功能的設備。所述信息輸入輸出功能包括但不局限於手寫輸入、文字輸入輸出、語音輸入輸出、視頻輸出。

數據存儲模塊620,用於存儲列表型知識問答庫;

本實施例中,數據存儲模塊620可以是用於存儲列表型知識問答庫的硬碟存儲器,快閃記憶體存儲器,數據伺服器,伺服器陣列,網絡存儲器,雲伺服器,分布式伺服器等。

處理模塊630,用於根據用戶提問,生成肯定答案或者否定答案;

傳輸模塊640,用於實現用戶模塊610、處理模塊630和數據存儲模塊620之間的數據傳輸;

本實施例中,傳輸模塊640可以包括用於實現數據傳輸的網絡設備,包括數據機,數據交換機,路由器,伺服器,應答機等,傳輸模塊640的數據傳輸媒介可以是乙太網,移動通信網絡,無線區域網,數字廣播網絡等。

本實施例中,所述處理模塊630至少包括:處理器631和程序存儲器632;

所述處理器631被配置為:

獲取用戶輸入的問題信息;

從所述問題信息中獲取特徵信息;

根據所述問題信息,確定所述問題信息中包含的知識類型;所述知識類型包括:列表型知識和其他型知識;

如果所述問題信息中包含列表型知識,確定所述特徵信息是否存在於該所述問題信息關聯的列表型知識表中;

如果是,則調用與所述問題信息對應的問答模型,生成肯定答案;

如果否,則調用與所述問題信息對應的問答模型,生成否定答案。

本發明可用於眾多通用或專用的計算系統環境或配置中。例如:個人計算機、伺服器計算機、手持設備或可攜式設備、平板型設備、多處理器系統、基於微處理器的系統、置頂盒、可編程的消費電子設備、網絡pc、小型計算機、大型計算機、包括以上任何系統或設備的分布式計算環境等等。

本發明可以在由計算機執行的計算機可執行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執行特定任務或實現特定抽象數據類型的例程、程序、對象、組件、數據結構等等。也可以在分布式計算環境中實踐本發明,在這些分布式計算環境中,由通過通信網絡而被連接的遠程處理設備來執行任務。在分布式計算環境中,程序模塊可以位於包括存儲設備在內的本地和遠程計算機存儲介質中。

需要說明的是,在本文中,諸如「第一」和「第二」等之類的關係術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關係或者順序。而且,術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句「包括一個……」限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。

本領域技術人員在考慮說明書及實踐這裡公開的發明後,將容易想到本發明的其它實施方案。本發明旨在涵蓋本發明的任何變型、用途或者適應性變化,這些變型、用途或者適應性變化遵循本發明的一般性原理並包括本發明未公開的本技術領域中的公知常識或慣用技術手段。說明書和實施例僅被視為示例性的,本發明的真正範圍和精神由下面的權利要求指出。

應當理解的是,本發明並不局限於上面已經描述並在附圖中示出的精確結構,並且可以在不脫離其範圍進行各種修改和改變。本發明的範圍僅由所附的權利要求來限制。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀