新四季網

一種智能的問答系統的製作方法

2023-11-11 15:24:12


本申請涉及人機智能交互技術領域,尤其涉及一種智能的問答系統。



背景技術:

自動問答系統是指以自然語言理解技術為核心,使得計算機能夠理解用戶的談話內容,實現人與計算機之間的有效交流溝通,並且提供強大的搜索能力,準確回答用戶的問題。其中,目前在計算機客服系統中普遍採用的智能問答系統就是一種自動問答系統,它是一種通過自然語言技術,能夠理解用戶的問題,並且提供準確的答案的人工智慧系統。

本發明能夠應對Jeopardy中的挑戰,節目的比賽以一種獨特的問答形式進行,問題設置的涵蓋面非常廣泛,涉及到歷史、文學、藝術、流行文化、科技、體育、地理、文字遊戲等等各個領域。根據以答案形式提供的各種線索,參賽者必須以問題的形式做出簡短正確的回。與一般問答節目相反,Jeopardy中以答案形式提問、提問形式作答。參賽者需具備歷史、文學、政治、科學和通俗文化等知識,還得會解析隱晦含義、反諷與謎語等,而電腦並不擅長進行這類複雜思考。本智能問答系統能夠很好的符合該邏輯思路,並且具備從海量的數據源中找到正確答案的能力,還對參考答案的可信度進行打分排名。



技術實現要素:

為實現上述目的,本發明採用的技術方案為一種智能的問答系統,該系統包括內容獲取模塊、問題分析模塊、假設生成模塊、軟過濾模塊、證據打分模塊、答案合併和排名模塊。

步驟一、內容獲取模塊,用於確認和匯集與答案相關的內容,對問題空間的問題進行分析並且分類,自動拓展資料庫;

步驟二、問題分析模塊,用於分析輸入的問題信息,確定問題類型、發覺問題間的關係和分解問題;

步驟三、假設生成模塊,用於從數據源中儘可能多的搜索與答案相關的內容作為參考答案;

步驟四、軟過濾模塊,對大量的參考答案進行篩選,分出很可能是正確答案的一類和有可能是正確答案的一類;

步驟五、證據打分模塊,根據打分對象對參考答案進行詳細的打分,確定其接近參考答案的程度;

步驟六、答案合併和排名模塊,將分拆的答案合併,計算可信度,並且排名,排名最靠前的即為系統認為的最佳答案。

附圖說明

圖1智能問答系統構架原理圖。

圖2智能問答系統流程圖1。

圖3智能問答系統流程圖2。

圖4答案合併和排名模型。

具體實施方式

下面結合附圖和具體的實施例對本發明做進一步的闡述。

整體的系統構架有四部分組成:問題分析、搜索、答案提取和資料庫,如圖1所示。對於系統進一步分解,如圖2所示。對於輸入到系統的問題,具體流程圖如圖3所示,具體如下:

S301、本系統有一個圖形界面,設計用戶輸入框來接收用戶輸入的問題。

S302、對問題進行分析,判斷問題的類型,後期會根據問題的類型採取不同的檢索和打分方案,並且將問題自動添加到對應的資料庫中,自動拓展資料庫。

S303、對於一些可分的長問題可以分成若干個小問題,根據語法和分詞結果提取出多個問題。

S304、對於分出的每一個小問題都從資料庫中搜索相關答案,作為參考答案,相關性的計算如公式1、公式2所示。

S305、對參考答案進行打分,越是相關性高的打分越高,打分的方法如公式3、公式4所示。

S306、對分數進行判斷,如果大於閾值,就直接跳轉到排位階段,如果小於閾值,還需要進行S307步驟。原因是S305的打分方法與上下文的關係不大,所以可能對答案的可靠性不高。

S306、根據參考答案所在的數據源的位置進行上下文檢測,匹配比較,綜合其它的因素,如數據的流行度、可靠性度。再一次打分。

S306、對各個分數按照一定的權值計算賦予權值,求和,得出參考答案的總分。

S307、到這裡所有的參考答案都會有一個對應的分數,根據分數的高低排名

S308、根據算法計算出可信度,結合S307,具體過程如圖4所示,會用到機器學習的方法訓練出模型,自動進行可信度計算。

內容獲取模塊具體包括:針對面向的領域對問題的類型進行歸類分類,總結出面向的領域的特色,從各種文本中搜索與答案相關的內容。將問題分詞,記為ti,分詞ti在一處數據源的分數記為pi,當文本中包含分詞ti,wij=idf(tj);否則wij=0。

其中,

c(t)表示包含分詞t的文件數目,N表示在數據源中所有文件的數目。

所述問題分析模塊具體包括:確認問題類型,對問題進行分類,針對不同類型的問題有不同的處理方法,並且發覺問題間的關係,然後分解問題。

所述發覺問題間的關係模塊具體包括:將輸入的問題與資料庫中的問題進行比較,挖掘問題間語法上的主謂賓關係以及語義上聯繫,有的問題答案從這一步直接產生。

所述分解問題模塊具體包括:通過分解問題更快更準確的找到答案,將一個複雜句式的問題分成多個簡單的問題,並行處理每一個問題,並分別為答案的可行度打分。

所述假設生成模塊具體包括:從數據源中儘可能多的搜索與答案相關的內容,針對不同類型的問題使用不同的搜索算法,所有相關的內容都做為參考答案。

所述軟過濾模塊具體包括:運用輕量級的打分算法對參考答案進行篩選,通過過濾器的參考答案需要進入打分模塊,未通過過濾器的參考答案進入合併排名模塊。

所述打分模塊具體包括:從進入打分模塊的參考答案的上下文中找到支持參考答案的額外證據,根據語義、語法的聯繫及多種打分算法對參考答案進行打分,越可能是參考答案打分越高。打分的對象為位置、文字支持度、流行度、信息可靠性。具體方法為:

首先創建兩個一維數組P,Q,一個二維數組score;P和Q中存放分詞的符號,score中存放分數並初始化score[i][j]=0;

然後計算每一個score[i][j],運用以下公式

其中

if t1=t2

特別sim(FOCUS,CANDIDATE)=log(N).

所述合併排名模塊具體包括:將拆分的問題分數按照一定的權值合併,計算出總分;通過機器學習算法訓練出自信度估計模型,基於問題的總分自動生成自信度估計,並排名。

對輸入的問題進行處理,在各種不同的數據源中進行搜索參考答案,並且對參考答案進行拆分、打分、合併處理,最後得到參考答案的排名和可信度,輸出答案。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀