新四季網

一種聊天機器人的製作方法

2023-10-05 18:05:49 1

專利名稱:一種聊天機器人的製作方法
技術領域:
本實用新型涉及智慧機器人領域,特別涉及一種聊天機器人。
背景技術:
在很多公眾場合,設置了一些用於信息查詢的終端。其一般是由觸控螢幕和電腦一起構成。由用戶通過觸摸來進行查詢或者用滑鼠、鍵盤來進行查詢,不能直接通過會話來進行信息查詢。具有語音功能的設備也通常是機器設有用於播放語音的電路,如申請號為200910248546. 8的中國專利申請,公開了一種自助收費機,由主控單元(工控機)與外圍功能模塊組成,其包括有運營狀態顯示器、維護顯示器、維護鍵盤、操作顯示器、紅外觸控螢幕,連接方式包括串口、USB、LVDS、VGA和乙太網接口。該設備缺少通過對話來進行信息交互的 功能。因此,需要提供一種可直接通過對話來進行信息交互設備,滿足不同使用者的交互需求。

實用新型內容本實用新型的目的是克服現有技術存在的上述不足,提供一種聊天機器人,可以實現人與聊天機器人的直接對話,可應用於公眾場合用於諮詢,具體技術方案如下。一種聊天機器人,其包括攝像頭、攝像頭驅動模塊、語音拾取模塊和用於實現語音識別、知識查詢、語音生成的計算機;所述語音拾取模塊為麥克風,用於拾取語音信號;所述攝像頭用於捕獲人臉圖像;所述攝像頭的個數為2個。所述攝像頭共有5個自由度。與現有技術相比,本實用新型具有以下有益效果所述的聊天機器人具有視、聽、說、記憶功能。只要用戶和它對過一次話,它就能記住用戶的聲音,見過一次面便能認識用戶。它可以24小時晝夜地進行簡單的對話和服務。聊天機器人具有語音識別和理解能力,它能夠聽懂用戶的指令,具有較強的聊天功能。聊天機器人可以掌握了多種不同國家的語言,既可以是導遊,又是翻譯,並且能夠辦理各種業務,例如接待報案,查詢資料等。

圖I是實施方式中會話機器人的組成框圖。圖2是實施方式中語義知識的三元組表示法的示意圖。圖3是實施方式中基於模式匹配的語音識別的原理方框圖。圖4是實施方式中語音合成模塊框架圖。
具體實施方式
以下結合附圖對本實用新型的實施作進一步說明,但本實用新型的實施不限於此。如圖I所示,一種聊天機器人,包括攝像頭及其驅動模塊、語音拾取模塊、語音識別模塊、知識查詢模塊、語音生成模塊;攝像頭捕獲人臉圖像,語音信號經由語音拾取模塊和語音識別模塊後識別出語義,所述聊天機器人根據人的語音來了解人的需求,然後通過知識查詢模塊來形成會話語句,再通過語音生成模塊生成語音與人進行交流。本實施例中,聊天機器人包括I臺高性能PC機、2個CXD攝像頭、5個直流伺服電機、I塊雙通道圖像輸入板和I塊數據採集卡、I個麥克風和2個揚聲器,2個CXD攝像頭共有5個自由度(由5個直流伺服電機控制),可以模仿人的兩個眼睛上、下、左、右運動,也可以像人脖子一樣作旋轉運動,追蹤人臉。當用戶走入2個攝像頭的攝像區域時,通過攝像頭驅動模塊始終把用戶分別定位在2個攝像頭的取像中心,就像人的一雙眼睛。通過麥克風(語音拾取模塊)拾取語音信號並轉換成數位訊號後進行語音識別。語音拾取模塊、語音識別模塊、知識查詢模塊、語音生成模塊可通過計算機來實現。音識別模塊語音識別模塊通過識別把語音信號轉變為相應文本。目前,大多數語音識別系統都採用了模式匹配的原理。根據這個原理,未知語音的模式要與已知語音的參考模式逐一進行比較,最佳匹配的參考模式被作為識別結果。如圖3,待識別語音經過話筒變換成圖中語音信號後加在識別系統輸入端,先經過預處理。預處理包括語音信號採樣、反混疊帶通濾波器、去除個體發音差異的設備、環境引起的噪聲影響等,涉及到語音識別基元的選取和端點檢測問題,有時還包括模數轉換器。特徵提取部分用於提取語音中反映本質特徵的聲學參數,常用的特徵有短時平均能量或幅度、短時平均過零率、短時自相關函數、線性預測係數、清音/濁音標誌、基音頻率、短時傅立葉變換、倒譜、共振峰等。訓練在識別之前進行,是通過讓講話者多次重複語音,從原始語音樣本中去除冗餘信息,保留關鍵數據,再按規則對數據加以聚類,形成模式庫。模式匹配是整個語音識別系統的核心,是根據一定的準則以及專家知識,計算機輸入特徵與庫存模式之間的相似度,判斷出輸入語音的語意信息。模型訓練是指按照一定準則,從大量已知模式中提取表示該模式特徵的模型參數。模式匹配是指根據一定準則,使未知模式與模型庫中某一模型獲得最佳匹配。語音技術所應用中主流的模型訓練和模式匹配技術有以下幾種(I)動態時間規整匹配(Dynamic Time Warping,DTW)算法時間規整即時間校正,是把一個單詞內的時變特徵變為一致的過程。在規整過程中,未知單詞的時間軸要不均勻地扭曲或變折,以便使其特徵與模型特徵對比,是一個最為小巧的語音識別算法,其系統開銷小,識別速度快,在對付小詞彙量的語音命令控制系統中效率較高,但是,如果系統稍微複雜一些,這種算法就顯得力不從心。(2)隱馬爾克夫模型(Hidden Markov Model,HMM):採用語言信號時變特徵的參數表示法,由相互關聯的兩個隨機過程共同描述信號的統計特性。採用HMM這種技術,要以一個具有有限不同狀態的系統作為語音生成模型,每個狀態皆可產生有限個輸出,直到整個單詞輸出完畢,狀態之間的轉移是隨機的,每個狀態下的輸出也是隨機的,由於允許隨機轉移和隨機輸出,所以HMM能適應發音的各種微妙變化。HMM方法很好地解決了分類以及訓練上的困難,維特比(Viterbi)搜索語音識別算法解決了時間軸的規一化問題。HMM是把未知量均勻地伸長或縮短,直到它與參考模式的長度一致時為止,這是一種非常有力的措施,對提聞系統的識別精度極為有效。(3)人工神經網絡(Artificial Neural Net ANN):神經網絡的概念也已經被應用於語音識別中,其中最有效的一種方法是使用多層神經網絡,多層神經網絡不僅輸入節點、輸出節點,而且有一層或多層隱節點。利用神經網絡的記憶功能和快速響應特性,將語音信號提取出來的特徵值輸入到神經網絡中進行長時間訓練,得到節點間連接權值。自組織神經網絡能完成對輸入樣本的分類和聚類功能,但在其輸出層並不能直觀表現出來,需要對其進行模式標識。對於只對某類樣本產生響應的神經元,直接將其標識為與該類輸入樣本所對應的模式類;對於邊界神經元則採用上述邊界神經元的處理方法標識;對於未對任何輸入類產生響應的神經元,直接屏蔽。這樣,當新的樣本輸入時,就能夠直觀的從輸出層讀出輸入樣本屬於哪個模式類。自然語言是人類日常所用的語言,是人類在其社會生活中發展出來的用來互相交際的聲音符號系統,如漢語、英語、日語等。自然語言是個十分複雜的符號系統,符號的形式和其所表達的意義由社會所約定,而且隨著社會的發展而不斷變化發展。自然語言理解作為語言信息處理技術的一個高層次的重要方向,一直是人工智慧界所關注的核心課題之一。從微觀上看,自然語言理解是自然語言系統到計算機的系統內部表示之間的映射;從宏觀上看,它是指計算機能夠依照某些的規則來執行人類所期望的某些語言功能。·[0021]在漢語的書寫表達中,字詞之間是連著的,各個詞語在句子中沒有顯式的標記。理解漢語的首要任務就是把連續的漢字串分割成詞的序列,即中文分詞。中文分詞可分為以下三種形式(I)機械分詞。機械分詞是基於字符串匹配原理,需要分詞詞典作為分詞的依據,詞典的結構以及詞典中詞的個數直接影響分詞的準確度和效率。按照掃描方向可分為正向掃描,反向掃描和雙向掃描;按匹配原則可分為最大匹配法和最小匹配法。機械分詞算法簡單,對詞典建立索引,能有效地提高分詞速度,但這種分詞方法並不能很好地消除歧義,還需和其它方法結合一起,進一步提高分詞精度。(2)統計分詞。統計分詞是以概率論為理論基礎的,將漢語文本中漢字串的出現抽象為一隨機過程,其中,隨機過程中的參數可以通過大規模的漢語語料庫來訓練得出。待分詞的字串C=C1C2. . . Cn,輸出的詞串W=W1W2. . . Wn,其中m彡η。對於一個特定的C會有多個W對應,統計分詞的任務就是在這些W中找出概率最大的一個,即求W,使P (WI C)的值最大。根據貝葉斯公式可以得到P (WI C) =P (CI ff) *P (W) /P (C),其中P (C)是固定值,從詞串恢復至IJ漢字串的概率P(c|w)=l。由此求解問題可以變換為在全切分所得的所有結果中求出某個W,使得P(W)為最大。N-gram模型是最基本的統計語言模型,用常用的二元模表示P (W),gpP (W) =P (W1) *P (w21W1) *· · · *P (wm I Wm^1)。(3)知識分詞。知識分詞也稱為規則分詞,它不僅僅是使用詞典的匹配,還運用語法、句法和語義方面的知識進一步分詞處理。知識分詞需要設計一個語法語義知識庫,通過庫中所定義的規則來分詞處理。漢語的詞法句法規則複雜,建立一個適用的知識庫難度大,花時間長,因此知識分詞至今難以適用於大規模真實文本處理,有待進一步研究。知識是人們在改造客觀世界的過程中積累起來的經驗及其總結升華的產物。知識是一切智能行為的基礎,是人工智慧的重要研究內容。要使計算機具有智能,就必須使它具有知識。適當選擇和正確使用知識表示方法可以極大地提高人工智慧問題求解的效率。從計算機角度看,自然語言中的詞和句子只是保存在內存中孤立的符號串常量,沒特殊的意義。如果按照某種規則或結構組織這些字符串,轉換成便於電腦程式處理的結構,那麼電腦程式經過搜索、關聯、判斷、推理、替代等處理後,再以自然語言表達方式輸出,可以認為計算機具備一定的智能性。目前語義知識的表示可以採用以下幾種方法。(I)邏輯表示法。使用邏輯法表示知識,需將以自然語言描述的知識,通過引入謂詞、函數來加以形式描述,獲得有關邏輯公式,進而以機器內部代碼表示。其中項是描述世界中的物體的常量,包括抽象事物;謂詞是描述關係和屬性的常量;關係邏輯運算有合取(Λ)、析取(V)、否定( )、條件(一)、雙條件O;量詞有全稱量詞(V )和存在量詞(3 )。採用歸結或其它方法進行推理。(2)產生式表示法。產生式表示法容易描述事實、規則以及它們的不確定性度量。產生式系統由知識庫和推理機兩部分組成,其中知識庫由規則庫和資料庫組成。規則庫是產生式規則的集合,資料庫是事實的集合。規則庫是以某個領域知識的存儲器,規則是用產生式表示,包含著從初始態到最終解決狀態的轉換規則。資料庫存放輸 入的事實、外部資料庫輸入的事實以及中間結果。推理機是控制程序,包含推理方式和控制策略。其推理方式包含三種正向推理,反向推理和雙向推理。產生式表示形式固定,形式簡單,規則鍵相互較為獨立,而且知識庫和推理規則相分離,能夠獨立地的修改知識庫,由此產生式表示常用於專家系統建造時所採用。(3)語義網絡表示法。一個語義網絡是以有向圖的三元組(結點A,弧,標註R,結點B)連結而成,如圖2所示。結點表示概念、事物、事件、情況等;弧是有方向的有標註的,方向表示主次,結點A為主』結點B為次,而標註R表示結點A的屬性或結點A和結點B之間的關係。語義網絡能夠表示事物之間的繼承、補充、變異、細化等關係,而且直觀易懂,很容易用於推理,得到廣泛應用。(4)框架表示法。框架理論的基本觀點是人腦以存儲大量的典型情景,當人面臨新的情景時,就從記憶中選擇一個稱作框架的基本知識結構,這個框架是以前記憶的一個知識空框,而具體的內容以新的情景而改變,對這空框的細節加工修改和補充,形成對新情景的認識又記憶於人腦中。框架是由若干個結點和關係(統稱為槽)構成的網絡,表示某一類情景的結構化的一種數據結構。框架由框架名和一些槽組成,每個槽有一些值,槽的值可以是邏輯的、數字的,可以是程序、條件、默認值或是子框架。框架表示法適應性強、概括性高、結構化良好、推理方式靈活、又能把陳述性知識與過程性知識相結合,但是框架方法不易表達過程性知識,所以在具體的系統中,它往往要和其它方法配合使用。知識查詢模塊人工智慧問題的求解是以知識為基礎的,該模塊中知識庫規模大小一定程度上反映計算機的智能水平,但是人類的知識浩如煙海,表達形式各異,在現在的計算機技術限制下,不能夠把這些知識用規則形式全部表達出來。文字聊天模塊的知識庫可以分為詞典庫、規則庫、語義知識庫和常識庫。詞典庫主要用於分詞,包含有詞,詞義,詞性,以及詞頻等信息,同時也可以根據詞典庫裡面的詞義來動態生成一些基本的語義知識。規則庫保存中文句子的語法規則,用規則判斷句子是否符合語法,也可以根據規則來構造簡單的句子,規則可以動態增加。語義知識庫中記錄的語義知識主要就是語義關係知識,本質上就是詞語之間的巨大的關係網,通過這些關係網可以對詞語進行替換,推導出深層次的語義。[0038]常識庫可以是人們日常所用的知識,也可以是特殊領域的專業知識,內容最為廣泛,其形式可以是文字,圖片,聲音,視頻等。需要花費大量的人力物力去獲取、建立常識庫以及保證每一條常識的正確性,由此常識庫的建立是一個長期的過程。常識庫的建立應該獨立於程序設計,只要建立相關領域的常識庫,就能將聊天、教育和諮詢機器人應用於該領域。由於常識庫數據量巨大,如何快速保存,建立索引,提高數據檢索的速度需要進一步研究。知識庫的建立主要有手工建立,電腦程式自動建立和人機結合建立方式。一些基礎庫,如詞典庫,規則庫通過手工來建立,也可以到網際網路上獲取、改進已有的知識庫資源。而那些常識庫,可以先通過計算機從網際網路直接獲取,再經過人工檢查、修改,按照一定格式保存到資料庫中。基於自然語言的知識查詢是指用戶用自然語言在檢索系統中對查詢目標進行描述,系統從查詢文本中自動提取查詢條件、查詢目標的關鍵特徵等,按一定的規則和算法在資料庫中查找滿足條件的記錄作為查詢結果反饋給用戶。知識查詢需要預先設定一個或者多個特定知識庫,如特定專業課程,產品使用說明,企業的規章制度等。和聊天功能模塊不·同的是,知識查詢擅長於知識問答,而且答案要儘可能準確,對於不能回答的問題,就回答「不知道」,而不是故意轉移話題。知識查詢對輸入的句子預處理與聊天功能模塊是相同的,也需要先進行分詞、語法語義分析。為了能對用戶的提問做出正確地回答,首先需要知道用戶是針對什麼進行提問,也就是問題的類型是什麼,同時還要明確最終給出的答案應該滿足哪些要求。查詢過程中的問題類型疑問詞是確定問題類型及答案要求的主要依據,因此在確定問題類型時,首先要找出問句中的疑問詞,根據疑問詞分析可能的答案類型。但是各疑問詞的辨別能力並不相同由疑問詞「哪裡」可知是對「地點」進行提問,它是「專用疑問詞」,但如果句中出現「什麼」,就不能僅靠疑問詞來判斷類型,因為很多類型的問題都有這種「通用疑問詞」,必須藉助於問句中的另一個詞(稱為「問題焦點」或「疑問修飾詞」)才能進行正確的判斷。所謂「問題焦點」,就是問題中說明問題主要內容的一個名詞或名詞性短語,而問題的主要內容就是本實施例想要找到的答案需要滿足的條件。那麼如何來確定「問題焦點」呢? 一般情況下,問題中的第一個名詞或名詞短語是問題焦點的可能性很大。問答系統的問句一般是由一句話構成,首先取出該句中所有的名詞,然後根據疑問詞與句中名詞的位置信息進行判定,通過對大量問題的觀察和統計,可以歸納出含有通用疑問詞時問題類型的判斷規則如下(I)如果疑問詞後緊跟著名詞或名詞短語,則可以將該名詞或名詞短語看作是問題焦點;(2)如果疑問詞處於句子的末尾,則與該疑問詞距離最近的名詞或名詞短語可以看作是問題焦點;(3)如果疑問詞後為動詞(如「是、為」等),則句子中最後出現的名詞或名詞短語可以看作是問題焦點。表I為問題類型及答案要求的對應關係。表I
權利要求1.一種聊天機器人,其特徵在於包括攝像頭、攝像頭驅動模塊、語音拾取模塊和用於實現語音識別、知識查詢、語音生成的計算機;所述語音拾取模塊為麥克風,用於拾取語音信號;所述攝像頭用於捕獲人臉圖像;所述攝像頭的個數為2個。
2.根據權利要求I所述的聊天機器人,其特徵在於所述攝像頭共有5個自由度。
專利摘要本實用新型公開了一種聊天機器人,包括攝像頭及其驅動模塊、語音拾取模塊、語音識別模塊、知識查詢模塊、語音生成模塊;攝像頭捕獲人臉圖像,語音信號經由語音拾取模塊和語音識別模塊後識別出語義,所述聊天機器人根據人的語音來了解人的需求,然後通過知識查詢模塊來形成會話語句,再通過語音生成模塊生成語音與人進行交流。該會話機器人系統具有語音識別和理解能力,能夠聽懂用戶的指令,可以應用於學校、家庭、賓館、公司、機場、車站、碼頭、會議等地進行教育、聊天、會話、諮詢等;此外,它還可以為用戶提供宣傳介紹、來訪接待、辦事查詢、文秘服務、外語翻譯等。
文檔編號G06F17/30GK202736475SQ20112050895
公開日2013年2月13日 申請日期2011年12月8日 優先權日2011年12月8日
發明者肖南峰 申請人:華南理工大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀