新四季網

一種基於voicexml的電話語音實時交互系統和方法

2023-10-06 16:44:29

專利名稱:一種基於voicexml的電話語音實時交互系統和方法
技術領域:
本發明屬於計算機技術領域,涉及一種針對電話語音交互的實時性特點,並且能為普通用戶直接用來定製電話語音交互應用的基於voicexml的電話語音實時交互應用定製平臺。具體涉及一種基於voicexml的電話語音實時交互系統和方法。
背景技術:
隨著語音應用技術的不斷成熟,和對智能化系統需要的不斷增多,各種語音交互應用系統不斷出現,語音交互應用在廣泛地應用於銀行、股票、公共信息、企業呼叫中心等應用領域。伴隨語音應用信息的不斷更新,對語音應用開發平臺的要求也浮出水面,W3C組織相應制定了語音應用的標準xml語言voicexml,一些公司開發了基於voicexml的語音應用平臺。
當前出現的語音交互平臺有兩大局限只提供的對voicexml的編輯界面,熟悉voicexml的二次開發人員才能使用,普通用戶無法定製自己需要的應用;交互流程完全採用www的動態生成頁面設計,對於大容量語音實時交互,交互的實時性將因網絡傳輸的影響而降低。

發明內容
本發明的目的是克服現有技術的上述缺點,提供一種基於voicexml的電話語音實時交互系統和方法。
本發明的一種基於voicexml的電話語音實時交互方法,包括步驟確定需要定製的電話語音交互應用場景;確定所述交互應用中的動態與靜態生成流程;電話呼入時,運行靜態生成流程;根據所述靜態生成流程調用需要的所述動態流程中的動態參數,根據VXML語法結合靜態流程生成voicexml文件;執行所述文件,實現電話語音實時交互。
可選地,還包括步驟企業用戶運行編輯單元;編輯單元將加載已經存在的應用;用戶編輯語音交互應用,並保存完成定製的應用。
優選地,所述實現電話語音實時交互的步驟包括播放提示語。
可選地,所述調用需要的所述動態流程中的動態參數的步驟包括響應用戶輸入,調用動態服務,以運行jsp程序,訪問資料庫,以獲得所述動態流程。
優選地,所述訪問資料庫的步驟包括根據用戶輸入和所述定製的流程,調用動態流程中的變化參數。
可選地,所述資料庫和靜態生成流程位於一臺機器,或分別位於兩臺機器。
本發明的一種基於voicexml的電話語音實時交互的系統,包括語音門戶信息編輯裝置,用於實現用戶和所述系統的交互;vxml伺服器,用於將用戶和所述系統的交互生成執行流程,其中,語音交互應用由靜態部分和動態部分組成,靜態的部分描述主要交互流程和語法,動態部分實現交互流程動態生成;和語音門戶運行裝置,用於執行所述流程。
可選地,所述語音門戶信息編輯裝置包括輸入裝置,用於由用戶確定需要定製的電話語音交互應用場景;所述vxml伺服器,用於確定所述交互應用中的動態與靜態生成流程,電話呼入時,運行靜態生成流程;根據所述靜態生成流程調用需要的所述動態流程中的動態參數,根據VXML語法結合靜態流程生成voicexml文件;所述語音門戶運行裝置執行所述文件,實現電話語音實時交互。
優選地,所述運行裝置包括對話流程控制裝置,用於控制呼入電話的流程;語音識別和語音合成裝置,用於識別用戶的語音交互並播放提示語。
可選地,所述vxml伺服器包括靜態服務單元,用於執行所述系統的主流程與控制功能;和動態單元,用於實現所述靜態服務單元根據用戶要求控制的動態服務;所述動態單元以Tomcat+Apache方式或者Tomcat直接運行方式加載並執行應用的JSP文件,而Jakarta TagLibs負責JSP標籤的解析。
因此,本發明通過對系統架構、對話流程結構設計、對話場景圖形界面定製、動態生成場景界面定製等一系列技術的創新和應用,實現了針對非二次開發人員的電話語音交互應用的完全圖形界面定製,並且保證了定製的語音應用的交互實時性,為用戶特別是企業用戶提供了一種定製電話語音應用的工具。


圖1為本發明的voicexml的電話語音實時交互系統的結構示意圖;圖2為本發明的voicexml的電話語音實時交互系統的結構拓撲圖;圖3為本發明的實施例中企業用戶創建電話語音交互應用過程;
圖4為本發明的實施例中普通用戶電話呼入後的交互過程。
具體實施例方式
為了使本技術領域的人員更好地理解本發明,下面結合附圖和實施方式對本發明作進一步的詳細說明。
我們把用戶分為兩類企業用戶(管理員),利用專利提供的平臺來創建自己的電話語音交互應用,如企業的呼叫中心語音交互流程定製人員;普通用戶,使用電話語音交互應用來完成某些事情,如打電話查詢產品價格的客戶。
提供一種靈活定製電話語音交互應用的工具。
企業用戶可以通過本發明的信息編輯界面來定製需要的電話語音交互應用;對於已經完成的定製應用,本發明的運行單元負責應用的實時運行,並且提供線路運行狀態的監控。
本發明基於標準的voicexml 2.0,保證了系統具有良好的擴充性。本發明提供企業用戶的定製界面是完全的圖形界面,底層的voicexml解析對於企業用戶是透明的,企業用戶可以獲得以IVR樹圖形界面顯示的語音交互應用流程,可以通過界面定製應用。此外,本發明在架構上採用靜態和動態頁面地結合的技術,從本質上區別於當前眾多的語音交互平臺(語音瀏覽器),能夠保證語音交互應用的實時性要求。
基於voicexml的電話語音實時交互應用系統的框架圖如圖1所示。
系統由三部分組成語音門戶信息編輯單元、vxml伺服器、語音門戶運行單元。語音交互應用由靜態部分和動態部分組成,靜態的部分描述主要交互流程和語法,動態部分實現交互流程動態生成。
語音交互應用靜態對話流程和涉及到的語法文件信息保存在main.vxml文件和grammar.xml文件中,信息編輯單元ccinfo和運行單元ccrun通過共享目錄來使用這兩個文件和對應的語法包。動態的對話信息通過保存在vxml伺服器上的jsp文件來生成。
語音門戶運行單元具體負責的語音應用的運行,識別用戶的語音和按鍵輸入,播放提示語,並完成相關的電話轉接功能,是一套基於語音板卡的應用程式。運行單元分為兩層上層為對話流程控制,通過解析vxml文件,來控制應用的流程。下層包括電話控制、語音識別、語音合成,實現具體電話接聽、掛機和轉接等電話操作和語音識別語音合成具體功能。此外還包括系統設置模塊和日誌維護模塊,設置系統運行中需要的參數並維護系統運行日誌。
VXML伺服器負責jsp文件的加載和運行。可以以Tomcat+Apache方式或者Tomcat直接運行方式加載並執行應用的JSP文件,Jakarta TagLibs負責JSP標籤的解析。
信息編輯單元負責語音交互應用流程的編輯,分為GUI(圖形用戶界面)界面模塊和vxml(jsp)解析模塊。GUI界面模塊給用戶提供定製語音交互應用的GUI界面,vxml解析模塊完成vxml文件、jsp文件的自動生成和維護,是界面與下層的vxml文件的接口。為了保證電話語音交互應用的實時性,信息編輯界面在生成jsp文件時,將動態生成的對話流程最後跳轉到主靜態流程main.vxml中。
本發明的系統的結構拓撲圖如圖2所示。
運行單元、信息編輯單元和vxml伺服器分別部署在不同的伺服器上,三者在同一區域網中。語音交互應用的靜態內容部署在語音門戶運行單元中,動態服務程序部署在vxml伺服器上。語音門戶信息編輯單元採用訪問虛擬目錄方式訪問語音交互應用的靜態部分。此外,語音識別服務和語音合成服務,可以同語音門戶運行單元部署在同一臺伺服器上,也可以部署在不同的機器上。
信息編輯單元提供圖形界面供企業用戶創建並編輯語音交互應用,同時語音交互流程信息將以樹結構顯示在圖形編輯界面上。運行單元負責解析及運行語音交互流程,運行單元加載並運行靜態流程;在運行中遇到需要動態生成的部分,如資料庫查詢,向vxml伺服器發出請求,vxml伺服器將運行對應服務程序,動態生成語音對話流程。
企業用戶可以通過語音門戶信息編輯單元來創建電話語音交互應用,語音門戶運行單元加載運行具體的電話語音交互應用。普通用戶通過電話呼入的方式來訪問電話語音交互應用。
圖3為企業用戶創建電話語音交互應用的過程,圖4為在運行定製好的電話語音交互應用時,普通用戶使用電話與生成的應用交互的一般過程。
圖3中,企業用戶運行編輯單元,編輯單元將加載已經存在的應用,用戶編輯語音交互應用,並保存完成定製的應用。在編輯的過程中,當需要利用保存在應用信息資料庫中的應用信息時,由編輯單元自動訪問應用信息資料庫。
圖4中,當企業用戶完成電話語音交互應用定製後,啟動運行單元。普通用戶通過撥打電話的方式訪問運行在運行單元中的語音應用,運行單元將運行靜態主流程(main.vxml),播放提示語;普通用戶可以以語音或按鍵的輸入方式來與系統交互。
當遇到需要動態生成流程時,例如需要從應用信息資料庫中獲得某產品的報價時,運行單元向vxml伺服器提交請求,vxml伺服器將運行指定的服務程序,從應用信息資料庫中獲取需要的產品價格,並生成新的交互流程,返回給運行單元。運行單元將繼續運行新生成的交互流程,直到用戶掛機或系統轉接電話。
由於動態生成的交互流程的執行結果會跳到主交互流程上,同時在除非需要動態生成的交互流程,運行單元大部分時間運行的是靜態主流程,大大減少了與vxml伺服器交互的時間,保證了電話語音交互的實時性。
雖然通過實施例描繪了本發明,本領域普通技術人員知道,本發明有許多變形和變化而不脫離本發明的精神,希望所附的權利要求包括這些變形和變化而不脫離本發明的精神。
權利要求
1.一種基於voicexml的電話語音實時交互的方法,包括步驟確定需要定製的電話語音交互應用場景;確定所述交互應用中的動態與靜態生成流程;電話呼入時,運行靜態生成流程;根據所述靜態生成流程調用需要的所述動態流程中的動態參數,根據VXML語法結合靜態流程生成voicexml文件;執行所述文件,實現電話語音實時交互。
2.如權利要求1所述的方法,還包括企業用戶運行編輯單元;編輯單元將加載已經存在的應用;用戶編輯語音交互應用,並保存完成定製的應用。
3.如權利要求1所述的方法,其中,所述實現電話語音實時交互的步驟包括播放提示語。
4.如權利要求1所述的方法,其中,所述調用需要的所述動態流程中的動態參數的步驟包括響應用戶輸入,調用動態服務,以運行jsp程序,訪問資料庫,以獲得所述動態流程。
5.如權利要求4所述的方法,其中,所述訪問資料庫的步驟包括根據用戶輸入和所述定製的流程,調用動態流程中的變化參數。
6.如權利要求5所述的方法,其中,所述資料庫和靜態生成流程位於一臺機器,或分別位於兩臺機器。
7.一種基於voicexml的電話語音實時交互的系統,包括語音門戶信息編輯裝置,用於實現用戶和所述系統的交互;vxml伺服器,用於將用戶和所述系統的交互生成執行流程,其中,語音交互應用由靜態部分和動態部分組成,靜態的部分描述主要交互流程和語法,動態部分實現交互流程動態生成;和語音門戶運行裝置,用於執行所述流程。
8.如權利要求7所述的系統,其中,所述語音門戶信息編輯裝置包括輸入裝置,用於由用戶確定需要定製的電話語音交互應用場景;所述vxml伺服器,用於確定所述交互應用中的動態與靜態生成流程,電話呼入時,運行靜態生成流程;根據所述靜態生成流程調用需要的所述動態流程中的動態參數,根據VXML語法結合靜態流程生成voicexml文件;所述語音門戶運行裝置執行所述文件,實現電話語音實時交互。
9.如權利要求8所述的系統,其中,所述運行裝置包括對話流程控制裝置,用於控制呼入電話的流程;語音識別和語音合成裝置,用於識別用戶的語音交互並播放提示語。
10.如權利要求9所述的系統,其中,所述vxml伺服器包括靜態服務單元,用於執行所述系統的主流程與控制功能;和動態單元,用於實現所述靜態服務單元根據用戶要求控制的動態服務;所述動態單元以Tomcat+Apache方式或者Tomcat直接運行方式加載並執行應用的JSP文件,而Jakarta TagLibs負責JSP標籤的解析。
全文摘要
本發明提供了一種基於voicexml(語音xml標記語言)的電話語音實時交互的方法和系統。方法包括步驟確定需要定製的電話語音交互應用場景;確定所述交互應用中的動態與靜態生成流程;電話呼入時,運行靜態生成流程;根據所述靜態生成流程調用需要的所述動態流程中的動態參數,根據VXML(voicexml簡稱)語法結合靜態流程生成voicexml文件;執行所述文件,實現電話語音實時交互。系統包括語音門戶信息編輯單元、vxml伺服器、語音門戶運行單元。利用本發明,實現了電話語音交互應用的完全圖形界面定製,並且保證了定製的語音應用的交互實時性。
文檔編號H04M11/00GK1558656SQ200410001120
公開日2004年12月29日 申請日期2004年1月20日 優先權日2004年1月20日
發明者孫文彥, 張繼勇, 諸光, 任文捷, 陳庭瑋 申請人:聯想(北京)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀