一種語言轉換裝置的製作方法
2023-06-14 11:00:56 1
專利名稱:一種語言轉換裝置的製作方法
技術領域:
本發明涉及一種電子技術,特別是一種可以將使用者所說的某種語言轉換成另一種語言、或將其他人所說的語言轉換成使用者使用的語言的可攜式語言轉換裝置,以及相應的語言互譯方法。
背景技術:
說話是人類進行交流最直接、最自然的方式,我們日常生活中很大一部分的信息都是通過說話來進行傳遞和獲取的。如果由於某些原因而無法用說話來進行交流的話,人與人之間信息傳遞的效率將會大大降低,從而給生活帶來巨大的不便。如不同國家之間的語言的差異,對溝通帶來極大的障礙。而即便是同一國家,因方言的不同,也會帶來溝通上的障礙。我國幅員遼闊,具有眾多的民族,長期以來在各民族聚居的地方形成了多種獨特的文化,也形成了各種各樣的語言,例如僅在廣東省內就存在粵語、潮汕話、客家話、雷州話等多種地區語言。這些語言雖然大多數都以中文為基礎,但它們通常在發音、用詞、句式等方面與常用的普通話有著較大的差別,語言與語言之間也存在著許多差異,這使得一個地區的人如不經過學習很難聽懂或說另一地區的本地話。為了消除各地區語言上的差別,建國以來國家大力推廣普通話教育,取得了很大的成績。但儘管如此,在許多普通話教育還不夠普及的地區,人們日常的交流仍以本地語言為主,不少人甚至還不懂得普通話的聽和說。語言與普通話、語言與語言之間的差異使得來自不同地區的人常常難以正常地通過說話進行交流,種類繁多的語言也使得一般人無法一一學習。隨著各地間交往的增多,語言不通日益成為人們出行中的最常遇到的不便之一。解決出行中語言不通的問題目前主要採取兩種方法,其一是大家都說普通話,但這個要求對不少人來說難度較大;或者是找一位懂得兩位說話人使用語言的人作為翻譯, 將兩人的話互譯為對方的語言,但許多情況下這種翻譯並是隨時都能找到的,如在外出旅遊時就會經常碰到語言不通但又找不到可翻譯的人的情況。當然還可以通過寫字、打手勢等非說話的方式進行交流,但這些方法與說話相比顯然要麻煩得多,使用起來極為不便。
發明內容
本發明的目的在於克服不同語言之間的差異所導致的溝通障礙,提供了一種語言轉換裝置。為了達到發明目的,本發明採用的技術方案為
一種語言轉換裝置,包括處理器晶片、記憶晶片、語言接收模塊、播放器、擴展接口、顯示模塊、選擇電路和解碼電路組成,所述記憶晶片、語言接收模塊、播放器、擴展接口、顯示模塊、選擇電路和解碼電路均與處理器晶片連接,所述處理器晶片用以處理輸入語言信號、 產生輸出語言信號、控制擴展接口與外接設備之間的通信、對顯示模塊和選擇電路進行控制,所述解碼電路通過地址線與處理器晶片連接,並產生該語言轉換裝置所需的片選信號,所述選擇電路能選擇不同語言之間的轉換,進而使處理器晶片控制對不同語言之間的轉換,該語言轉換裝置的處理過程包括如下幾個步驟
(1)、建立語言系統
包括建立語言識別模型庫、語言合成模型庫和不同語言文法轉換表;
(2)、記錄原始語言信息
通過語言接收模塊記錄現場的原始語言信息;
(3)、識別原始語言信息
處理器晶片根據步驟(1)所建立的語言識別模型庫識別原始語言信息的內容;
(4)、將原始語言信息轉換成目標語言信息
處理器晶片根據步驟(1)所建立的語言文法轉換表將原始語言信息轉換成目標語言信
息;
(5)、播放目標語言信息
處理器晶片根據步驟(1)所建立的語言合成模型庫合成目標語言信息,並通過播放器將目標語言信息播出。本發明的步驟(1)建立語言系統包括如下步驟
(11)、確定需互譯的語言種類,並根據實際的需要確定每種語言的詞彙表和句子列
表;
(12)、根據每種語言的句子列表,建立語言文法轉換表,對於兩種語言之間的互譯,語言文法轉換表具體又可分為兩部分,一部分為語言C的句子到語言D的句子的映射,另一部分為語言D的句子到語言C的句子的映射,兩部分均為一張多對一的列表;
(13)、根據所確定的系統詞彙表,對每種語言的每個詞彙採集訓練數據,採用統計的方法建立語言識別模型庫;
(14)、根據系統的詞彙表以及所採用的合成方法不同,以語句、短語、詞或音節為單位, 或音節、半音節、音素為單位建立語言合成模型庫,通過對樣本數據的編碼分析,得到語言合成所需的模型參數。本發明的所述步驟(3)識別原始語言信息A包括如下步驟
(31)採用端點檢測技術,檢測出所錄製聲音中所有語言段的起點和終點;
(32)採用關鍵詞確認技術,對所有語言,分別利用其對應的語言識別模型庫識別出語言段中包含的系統可識別詞彙,無法識別的詞彙採用特殊的符號來代替,並將每句話的識別結果按先後順序進行排列;
(33)將不同語言識別得到的每句話的內容與該語言預定的句子內容進行比較,首先找出所有語言中與所記錄語言最匹配的句子,然後將該句子和所記錄語言的匹配程度與一預先設定的閾值進行比較,如果超過該閾值,則該句子為識別結果,該句子所屬的語言為當前記錄語言的語言,如果少於該閾值,則提示使用者無法識別該段聲音。本發明所述記憶晶片採用大容量的快閃記憶體晶片,且通過地址線、控制線、數據線與處理器晶片連接。記憶晶片為語言互譯裝置提供存儲空間。所述的語言接收模塊由麥克風和A/D轉換器組成,所述的播放器由D/A轉換器和揚聲器組成,所述的語言接收模塊和播放器均通過數據線和控制線與處理器晶片連接。本發明的語言互譯裝置的擴展接口由計算機接口控制器和計算機接口共同構成,且通過控制線和數據線與處理器晶片連接。為處理器晶片和計算機之間提供接口。所述的擴展接口由計算機接口控制器和計算機接口共同構成,且通過控制線和數據線與處理器晶片連接。本發明的語言互譯裝置的選擇電路由鍵盤陣列和鍵盤控制器組成,且通過數據線和控制線與處理器晶片連接。使用者可以通過開關或按鍵來對語言互譯裝置的狀態進行控制和設置。本發明提供的語言互譯裝置可以中文與外文、不同外文之間、以及實現普通話與語言之間、或語言與語言之間一些常用語的互譯,即可以將接收到的一段常用的普通話或某種語言的語言轉換為另一種語言或普通話再進行播放,使得使用者無需通過第三者翻譯即可直接與使用其他語言的人進行簡單的交談,可有效地解決出行時語言不通的問題。本發明的有益之處包括
1、利用本發明,兩個語言不通的人無需通過第三者或寫字、打手勢等方式即可方便地進行一些交1如購物、餐飲等等,有效地改善了人們出行中遇到的語言不通的問題。2、本發明的電路體積小,重量輕,可以隨身攜帶,方便人們使用。3、通過合理地設計系統的詞彙和句子,可以方便地設計出適用於不同場合的語言互譯機,並能實現多種語言之間的互譯。4、可以通過用計算機下載更新語言識別模型庫、語言合成模型庫和語言文法轉換表的方法,來改變系統適用的語言以及詞彙。
圖1為本發明提供的語言互譯裝置的結構原理圖。
具體實施例方式
下面結合附圖對本發明做進一步的說明。本發明提供的語言轉換裝置的結構原理圖如附圖1所示,由處理器晶片、記憶晶片、語言接收模塊、播放器、擴展接口、顯示模塊、選擇電路、解碼電路組成,所述的記憶晶片、語言接收模塊、播放器、擴展接口、顯示模塊、選擇電路、解碼電路通過地址線、或數據線、或控制線與處理器晶片連接。本實施例的處理器晶片由DSP或MCU晶片構成;語言輸入電路由麥克風和A/D轉換器共同構成;語言輸出電路由D/A轉換器和揚聲器共同構成;記憶晶片採用大容量的快閃記憶體晶片;擴展接口由計算機接口控制器和計算機接口共同構成,使用者可以通過該接口從計算機中下載新的語言識別模型庫、語言合成模型庫和語言文法轉換表;顯示模塊由LCD 顯示屏和LCD控制器共同構成,用以顯示系統當前的一些狀態信息,如時間、互譯語言種類、是否正在翻譯、翻譯時已錄入語言的長短、系統設置時的菜單等;選擇電路由鍵盤陣列和鍵盤控制器共同構成,其中鍵盤陣列中包含一「翻譯」功能按鍵,當需要進行語言翻譯時, 使用者按住「翻譯」功能鍵並對麥克風說話,說完話後,鬆開「翻譯」功能鍵,互譯機即自動將使用者所說的話轉換為所需的語言,通過互譯機上的揚聲器播放出來;鍵盤陣列上還設有另一些可對系統狀態進行設置的按鍵,可通過這些按鍵對系統的一些參數進行設置,如在系統可以處理多種語言時,設定當前互譯的語言類型。
5
當開機上電後,系統首先進行初始化。初始化結束後,進入主程序循環,系統不斷檢測計算機接口是否與計算機連接,以及按鍵狀態。當檢測到計算機接口與計算機連接後, 則停止其他操作,進入聯機狀態。此時使用者可通過計算機下載新的語言識別模型庫、語言合成模型庫以及語言文法轉換規則表,以更新系統適用的語言或詞彙。當使用者完成下載, 並將計算機與系統斷開連接後,系統退出聯機狀態,恢復正常的操作。如果系統沒有與計算機連接並有按鍵操作時,判斷使用者是否按下「翻譯」功能鍵,當使用者按下「翻譯」鍵時, 進行以下操作
1、使用者按下「翻譯」功能鍵的同時,開始在內存緩衝區中對輸入的聲音信號進行記錄,當使用者放開「翻譯」功能鍵時,停止聲音信號的記錄,啟動語言識別進程。由於直接記錄原始聲音信號需要較大的存儲空間,因此先將原始語言信號轉換為識別時所需要的語言特徵,再對這些語言特徵進行記錄,這樣可以節約大量的存儲空間。2、語言識別進程中,對記錄下的聲音段進行檢測和識別,具體又可以分為以下步驟
(1)採用端點檢測技術,檢測出所錄製聲音中所有語言段的起點和終點。(2)採用關鍵詞確認技術,對系統的所有語言,分別利用其對應的語言識別模型庫識別出語言段中包含的系統可識別詞彙,無法識別的詞彙採用特殊的符號來代替,並將每句話的識別結果按先後順序進行排列。(3)將不同語言識別得到的每句話的內容與該語言預定的句子內容進行比較,首先找出所有語言中與所記錄語言最匹配的句子,然後將該句子和所記錄語言的匹配程度與一預先設定的閾值進行比較,如果超過該閾值,則該句子為識別結果,該句子所屬的語言為當前記錄語言的語言,如果少於該閾值,則提示使用者無法識別該段聲音。3、根據語言識別得到的語言種類和句子內容,以及系統當前設置的互譯語言種類,利用語言文法轉換表,對識別結果的每個句子轉換為另一種語言的句子。4、利用語言合成模型庫,將已經轉換好的句子用語言合成技術進行合成,並控制播放器進行播放,具體又可以分為以下幾個步驟
(1)根據所需的語言類型和轉換好的句子內容,在語言合成模型庫中找出所需用到的語言合成模型,並加載這些模型。(2)利用已加載的語言合成模型,用語言合成技術產生所需要的數字語言信號。(3)向D/A轉換器輸出該語言信號。當使用者按下其他功能鍵時,執行相應的功能操作,例如在系統可以處理多種語言時,對當前互譯語言種類的指定等。語言識別模型庫、語言合成模型庫和語言文法轉換表由生產廠家以軟體的形式提供給使用者,使用者可以通過互譯機的計算機接口從計算機上下載不同的語言識別模型庫、語言合成模型庫和語言文法轉換表。語言識別模型庫、語言合成模型庫和語言文法轉換表可以通過以下方法建立
1、確定需互譯的語言種類,並根據實際的需要確定每種語言的詞彙表和句子列表。2、根據每種語言的句子列表,建立語言文法轉換表。對於兩種語言之間的互譯,語言文法轉換表具體又可分為兩部分,一部分為語言A的句子到語言B的句子的映射,另一部分為語言B的句子到語言A的句子的映射,兩部分均為一張多對一的列表。這是因為不少句子雖然用詞不同,但其意思是一樣的,例如普通話的「請問到北京路怎麼走? 」和「北京路怎麼去?」意思都是問去北京路的方法,因此轉換時可以當作一個句子來翻譯。3、根據所確定的系統詞彙表,對每種語言的每個詞彙採集訓練數據,採用統計的方法建立語言識別模型庫。目前語言識別中最常用的統計模型為HMM,可以採用EM訓練方法由訓練數據得到每個詞彙的HMM模型,語言特徵可採用MFCC、LPCC、PLP以及音調變化軌跡等。在建立系統詞彙表內詞彙的語言識別模型的同時,還需建立詞彙表外詞彙的填料模型。4、根據系統的詞彙表以及所採用的合成方法不同,以語句、短語、詞或音節為單位 (適用於語言的波形編碼合成法),或音節、半音節、音素為單位(適用於語言的參數分析合成法和規則合成法)建立語言合成模型庫,通過對樣本數據的編碼分析,得到語言合成所需的模型參數。
權利要求
1. 一種語言轉換裝置,包括處理器晶片、記憶晶片、語言接收模塊、播放器、擴展接口、 顯示模塊、選擇電路和解碼電路組成,所述記憶晶片、語言接收模塊、播放器、擴展接口、顯示模塊、選擇電路和解碼電路均與處理器晶片連接,其特徵在於該語言轉換裝置的處理過程包括如下幾個步驟(1)、建立語言系統包括建立語言識別模型庫、語言合成模型庫和不同語言文法轉換表,進一步包括如下步驟(11)、確定需互譯的語言種類,並根據實際的需要確定每種語言的詞彙表和句子列表;(12)、根據每種語言的句子列表,建立語言文法轉換表,對於兩種語言之間的互譯,語言文法轉換表具體又可分為兩部分,一部分為第一語言的句子到第二語言的句子的映射, 另一部分為第二語言的句子到第一語言的句子的映射,兩部分均為一張多對一的列表;(13)、根據所確定的系統詞彙表,對每種語言的每個詞彙採集訓練數據,採用統計的方法建立語言識別模型庫;(14)、根據系統的詞彙表以及所採用的合成方法不同,以語句、短語、詞或音節為單位, 或音節、半音節、音素為單位建立語言合成模型庫,通過對樣本數據的編碼分析,得到語言合成所需的模型參數;(2)、記錄原始語言信息通過語言接收模塊記錄現場的原始語言信息;(3)、識別原始語言信息處理器晶片根據步驟(1)所建立的語言識別模型庫識別原始語言信息的內容,進一步包括如下步驟(31)採用端點檢測技術,檢測出所錄製聲音中所有語言段的起點和終點;(32)採用關鍵詞確認技術,對所有語言,分別利用其對應的語言識別模型庫識別出語言段中包含的系統可識別詞彙,無法識別的詞彙採用特殊的符號來代替,並將每句話的識別結果按先後順序進行排列;(33)將不同語言識別得到的每句話的內容與該語言預定的句子內容進行比較,首先找出所有語言中與所記錄語言最匹配的句子,然後將該句子和所記錄語言的匹配程度與一預先設定的閾值進行比較,如果超過該閾值,則該句子為識別結果,該句子所屬的語言為當前記錄語言的語言,如果少於該閾值,則提示使用者無法識別該段聲音;(4)、將原始語言信息轉換成目標語言信息處理器晶片根據步驟(1)所建立的語言文法轉換表將原始語言信息轉換成目標語言信息;(5)、播放目標語言信息處理器晶片根據步驟(1)所建立的語言合成模型庫合成目標語言信息,並通過播放器將目標語言信息播出。
全文摘要
本發明提供一種語言轉換裝置,包括處理器晶片、記憶晶片、語言接收模塊、播放器、擴展接口、顯示模塊、選擇電路和解碼電路組成,所述記憶晶片、語言接收模塊、播放器、擴展接口、顯示模塊、選擇電路和解碼電路均與處理器晶片連接,所述處理器晶片用以處理輸入語言信號、產生輸出語言信號、控制擴展接口與外接設備之間的通信、對顯示模塊和選擇電路進行控制,所述解碼電路產生所需的片選信號,所述選擇電路能選擇不同語言之間的轉換,進而使處理器晶片控制對不同語言之間的轉換,所述的解碼電路通過地址線與處理器晶片連接。
文檔編號G06F17/28GK102567309SQ201010581088
公開日2012年7月11日 申請日期2010年12月9日 優先權日2010年12月9日
發明者蔡偉俊 申請人:蔡偉俊