新四季網

漢語與外語雙向實時語音翻譯無線移動通訊設備的製作方法

2023-06-28 03:25:16

漢語與外語雙向實時語音翻譯無線移動通訊設備的製作方法
【專利摘要】本技術方案是一種漢語與外語雙向實時語音翻譯無線移動通訊設備,屬於無線移動通訊【技術領域】。該通訊設備在將漢語語音或外語語音轉變成目標語言的語音時,首先將受話器接受到的源語言的語音,通過儲存在該通訊設備儲存晶片中的語音識別模塊、機器翻譯模塊、語音合成模塊、語音編碼壓縮模塊進行信息處理,最後再通過無線發射傳輸模塊將轉換、翻譯、處理過的目標語言的語音信號,必要時連同用於語音合成的字符信息一起通過無線移動公網或無線移動專網傳輸給指定號碼的通訊設備。有了本技術方案以後,中外人士能通過以手機為代表的該無線移動通訊設備直接用各自的母語的語音進行信息交流。
【專利說明】漢語與外語雙向實時語音翻譯無線移動通訊設備
【技術領域】
[0001]本技術方案屬於無線移動通訊【技術領域】。
【背景技術】
[0002]目前市面上的無線移動通訊設備最典型的是手機,目前所有的手機基本上不具有不同語種語音的轉換翻譯功能,也就是說如果通話一方的講的是漢語,那麼接受方聽到的也一定是漢語,反之以英語為代表的外語也一樣,所謂手機在語音通信方面的好壞,也就是接受方接受到的語音清晰程度的高低而已,而且傳統用漢字表達的漢語信息,傳輸到外國人的手機上將是一片亂碼,根本不能釋讀出原來的用漢字表達的漢語信息,以目前的手機技術為代表的無線移動通訊設備技術不能滿足全球經濟一體化,中外人士越來越需要直接通過以手機為代表的無線移動通訊設備來進行語音交流的需要。

【發明內容】

[0003]本技術方案的提出就是為了解決不同語種的人們直接通過以手機為代表的無線移動通訊設備來進行語音交流的問題,同時解決傳統用漢字表達的漢語信息,傳輸到外國人的手機上將是一片亂碼,根本不能釋讀出原來的用漢字表達的漢語信息的問題,具體來說本技術方案通過採用以下的一種漢語與外語雙向實時語音翻譯無線移動通訊設備來解決上述的問題:
[0004]該通訊設備在將漢語語音轉變成外語語音時,首先將受話器接受到的漢語語音,通過儲存在該通訊設備儲存晶片中的漢語語音識別模塊,將漢語語音識識別成用26個拉丁字母表示的漢語語音碼,再通過儲存在該通訊設備儲存晶片中的機器翻譯模塊將上述漢語語音碼翻譯成用26個拉丁字母表示的指定的外文,最後將上述翻譯成的指定的外文,通過儲存在該通訊設備儲存晶片中的語音合成模塊合成成相應的外語語音並傳輸給傳統通訊設備語音編碼壓縮模塊進行語音編碼壓縮處理,處理後再傳輸給傳統通訊設備的無線發射傳輸模塊,通過該無線發射傳輸模塊將翻譯成的指定外語語音信號通過無線移動公網或無線移動專網傳輸給指定號碼的通訊設備;
[0005]在將外語語音轉變成漢語語音時,首先將受話器接受到的外語語音,通過儲存在該通訊設備儲存晶片中的外語語音識別模塊,將外語語音識別成用26個拉丁字母表示的外文,再通過儲存在該通訊設備儲存晶片中的機器翻譯模塊將上述外文翻譯成漢語語音碼,最後將上述翻譯成的漢語語音碼,通過儲存在該通訊設備儲存晶片中的漢語語音合成模塊合成成相應的漢語語音並傳輸給傳統通訊設備語音編碼壓縮模塊進行語音編碼壓縮處理,處理後再傳輸給傳統通訊設備的無線發射傳輸模塊,通過該無線發射傳輸模塊將翻譯成的漢語語音信號通過無線移動公網或無線移動專網傳輸給指定號碼的通訊設備;
[0006]必要時上述用於語音合成的字符信息連同合成的語音可以通過傳統無線通訊設備的無線發射傳輸模塊,以傳統無線通訊設備簡訊和傳輸語音的發送形式傳輸給指定號碼的無線通訊設備。[0007]上述所述的漢語語音碼是以單詞為單位,這裡將單個漢字看作單音節詞,根據組成該單詞的每個音節的《漢語拼音方案》中的拼音,用且僅用26個拉丁字母對漢語拼音的聲母、介母、韻母、聲調採取先編碼再依次按「聲碼+介碼+韻碼+調碼兼隔音節符號」的順序編碼拼寫,並通過得到的語音碼的編碼直接表達漢語信息,當直接用語音碼編碼來表示漢語信息時,其標點符號的用法同英文的標點符號的用法相同,編碼時同一個單詞的多個音節不用空格連續編碼,單詞與單詞之間要有空格隔開。
[0008]由於本技術方案採用26個拉丁字母表示的漢語語音碼來表達漢語信息,且當直接用語音碼編碼來表示漢語信息時,其標點符號的用法同英文的標點符號的用法相同,這樣就保證了漢語信息的表達連標點符號在內都與ASCII碼完全一致,也即與ASCII碼100%兼容,這樣就保證了用漢語語音碼錶達的漢語信息可以在外國人的手機上顯示,一般以使用英文為代表的外國無線移動通訊設備都使用或支持ASCII碼系統,這樣就解決了傳統用漢字表達的漢語信息在外國手機上無法顯示和釋讀的問題,同時也解決了不同語種的人們直接通過以手機為代表的無線移動通訊設備來進行語音交流的問題。
[0009]有了本技術方案以後,漢語會更方便進行通過以手機外代表的無線移動通訊設備直接用漢語語音與講以英語為代表的外語人群的語言語音交流,從而使漢語能夠更廣更好地傳播到世界各地,促進中國文化走向世界,反之對外國人亦然,這樣就更方便中外人員使用各自的母語進行信息交流。
[0010]所述的漢語語音碼需要時可以通過漢字轉換模塊轉換成漢字,漢語語音碼或漢字能夠單獨或者漢語語音碼與漢字、漢語拼音,意義一致的外文對照屏幕顯示或儲存在該通訊設備中。
【具體實施方式】 [0011]下面結合實施例對本發明的【具體實施方式】作進一步的說明。
[0012](一 )本技術方案所採用的漢語語音碼的每一音節聲、韻、調的編碼方法採用以下的方法:
[0013]注:括號內的符號均為《漢語拼音方案》中的漢語拼音符號,以下簡稱為漢語拼音符號,不帶括號的字母為本方案所採用的漢語語音碼的每一音節聲、韻、調的編碼符號,以下將下列對照表簡稱為碼錶;
[0014]1、聲碼的編碼符號採用與漢語拼音方案基本一致的聲母的字母符號,比如採用下面這種聲碼的編碼形式:
[0015]b: (b) P: (P) m:(m) f: (f) d: (d) t: (t)
[0016]η: (n) 1:(1) g: (g) k: (k) h: (h)
[0017]j: (zh), (j)q: (ch), (q)x: (sh), (x) r: (r)
[0018]z: (z) c: (c) s: (s) y: (y) w: (w)
[0019]2、漢語拼音介母(U)採用26個拉丁字母中的一個字母表示,比如採用下面這種介碼的編碼形式:
[0020]1:⑴ u: (u)y: (U)
[0021]3、韻碼的編碼,對單韻母除(U)採用26個拉丁字母中的一個字母表示外,其它採用與漢語拼音相同的字母符號,漢語拼音的複合韻母只要是採用輔音字母來編碼都是可以的,比如採用下面的這種字母符號來對漢語拼音的韻母進行編碼:
[0022]a: (a) ο: (o) e: (e) i: (i) u: (u) y: (ii)
[0023]k: (ao) c:(ai) s: (an) χ: (ou) w:(ei) η: (en)
[0024]ζ: (ua) I: (uo) b: (ang) d: (ong) ρ: (eng)
[0025]q: (ing) g: (ng) er: (er)
[0026]r:⑴[只與(zh)、(ch)、(sh)相拼]
[0027]4、調碼的編碼除採用一個漢語不用的輔音字母V表示漢語拼音的上聲(V )夕卜,其它採用元音字母來表示漢語的聲調,比如採用下面的字母來對漢語拼音的聲調進行編碼:
[0028]a:(-)陰平 e: (/)陽平 V: ( V )上聲 u: (\)去聲
[0029]ο:(不標)輕聲
[0030]( 二 )利用上述編碼的漢語語音碼漢語信息表示採用如下的方法:
[0031]以單詞為單位,這裡將單個漢字看作單音節詞,根據組成該單詞的每個音節的《漢語拼音方案》中的拼音,依次按「聲碼+介碼+韻碼+調碼兼隔音節符號」的順序編碼,同一個單詞的多個音節不用空格隔開連寫,單詞與單詞之間的編碼用空格隔開,當漢語信息表示處於漢語語音碼狀態時,其六種點號,七種標號和一個移行號採用與英文相同的形式;
[0032]這裡由於將獨立運用的漢字看作單音節詞,因此,本發明所採用的漢字編碼的方法和漢語單詞音節編碼的方法相同,在本發明中採用單詞音節編碼按詞連寫後得到單詞編碼,我們將由若干個單詞組成的一組詞稱為詞組,本發明所採用詞組的編碼同漢語句子的編碼相同,由於單詞可以表示詞組和漢語句子,因此在本發明中所採用的詞組的編碼和漢語句子的編碼都可以通過單詞的編碼實現,而不需要對詞組和漢語句子另外製定一套專門的編碼,一般在整句整篇以詞為單位表示漢語信息時,在理解時一般不需要進行同音字詞的選擇,原則上聽起來不會產生歧義的句子,用編碼表達時也不會產生歧義。
[0033]下面以一句漢語句子的語音與英語句子的語音為例來說明本技術方案的具體實現步驟
[0034]一.首先將受話器接受到的漢語語音,通過儲存在該通訊設備儲存晶片中的漢語語音識別模塊,將漢語語音識識別成用26個拉丁字母表示的漢語語音碼:
[0035]當採用漢語語音碼漢語語音識別模塊來進行漢語語音識別時,該漢語語音識別模塊將漢語音節作為識別的基元,通過查找預先儲存在計算機系統中的漢語音節語音模板和漢語語音音節碼對照表,匹配後識別出相應的漢語音節語音碼,語音連續輸入時便得到連續的漢語音節語音碼串,對上述得到漢語音節語音碼串通過查詞庫的方式進行按詞切分,對多種單詞切分,可以依據漢語詞法句法上下文聯繫及統計規律等手段進行判別後再進行單詞切分,對切分出的單詞採取同一單詞的音節與音節之間連寫,詞與詞之間空格的方式表不。
[0036]下面例舉用本發明方法對漢語語音進行漢語語音碼識別的例子:
[0037]1.漢語語音轉換成漢語語音碼:
[0038]比如:我們用漢語語音向計算機朗讀下列漢語句子:
[0039]「我們每天使用拉丁文。」
[0040](I)通過查找預先儲存在計算機系統中的漢語音節語音模板和漢語語音音節碼對照表,匹配後識別出相應的漢語音節語音碼串:
[0041]Wov mno mwv tisa xrv ydu Iaa dqa wnv.(音節與音節之間有空格)
[0042]或woxmngmwitisgxrxydyjaadqawnx.(音節與音節之間無空格)
[0043](熟練後mno中的輕音符ο在不引起混音時可以省略,以上以下均同。)
[0044]為了讓大家看清楚這裡將表示聲調的字母加了下劃線,語音碼中的聲調字母同時具隔音節作用,實際語音碼中聲調無下劃線,熟練漢語語音碼後聲調兼隔音節符能夠方便區分出來。
[0045]這樣便完成了一個系統的複雜性與系統的詞庫規模性無關的純語音識別過程。
[0046](2)將語音碼串進行單詞切分,最終完成以詞為單位的語音碼轉換。
[0047]通過查找預先儲存在計算機系統中的分好詞的漢語語音碼單詞詞庫,將同一個單詞的多個音節連寫,詞與詞之間用空格隔開便得到以下我們最終需要的漢語語音碼:
[0048]Wovmno mwvtisa xrvydu laadqawnv.[0049]二.再通過儲存在該通訊設備儲存晶片中的機器翻譯模塊將上述漢語語音碼翻譯成用26個拉丁字母表示的指定的外文:
[0050](注:以上以下文中出現的與漢語語音碼對照的漢字是為了方便理解漢語語音碼的含義,實際在純A SCII碼系統運行中並不出現,以上以下均同)
[0051]比如將上面得到的漢語語音碼表示的漢語信息:wovmno mwvtisaxrvydu laadqawnv.調用漢語語音碼與英文為主的外語雙向翻頁模塊有:
[0052]Lwovmno mwvtisa xrvydu laadqawnv.(漢語語音碼錶不的漢語信息)
[0053]我們每天使用拉丁文。(用漢字表示的漢語信息)
[0054]a)查預先儲存在計算機系統中的標註單詞詞性的漢語詞典建立單詞詞性串:(句中括號內的部分是詞性,以下均同)
[0055]wovmno(人稱代詞 I)+mwvtisa(時間名詞 l)+xrvydu(動詞 I)+laadqawnv(名詞2).我們(人稱代詞I) +每天(時間名詞I)+使用(動詞I)+拉丁文(名詞2)。
[0056]b)根據上面得到的句子詞性串查預先儲存在計算機系統中的表得到預先儲存在表中的漢語句型:
[0057](詞性和該詞所作的句子成分串組成句型,以下均同)
[0058]wovmno (人稱代詞I作主語)+mwvtisa (時間名詞I作時間狀語)+xrvydu (動詞I作謂語)+laadqawnv (名詞2作賓語)
[0059]我們(人稱代詞I作主語)+每天(時間名詞I作時間狀語)+使用(動詞I作謂語)+拉丁文(名詞2作賓語)
[0060]c)根據上面得到的漢語句型查表得到預先儲存在表中的對應的英語句型:
[0061 ] wovmno (人稱代詞I作主語)+xrvydu (動詞I作謂語)+laadqawnv (名詞2作賓語)+mwvtisa(時間名詞I作時間狀語)
[0062]我們(人稱代詞I作主語)+使用(動詞I作謂語)+拉丁文(名詞2作賓語)
[0063]+每天(時間名詞I作時間狀語)
[0064]此時查預先儲存在計算機系統中的漢英詞庫進行單詞或詞組意思的轉換,並按此句型順序輸出便完成漢語翻譯成英語的轉換,為了表明此機器翻譯過程的可雙向性,我們再作下面進一步的變換:[0065]d)根據上面得到英語句型查表得到預先儲存在表中的與對應的英語單詞或詞組詞性相一致的詞性串:(該詞性串也可從得到的目標語言句型中提取得到,以下均同)
[0066]wovmno (人稱代詞 l)+xrvydu(動詞 I)+laadqawnv(名詞 2)+mwvtisa(時間名詞I).[0067]我們(人稱代詞I) +使用(動詞I) +拉丁文(名詞2) +每天(時間名詞I)。
[0068]e)查預先儲存在計算機系統中的漢英詞庫進行單詞或詞組意思的轉換並按上面所得到的英語句型的順序輸出:
[0069]we(人稱代詞 I) use(動詞 I) Iatin(名詞 2) every day(時間名詞 I).[0070]weuseIatinevery day.[0071 ] 這樣便完成了漢語翻譯成英語的轉換。
[0072]最後再通過調用英文語音合成模塊,將轉化得到的英文句子
[0073]We use Iati nevery day.[0074]轉化成英語語音通過揚聲器或耳麥或聽筒輸出,同時在顯示屏上也可以輸出該句句子We use latin every day.這樣就完成了漢語語音到英語語音和字幕的轉換。
[0075]同理我們可以完成從英語語音到漢語語音和漢語語音碼的字幕轉換,比如,我們對本技術方案的通訊設備朗讀一句英語句子:
[0076]We use latin every day.[0077]首先調用英語語音識別模塊,我們得到下面的英文句子:
[0078]We use latin every day.[0079]然後調用漢語英語雙向翻譯模塊我們得到以下翻譯步驟和結果:
[0080]1.「we use latin every day.」(我們通過英語語音識別得到的英語句子)
[0081]c)查預先儲存在計算機系統中的標註單詞或詞組詞性的英語詞典建立單詞或詞組的詞性串:
[0082]we (人稱代詞 I)+use (動詞 I)+Iatin (名詞 I) +every day (時間名詞 2).[0083]d)根據上面得到的句子詞性串查表得到預先儲存在表中的英語句型:
[0084]we (人稱代詞I作主語)+use(動詞I作謂語)+Iatin (名詞I作賓語)+everyday (時間名詞2作時間狀語)
[0085]e)根據上面得到英語句型查表得到預先儲存在表中的對應的漢語句型:
[0086]we (人稱代詞I作主語)+every day (時間名詞2作時間狀語)+use (動詞I作謂語)+Iatin (名詞I作賓語)
[0087]此時查預先儲存在計算機系統中的漢英-英漢雙向詞庫進行單詞或詞組意思的轉換,並按此句型順序輸出便完成英語翻譯成漢語的轉換,為了表明此機器翻譯過程的可雙向性,我們再作下面進一步的變換:
[0088]f)根據上面得到漢語句型查表得到預先儲存在表中的與對應的漢語單詞或詞組詞性相一致的詞性串:
[0089]we (人稱代詞 I) +every day (時間名詞 2)+use (動詞 I)+Iatin (名詞 I)
[0090]g)查預先儲存在計算機系統中的漢英-英漢雙向詞典進行單詞或詞組意思的轉換並按上面所得到的漢語句型的順序輸出:
[0091]wovmno (人稱代詞 l)+mwvtisa(時間名詞 2)+xrvydu(動詞 I)+laadqawnv(名詞I).[0092]最後我們得到:
[0093]wovmno mwvtisa xrvydu laadqawnv.(漢語語音碼錶不的漢語信息)
[0094]這樣我們重複漢語譯英語的過程就又得到了我們剛才交給系統翻譯成英語的漢語句子,說明了該機器翻譯方法具有雙向可逆性。同理,也可以用上面的方法對複句進行雙向翻譯,這裡就不再累述.[0095]三.最後將上述翻譯成的指定的外文,通過儲存在該通訊設備儲存晶片中的語音合成模塊合成成相應的外語語音並傳輸給傳統通訊設備語音編碼壓縮模塊進行語音編碼壓縮處理,處理後再傳輸給傳統通訊設備的無線發射傳輸模塊,通過該無線發射傳輸模塊將翻譯成的指定外語語音信號通過無線移動公網或無線移動專網傳輸給指定號碼的通訊設備,具體由以下步驟完成:
[0096]仍以下的漢語語音碼組成的句子為例:
[0097]wovmno mwvtisa xrvydu laadqawnv.[0098]其意義用漢字表達為:
[0099]「我們每天使用拉丁文。」
[0100]在對漢語語音碼錶達的漢語信息進行漢語語音合成時,一般根據需要可以採用以下三種方法之一:
[0101]1.通過查漢語語音碼與音節漢語語音合成文件對照表進行語音合成的方法:
[0102]查預先儲存在計算機系統中的漢語語音碼與音節漢語語音合成文件對照表後得到與語音碼對應的漢語語音的聲音文件(為表述方便該聲音文件用「相對應的音節漢語拼音.wav」表示,實際情況中是沒有漢語拼音符號的,它只是預先儲存在計算機系統中,可以通過一定的聲音播放軟體播放的表示相應音節漢語語音的聲音文件。
[0103]wov (w0.wav) mno (men.wav) mwv (me1.wav) t isa (t ian.wav) xrv (sh1.wav)ydu (yong.wav) Iaa (la.wav) dqa (dlng.wav) wnv (wen.wav).[0104]對查找到的代表該音節漢語語音的相應的聲音文件用聲音播放軟體依次順序播出,詞與詞之間採用比同一單詞音節之間更長的時間間隔來依次連續播出,這樣會聽起來更接近按詞 朗讀的效果,更符合人們聽語音的習慣。
[0105]2.通過查漢語單詞語音碼和單詞漢語語音合成文件對照表進行語音合成的方法:
[0106]查預先儲存在計算機系統中的漢語單詞語音碼和單詞語音合成文件對照表後得到預先儲存在計算機系統中的與單詞語音碼對應的以單詞為單位的漢語語音的聲音文件(為表述方便該以單詞為單位的漢語聲音文件用「相對應的以單詞為單位的漢語拼音.wav」表示,實際情況是沒有漢語拼音符號的,它只是預先儲存在計算機系統中,可以通過一定的聲音播放軟體播放的表示相應以單詞為單位的漢語語音的聲音文件)
[0107]wovmno (women, wav) mwvt i sa (me i t i ?η.wav) xrvydu (shi yong.wav)laadqawnv(lad!ngwen.wav).[0108]對查找到的以單詞為單位代表該漢語語音的相應的聲音文件用聲音播放軟體依次順序播出,詞與詞之間採用比同一單詞音節之間更長的時間間隔來依次連續播出,這樣會聽起來更接近按詞朗讀的效果,更符合人們聽語音的習慣。[0109]3.通過查漢語語音碼串和最大匹配語段漢語語音合成文件對照表進行語音合成的方法:
[0110]該方法採用最大匹配法,通過查預先儲存在計算機系統中的以最大語段為單位的漢語語音碼串和語段漢語語音合成文件對照表輸出相應的漢語語音。比如通過查預先儲存在計算機系統中的最大語段為:「wovmno mwvtisa xrvydu我們每天使用」和^hsuyyvlaadqawnv漢語拉丁文」那麼漢語語音合成按下面的方式進行:
[0111]W ο V m η ο mwvtisa xrvydu (womenmeitianshi yong.wav)hsuyyvlaadqawnv(hanyuladlngwen.wav).[0112](為表述方便上述該以語段為單位的漢語聲音文件用「相對應的以該語段為單位的漢語拼音.wav」表示,實際情況是沒有漢語拼音符號的,它只是預先儲存在計算機系統中,可以通過一定的聲音播放軟體播放的表示相應以該語段為單位的漢語語音的聲音文件)
[0113]在上述三種語音合成方法中第一種方法所需要的計算機系統語音文件儲存空間最小,第三種所需要的計算機系統語音文件儲存空間最大。
[0114]有時為了校對的方便,我們需要將漢語語音碼中的標點符號和移行號朗讀出來,這就要對漢語語音碼中的標點符號和移行號進行語音合成,為了使得漢語語音碼所表達的漢語信息與ASCII碼100%兼容,這裡我們特別規定漢語語音碼中的標點符號和移行號分別與英文的標點符號和移行號相同,在具體語音合成時我們只要將相應的預先儲存在計算機系統中的標點符號和移行號的聲音文件提取出來,用聲音播放軟體進行播放便可,t匕如:
[0115]六種點號:句號」 (jiihdi0.wav)、問號「? 」 (wSnhdi0.wav)、感嘆號「 ! 」
[0116](gantanha0.wav) >· 逗號「,」 (d6uhdi0.wav)、冒號 「:」(mdiohdi0.wav)、分號「 ;」 (fenha0.wav)。
[0117]七種標號:引號「」(yinhdi0.wav)、括號 O (ku6hdi0.wav)、破折號 (pozheha0.wav)、省略號…(shenglueha0.wav) > 著重號.(zhu0zh6nghdi0.wav)、書名號()(shHmi nghdi0.wav)、間隔號.(jiangeha0.wav)。
[0118]一個移行號:移行號 (yi hangha0.wav) ?
[0119]上面列出了本發明所採用的與英語相同的六種點號、七種標號和一個移行號,括號中的wav」文件就是與標點符號或移行號發音相應的語音合成文件,當該語音合成文件是漢語的語音合成文件時,則該標點符號或移行號朗讀出來的聲音便是漢語相應的標點符號或移行號的聲音。
[0120]將以上得到的漢語語音傳輸給傳統通訊設備語音編碼壓縮模塊進行語音編碼壓縮處理,處理後再傳輸給傳統通訊設備的無線發射傳輸模塊,通過該無線發射傳輸模塊將翻譯成的指定外語語音信號通過無線移動公網或無線移動專網傳輸給指定號碼的通訊設備,這樣就完成了外語語音通過無線移動通訊設備直接轉換成漢語語音並通過無線公網或專網傳給指定號碼的另一臺無線移動通訊設備。
[0121]四.得到漢語語音碼後,漢語語音碼需要時可以通過漢字轉換模塊轉換成漢字,漢語語音碼或漢字能夠單獨或者漢語語音碼與漢字、漢語拼音,意義一致的外文對照屏幕顯示或儲存在該通訊設備中,此時整個系統必須運行在漢字系統的計算機中。[0122]通過調用漢語語音碼漢字雙向轉換模塊計算機通過以下步驟將漢語語音碼轉換成漢字:
[0123]通過分別查找漢語語音碼與以詞為單位的漢字和漢語拼音對照表可以方便地將漢語語音碼轉換成漢字和漢語拼音,比如:
[0124]wovmno通過查聲碼、介碼、韻碼、調碼和漢語拼音對照表或根據該對照表生成的漢語語音碼音節或單詞和拼音音節或單詞對照表得到w0men,再通過w0men查找到以詞為單位的漢字,當以單詞為單位的語音碼通過以單詞為單位的漢語拼音與以單詞為單位的漢字建立對應關係後,一旦需要以單詞為單位的語音碼可以不再需要通過以單詞為單位的漢語拼音,直接與以單詞為單位的漢字建立對應關係並實行相應的轉換。比如=Wovmno可以轉換為wdmen,再通過wdmen可以轉換成「我們」,這樣wovmno和「我們」便直接建立了對應關係,需要時可以不通過漢語拼音wdmen進行轉換,而直接在wovmno和「我們」之間實現雙向可逆轉換。
[0125]遇同音詞時,可以依據漢語詞法句法上下文聯繫及統計規律等手段進行判別後進行以詞為單位的漢字選定。比如:ysvlune上裝滿了郵包。ysvlune上裝滿了原油。結合上下文的聯繫可以知道:前面一句中的「ysvlune」代表郵輪,後面一句中的「ysvlune」代表油輪,這兩句話分別會轉換成「郵輪上裝滿了郵包」和「油輪上裝滿了原油」。對其它單詞情況也依次類推。[0126]上述雙向可逆轉換的結果既可以單獨顯示也可以對照顯示,比如:
[0127]原句:「我們每天使用漢語拉丁文。」用本發明方法計算機可以可逆地轉換為以下幾種形式:
[0128]1.1iWomen meitianshiyongladlngwerio
[0129]2.「wovmno mwvtisa xrvydu laadqawnv.」
[0130]3.1iWomen meitian shi yong IadIngwen0 ^
[0131]我們每天使用拉丁文。
[0132]4.「wovmno mwvtisa xrvydu laadqawnv.」
[0133]我們每天使用拉丁文。
[0134]5.1iWomenmeitianshiyong IadIngwen0
[0135]「wovmno mwvtisa xrvydu laadqawnv.」
[0136]為了讓外國人或中國少數民族更方面地了解漢語的含義和學習漢語,也可以在每個對照的單詞中插入相應的外語單詞或少數民族文字,比如在下面的單詞中加入相應的英語單詞作中文意思的註解:
[0137]「wovmno Women mwvtisa meitian xrvydu shi yong laadqawnv ladlngwen。,,
[0138]我們 We每天 every day 使用 use拉丁文 Latine。
[0139]依次類推,用上述方法,無線通訊設備對漢語語音和英語語音及其對應字幕實現雙向可逆轉換和無線傳輸,依次類推,用上述方法,我們還可以實現漢語對其它外語,一種外語對另一種外語的雙向可逆語音及其對應字幕的轉換和無線傳輸,這裡就不一一累述。
[0140]在必要時上述用於語音合成的字符信息連同合成的語音可以通過傳統無線通訊設備的無線發射傳輸模塊,以傳統無線通訊設備簡訊和傳輸語音的發送形式傳輸給指定號碼的無線通訊設備,這樣通過該無線移動通訊設備實現了漢語與外語雙向實時語音翻譯功能,解決了所要解決的技術問題,達到了本發明想要達到的發明目的。
【權利要求】
1.一種漢語與外語雙向實時語音翻譯無線移動通訊設備,其特徵是:該通訊設備在將漢語語音轉變成外語語音時,首先將受話器接受到的漢語語音,通過儲存在該通訊設備儲存晶片中的漢語語音識別模塊,將漢語語音識識別成用26個拉丁字母表示的漢語語音碼,再通過儲存在該通訊設備儲存晶片中的機器翻譯模塊將上述漢語語音碼翻譯成用26個拉丁字母表示的指定的外文.最後將上述翻譯成的指定的外文,通過儲存在該通訊設備儲存晶片中的語音合成模塊合成成相應的外語語音並傳輸給傳統通訊設備語音編碼壓縮模塊進行語音編碼壓縮處理,處理後再傳輸給傳統通訊設備的無線發射傳輸模塊,通過該無線發射傳輸模塊將翻譯成的指定外語語音信號通過無線移動公網或無線移動專網傳輸給指定號碼的通訊設備; 在將外語語音轉變成漢語語音時,首先將受話器接受到的外語語音,通過儲存在該通訊設備儲存晶片中的外語語音識別模塊,將外語語音識別成用26個拉丁字母表示的外文,再通過儲存在該通訊設備儲存晶片中的機器翻譯模塊將上述外文翻譯成漢語語音碼,最後將上述翻譯成的漢語語音碼,通過儲存在該通訊設備儲存晶片中的漢語語音合成模塊合成成相應的漢語語音並傳輸給傳統通訊設備語音編碼壓縮模塊進行語音編碼壓縮處理,處理後再傳輸給傳統通訊設備的無線發射傳輸模塊,通過該無線發射傳輸模塊將翻譯成的漢語語音信號通過無線移動公網或無線移動專網傳輸給指定號碼的通訊設備; 必要時上述用於語音合成的字符信息連同合成的語音可以通過傳統無線通訊設備的無線發射傳輸模塊,以傳統無線通訊設備簡訊和傳輸語音的發送形式傳輸給指定號碼的無線通訊設備。
2.如權利要求1所述的一種漢語與外語雙向實時語音翻譯無線移動通訊設備,其特徵是:所述的漢語語音碼是以單詞為單位,這裡將單個漢字看作單音節詞,根據組成該單詞的每個音節的《漢語拼音方案》中的拼音,用且僅用26個拉丁字母對漢語拼音的聲母、介母、韻母、聲調採取先編碼再依次按「聲碼+介碼+韻碼+調碼兼隔音節符號」的順序編碼拼寫,並通過得到的語音碼的編碼直接表達漢語信息,當直接用語音碼編碼來表示漢語信息時,其標點符號的用法同英文的標點符號的用法相同,編碼時同一個單詞的多個音節不用空格連續編碼,單詞與單詞之間要有空·格隔開。
3.如權利要求1或2所述的一種漢語與外語雙向實時語音翻譯無線移動通訊設備,其特徵是:所述的漢語語音碼是聲母全部用輔音拉丁字母表示,用於表示漢語信息的語音碼的聲母除了(zh)、(ch)、(sh)的聲母分別用j、q、X三個輔音拉丁字母表示外,其餘的聲母用與漢語拼音相同符號的輔音拉丁字母表示。
4.如權利要求1或2所述的一種漢語與外語雙向實時語音翻譯無線移動通訊設備,其特徵是:漢語拼音的(zhi)、(chi)、(shi)分別用語音碼的jr、qr、xr表示;漢語拼音的(er)用語音碼的er來表示,er鍵盤輸入時按E和R兩個鍵位輸入。
5.如權利要求1或2所述的一種漢語與外語雙向實時語音翻譯無線移動通訊設備,其特徵是:所述的漢語語音碼用26個字母中的一個字母表示原來漢語拼音單韻母和介母中的(U),其餘單韻母和介母的編碼採用與漢語拼音單韻母和介母相同的符號。
6.如權利要求1或2所述的一種漢語與外語雙向實時語音翻譯無線移動通訊設備,其特徵是:所述的漢語語音碼用I來表示原來漢語拼音單韻母和介母中的(U)。
7.如權利要求1或2所述的一種漢語與外語雙向實時語音翻譯無線移動通訊設備,其特徵是:所述的漢語語音碼除了部分帶有介母的複合韻母外,其餘的複合韻母的韻碼用輔音字母表不。
8.如權利要求7所述的一種漢語與外語雙向實時語音翻譯無線移動通訊設備其特徵是:所述的漢語語音碼用拉丁字母k、c、s、x、w、n、z、l、b、d、p、q、g(無聲母韻母)分別表示漢語拼音的(ao)、(ai)、(an)、(ou)、(ei)、(en)、(ua)、(uo)、(ang)、(ong)、(eng)、(ing)、(ng)。
9.如權利要求1或2所述的一種漢語與外語雙向實時語音翻譯無線移動通訊設備,其特徵是:所述的漢語語音碼其調碼用四個元音字母和一個漢語不用的字母V表示,用拉丁字母a、e、V、U、ο分別表示漢語拼音的陰平(_)、陽平e: (/)、上聲V: ( V )、去聲u: (\)、輕聲ο (不標)。
10.如權利要求1或2所述的一種漢語與外語雙向實時語音翻譯無線移動通訊設備,其特徵是:所述的漢語語音碼需要時可以通過漢字轉換模塊轉換成漢字,漢語語音碼或漢字能夠單獨或者漢語語音碼與漢字、漢語拼音,意義一致的外文對照屏幕顯示或儲存在該通訊設備中。·
【文檔編號】G10L15/30GK103854647SQ201210495133
【公開日】2014年6月11日 申請日期:2012年11月28日 優先權日:2012年11月28日
【發明者】苗玉水 申請人:上海能感物聯網有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀