新四季網

構建多語言音標資料庫的方法、多語言注音的方法及裝置製造方法

2023-09-12 15:34:25 2

構建多語言音標資料庫的方法、多語言注音的方法及裝置製造方法
【專利摘要】本發明公開了一種構建多語言音標資料庫的方法,多語言注音方法及多語言語音合成裝置,多語言注音的方法(國際拼音-GP)包括:根據漢語拼音聲韻調理論構建基礎音標資料庫;獲取漢語以外的至少一種外語的標準發音的音節;針對所述外語的每一個音節,識別出該音節的元音/輔音/聲調;對於識別出的每一個元音/輔音,若其與基礎音標資料庫中的漢語拼音的發音相同,則確定其音標為共用音標;若其與基礎音標資料庫中的任一漢語拼音的發音均不同,則確定其音標為非共用音標;將共用音標採用與其發音相同的漢語拼音進行替代,並將非共用音標以預設方式加入基礎音標資料庫中,以形成擴展音標資料庫,利用擴展音標資料庫對所述外語進行注音。
【專利說明】構建多語言音標資料庫的方法、多語言注音的方法及裝置

【技術領域】
[0001] 本發明涉及語音處理領域,具體而言,涉及一種基於漢語拼音構建多語言音標數 據庫的方法、一種多語言注音方法和一種多語言語音合成裝置。

【背景技術】
[0002] 語言學習一直是一個重要的領域,通常,學習者受到語言環境的影響,學習語言環 境相關的語言比較快,如母語。但,當語言環境無法有效的幫助學習者學習語言的時候,則 會導致學習者無法有效的認知和讀出某一種語言中的詞語、或者字。
[0003] 應對於對詞語或者字的朗讀問題,大部分語言配置了相應的音標,來幫助學習者 來認讀字和詞。音標如英文音標,中文拼音等。隨著需要學習的語言增加,學習者需要針對 每一種語言單獨的學習一種與該語言相對應的音標,並且,雖然每種語言是不同,但每種語 言發音的基礎單元(音標,或拼音)卻有著部分相似的特徵,也就是不同語言的音標符號相 同,但發音不同;或者是不同語言的音標發音相同,但符號不同。這樣,會導致學習者在進行 音標的認讀時造成混淆,大大降低學習效率和學習的準確性。如漢字中,拼音的聲母和韻母 有一些是與英文音標中的元音音標,或輔音音標的發音是相同的,但其表達方式卻是不相 同的。而且,當待學習的語言增加時,符號相同,發音不同和發音相同,符號不同的音標會越 來越多,這樣會加大學習者的學習難度。
[0004] 綜上所述,現有的每種語言的音標沒有相通性,無法在學習一種語言音標的基礎 上,在學習另一種語言的音標。


【發明內容】

[0005] 本發明的目的在於提供一種基於漢語拼音構建多語言音標資料庫的方法、一種多 語言注音方法和一種多語言語音合成裝置,以解決上述的問題。
[0006] 在本發明的實施例中提供了一種基於漢語拼音構建多語言音標資料庫的方法,包 括:
[0007] 根據漢語拼音構建基礎音標資料庫;
[0008] 獲取漢語以外的至少一種外語的標準發音的音節;
[0009] 針對外語的每一個音節,識別出該音節的每一個元音和輔音;
[0010] 對於識別出的每一個元音或輔音,若其與基礎音標資料庫中的漢語拼音的發音相 同,則確定其音標為共用音標;若其與基礎音標資料庫中的任一漢語拼音的發音均不同,貝 1J 確定其音標為非共用音標;
[0011] 將共用音標採用與其發音相同的漢語拼音進行替代,並將非共用音標進行預設處 理後加入基礎音標資料庫中,以形成擴展音標資料庫。
[0012] 優選的,包括:將非共用音標進行預設處理後加入基礎音標資料庫中,包括:
[0013] 對於每個非共用音標,判斷其發音與基礎音標資料庫中的漢語拼音的發音的相似 度是否滿足預設條件,若是,則將其替代為發音相似度滿足預設條件的漢語拼音;否則,直 接將其加入基礎音標資料庫中。
[0014] 本發明實施例還提供了一種多語言注音方法,包括基於漢語拼音構建多語言音標 資料庫的方法,還包括:
[0015] 利用擴展音標資料庫對外語進行注音。
[0016] 優選的,利用擴展音標資料庫對外語進行注音,包括:
[0017] 獲取外語的待注音單元;其中,待注音單元為待注音的單詞或句子;
[0018] 針對待注音單元的每個音節,從擴展音標資料庫中查找其音標,並確定其聲調;
[0019] 根據待注音單元的每個音節的音標及聲調,對待注音單元進行注音。
[0020] 優選的,聲調包括基本聲調和合成聲調,基本聲調包括:高調、低調、升調和降調, 合成聲調包括基本聲調合成的聲調;其中,高調對應漢語拼音中的一聲,低調對應漢語拼音 中的輕聲,升調對應漢語拼音中的二聲,降調對應漢語拼音中的四聲。
[0021] 優選的,利用擴展音標資料庫對外語進行注音,包括:
[0022] 按照漢語拼音的聲韻調順序對外語進行注音。
[0023] 優選的,至少一種外語包括英語;
[0024] 利用擴展音標資料庫對英語和德語進行注音,包括:
[0025] 將待注音的英語,德語單元中的重音轉化為高調或降調,輕音轉化為低調。
[0026] 優選的,利用擴展音標資料庫對外語進行注音,包括:
[0027] 根據擴展音標資料庫中的輔音音標,生成待注音單元的輔音音標或輔音串音標。
[0028] 本發明實施例另提供了一種多語言語音合成裝置,包括:採用基於漢語拼音構建 多語言音標資料庫的方法所構建的擴展音標資料庫,還包括:
[0029] 構建模塊,用於針對漢語及至少一種外語的每個音節,根據擴展音標資料庫確定 其音標,根據音節的音標和聲調,形成帶調音節,針對每一個帶調音節,採集相應的標準發 音以形成語音資料庫,語音資料庫是針對每個帶調音節的,可能的組合包括帶調的單個元 音;帶調的單個輔音;帶調的輔音元音組合;
[0030] 查詢模塊,用於獲取待合成的多語言單元的每個音節,並查詢語音資料庫以獲取 該音節的語音;其中多語言單元包括以下中的一種或多種:漢語、至少一種外語;
[0031] 播放模塊,用於將獲取的多語言單元的語音進行播放。
[0032] 優選的,標準發音為音節的音標和聲調組合的發音。
[0033] 本發明提供的技術方案,基於漢語拼音構建多語言音標資料庫,以實現多語音的 注音及合成。本發明的技術方法,基於同一資料庫對多語言進行注音,能夠提高多語言注音 的效率,也就能夠相應提高多語言語音合成的效率;另外,採用漢語拼音的聲韻調順序對多 語言進行注音,還能夠提高多語言注音的靈活性和準確性,不僅利於國人學習外語,還能進 一步使漢語拼音方式得到推廣。

【專利附圖】

【附圖說明】
[0034]圖1示出了本發明實施例的一種基於漢語拼音構建多語言音標資料庫的流程圖;
[0035] 圖2示出了本發明實施例的一種多語言注音方法的流程圖;
[0036] 圖3示出了採用本發明的多語言注音方法進行注音的示意圖;
[0037] 圖4示出了本發明實施例的一種多語言語音合成裝置流程圖。

【具體實施方式】
[0038]下面通過具體的實施例子並結合附圖對本發明做進一步的詳細描述。
[0039] 國人常用的語言是漢語,但隨著中國與其他國家溝通的增加,使用其他國家的語 言進行交流的機會也明顯增加了,進而需要加快學習其他種類語言(如英語、日語等)的效 率。學習外語時,首先需要學習對應的音標。但各種語言的音標基本沒有相同的(指音標 的符號形式),雖然音標有差別,不同種類的語言音標的發音與漢語拼音的發音還是比較相 似的,至少每種語言的全部音標中,有一部分音標與漢語拼音的發音是相類似的。那麼在學 習新語言的音標時,或者是對新語言的字詞通過音標進行注音的時候,可以使用發音相同 或相似的漢語拼音來進行注音,這樣對新語言的注音就是由漢語拼音所構成。需要說明的 是,任何一門新語言都存在與漢語拼音的發音不同的音標,即非共用的音標,這需要學習者 單獨進行學習,而通常非公用的音標的數量比較少,因此,本發明考慮基於漢語拼音建立基 礎音標資料庫,在此基礎上加入新語言的音標以實現資料庫的擴展,依靠擴展後的資料庫 對漢語及其他語言進行注音。
[0040] 本發明實施例1提供了一種基於漢語拼音構建多語言音標資料庫的方法,如圖1 所示,包括如下步驟S101-S105 :
[0041] S101 :根據漢語拼音構建基礎音標資料庫。
[0042] 步驟S101中,構建基礎音標的資料庫可以包括漢語拼音的全部聲母和韻母和四 種聲調,在此基礎上還可以包括聲母和韻母組合所形成的音標。
[0043] S102 :獲取漢語以外的至少一種外語的標準發音的音節。
[0044] S103 :針對外語的每一個音節,識別出該音節的每一個元音和輔音;
[0045]音節是很多國外語言發音的基本單位,外語的音節包括元音和輔音,部分元音和 輔音與漢語的聲母和韻母的發音相同,但也有不同的。
[0046]S104:對於識別出的每一個元音或輔音,若其與基礎音標資料庫中的漢語拼音的 發音相同,則確定其音標為共用音標;若其與基礎音標資料庫中的任一漢語拼音的發音均 不同,則確定其音標為非共用音標;
[0047]S105:將共用音標採用與其發音相同的漢語拼音進行替代,並將非共用音標進行 預設處理後加入基礎音標資料庫中,以形成擴展音標資料庫。
[0048] 步驟S102中,獲取漢語以外的至少一種外語的標準發音的音節是指,獲取需要進 行注音的一種或多種外語的音節,如需要進行漢語、英語和法語注音,則步驟S102中需要 獲取英語和法語的每個音節。對於音節來說,漢語中一個漢字一般一個音節,每個音節由聲 母、韻母和聲調三個部分組成;英語中一個元音可構成一個音節,一個元音和一個或幾個輔 音結合也可以構成一個音節。步驟102中需要獲取的這些外語的全部音節。
[0049] 步驟S104中,如果步驟S103所確定的元音或輔音與基礎音標資料庫中的漢語拼 音的發音相同,則可以使用相應的漢語拼音的音標來替代該元音或輔音的音標。如英語中 的/9U/與漢語拼音中的[0u]發音相同,貝 1J可以使用[0u]替代/su/。
[0050] 進一步的,同一種發音,在不同種類的語言中的表現形式是通過不同的元音、輔 音、聲母或韻母的符號來體現的。也就是在每種語言中可能存在不同的音標對應的是同一 種發音,由此,可以通過發音是否相同來確定是否可以使用漢語拼音來替代外語的元音或 輔音的符號。
[0051] 當然,其他語言中除了有與漢語拼音發音相同的元音或輔音,還有與漢語拼音中 發音不同的元音或輔音,這些不同的元音或輔音則是非共用音標。漢語拼音中的聲母和韻 母的發音並不一定與兀音或輔音的發音能夠 對應上,還可以是多個聲母和韻母的組合 能夠與一個元音或輔音對應上,那麼在對發音進行辨識的時候,還應考慮到是否需要將聲 母韻母的組合拼音與一個元音或輔音進行對應,以減少非共用音標的數量。
[0052] 步驟S105中,需要將公用音標採用相應的漢語拼音進行替代,非公用音標以預設 的方式加入基礎音標資料庫中,以使擴展後的音標資料庫中能夠查詢到新語言的全部音 標,進而形成擴展音標資料庫。具體的,預設方式是基於彈性註標或非彈性註標所採用的方 式,彈性註標即將非共用音標採用與其發音相近的音標替代,如英語中的/ 0 /與漢語中的 [s],發音雖然不同,但非常的相似,則可以採用漢語中的[s ;]替代英語中的/ 0/,彈性注 標判斷發音的相似程度可以採用人工判斷,也可以採用語音識別機器進行判斷。
[0053] 彈性註標的方式中,非公用音標以預設的方式加入基礎音標資料庫中即:判斷非 共用音標的發音與基礎音標資料庫中的漢語拼音的發音的相似度是否達到一定程度,若 是,則將其替代為發音相似度滿足所述預設條件的漢語拼音;否則,直接將其加入所述基礎 音標資料庫中。漢語拼音的發音和外語音標的發音可能存在不完全相同的情況,但只要二 者的差別在合理的範圍內(如不仔細聽無法分別,在拼讀的時候,容易忽略掉差別),那麼 便可以使用發音相似的漢語拼音來替代該音標。這樣,便可以進一步在合理的範圍內減少 非公用音標的數量,也就使學習新語言的人可以更少的學習新語言的音標,從而簡化學習 過程,也可以進一步簡化多語言語音合成器的設計。在非彈性註標的方式中,則是將所有的 非共用音標都直接加入基礎音標資料庫中。
[0054] 將非共用音標加入基礎音標資料庫中後就形成了擴展音標資料庫,利用該擴展音 標資料庫,就能對上述的多種語言進行準音。
[0055] 根據該擴展音標資料庫對外語進行注音後,大部分的音標是熟知漢語的人員所認 識的,只有少部分非共用音標需要進行學習,從而在學習一種新語言的時候,可以降低需要 學習的音標的數量,提高學習效率。另一方面,還可以降低對外語注音的複雜程度,如只需 要通過少量的音標便能夠完成對多種語言進行注音,在採用上述步驟S101-步驟S105將所 有的國際語言的音標都加入擴展音標資料庫後,就可以對全部國際語言採用漢語拼音的方 式進行注音,因此,基於上述擴展音標資料庫進行注音的方式可以作為國際拼音使用,使用 國際拼音一方面能夠提高外語學習效率,另一方面還能減少多語言的注音難度,且能夠使 得漢語拼音的注音方式得到國際性的推廣。
[0056] 本發明實施例所提供的基於漢語拼音構建多語言音標資料庫的方法,通過對新語 言的每個音節的元音和輔音的發音進行辨別,區分出與基礎音標資料庫中的漢語拼音中發 音相同和發音不同的音標,以確定公用音標和非共用音標,並且將非公用音標以預設方式 加入到基礎音標資料庫中,從而擴展了注音的語言種類,且能夠降低學習新語言的難度和 提高新語言學習的效率,並且使相應的注音設備的設計簡化,解決了現有技術中的不足。
[0057] 基於上述方法構建了多種語言的擴展音標資料庫,就能夠利用該擴展音標資料庫 對多種語言進行注音。參見圖2所示為本發明實施例提供的一種多語言注音方法的流程 圖,圖3所示為採用該方法進行多語言注音的示意圖。如圖2所示,該方法包括:
[0058] S201,獲取外語的待注音單元;其中,待注音單元為待注音的單詞或句子;
[0059] S202,針對待注音單元的每個音節,從擴展音標資料庫中查找其音標,並確定其聲 調;
[0060] S203,根據待注音單元的每個音節的音標及聲調,對待注音單元進行注音。
[0061] 步驟S202中,需要在擴展音標資料庫中查找對應的音標,漢語的注音在此不多做 解釋,對於漢語以外的,且其音標已加入音標資料庫的新語言,在對該新語言的單詞或句子 進行注音時,先識別每個其中的每個音節,並在擴展音標資料庫中查找每個音節的音標,由 於擴展資料庫已經錄入該新語言的全部音標,所以從該擴展音標資料庫能夠查到該新語言 的單詞或句子的音節的音標。
[0062] 此外,還需要確定待注音的單詞或句子的聲調,並按照漢語拼音的聲韻調順序對 所述外語進行注音。國際拼音中有四種聲調,高低升降,而英語或其他部分語種是只區分 重音,不區分聲調的,這會對認知某種語言的音標造成一定的困難,由此,還需要確定音節 的聲調。具體的聲調可以分為四種,如高調(漢語中的1聲),低調(漢語中的輕聲),升調 (漢語中的2聲),降調(漢語中的4聲)。
[0063] 具體的,聲調包括基本聲調和合成聲調,基本聲調包括:高調、低調、升調和降調, 合成聲調包括基本聲調合成的聲調;其中,高調對應漢語拼音中的一聲,低調對應漢語拼音 中的輕聲,升調對應對應漢語拼音中的二聲,降調對應漢語拼音中的四聲;低調和升調的合 成的聲調,相當於漢語拼音中的三聲。
[0064] 其中,在進行注音時,低調可進行省略,其他聲調不進行省略。
[0065] 步驟S203中,需要根據步驟S202所獲取到的音標和聲調對每個待注音單元進行 注音。對於輔音串,在注音時可以使用相應的輔音串音標進行注音。
[0066] 進一步,利用擴展音標資料庫對外語進行注音,包括:
[0067] 按照漢語拼音的聲韻調順序對外語進行注音。
[0068] 英語是現在社會中學習範圍最廣泛的一種語言,由此,至少一種外語包括英語;
[0069] 利用擴展音標資料庫對英語進行注音,包括:
[0070] 將待注音的英語單元中的重音轉化為高調或降調,輕音轉化為低調。
[0071] 英語中,音標的重音與漢語中的高調或降調是相同的,英語中的輕音與漢語中的 低調是相同的。
[0072] 進一步,利用擴展音標資料庫對外語進行注音,包括:
[0073] 根據擴展音標資料庫中的輔音音標,生成待注音單元的輔音音標或輔音串音標。
[0074] 實施例2所提供的多語言注音方法還可以細化為如下步驟(當已掌握語言為漢語 時):
[0075] 1,確定待學習語言的類別;
[0076] 2,按照該語言的音節的聽覺效果和發音標準,識別音節的種類和音節數量;
[0077] 3,對每一個音節進行分析,識別發音裡的元音(韻母)和輔音(聲母)和聲調;
[0078] 4,確定這些元音,輔音,哪些是與擴展音標資料庫裡面的元音和輔音是相同的或 者不同的;
[0079] 5,對於與擴展音標資料庫相同的元音,輔音,用擴展音標資料庫裡的符號表達;對 於那些不同的元音,輔音,採用新的的音標表示,並將其加入擴展音標資料庫;
[0080] 6,按照漢語拼音的聲韻調方式進行書寫,允許輔音,輔音串單獨書寫。為了便於輸 機和顯示,只使用26個英文字母和少數符號"," " " "逗號,分號,點號和撇號。例 如desk[dai, 4sk], sk,屬於輔音串;bike[bai4k], k是輔音,可單獨存在;
[0081] 7,重複以上步驟,可是實現對相應語言詞彙注音,並形成建相應語言的單詞音標 資料庫;
[0082] 8,調用資料庫,顯示在學習機,電腦,智能終端上,便於學習。
[0083] 相關技術中,有關語言注音、學習和合成方面主要有兩方面的缺點:
[0084] 1,相關技術中的系統和方法未能與中國現行的漢語拼音系統相結合,各個系統和 方法之間互相獨立,重複浪費資源(學習每種語言的時候,需要對每種語言針對性的進行 學習,各種學習之間不具有相關聯性),致使中國人學習難度大,效率低,浪費資源;目前英 文音標,只標重音,沒有聲調,不利於中國人學習;用到太多的特殊音標,例如$,〇,3 等,不易於輸入計算機,影響人們使用和學習。
[0085] 2,對於語音合成方面,英文系統只針對英文,漢語系統只針對漢語,不能資源共 享,系統資源浪費嚴重;現有的語音合成系統,由於沒有嚴格的精確的音節聲調設計,語音 生硬難懂。
[0086] 本發明所提供的擴展音標資料庫具有如下特點:
[0087] 1,方便中國人學習外語。因為該系統(擴展音標資料庫)和注音方法可以是以漢 語拼音為基礎,漢語拼音在中國是家喻戶曉的,有廣大的用戶和市場。
[0088] 2,如果該方法得到推廣和發揚,將奠定漢語拼音的國際地位,對於外語學習而言, 提供了一個非常有利的學習系統和方法。國際音標產生於1886年,漢語拼音方案產生於 1958,漢語拼音產生較晚,本身就克服了國際音標的很多缺點,國際拼音注音方法和系統是 建立在這個了兩個方案的基礎上,綜合了他們的優點,摒棄他們的缺點,建立的一個新的方 法和系統。
[0089] 3,發展了中國的聲調理論,將聲調理論引入外語學習,使音標所能夠表達的信息 更加完整。
[0090] 本發明實施例3提供了一種多語言語音合成裝置,包括:採用實施例1所提供的基 於漢語拼音構建多語言音標資料庫的方法所構建的擴展音標資料庫,如圖4所示,還包括: [0091] 構建模塊,用於針對漢語及至少一種外語的每個音節,根據擴展音標資料庫確定 其音標,根據音節的音標和聲調,形成帶調音節,針對每一個帶調音節,採集相應的標準發 音以形成語音資料庫。其中,可以將每個音節的語音形式按國際拼音進行語音編碼,以便以 後調用。語音資料庫是針對每個帶調音節的,可能的組合包括帶調的單個元音,例如a的四 種發音,al (高調),a(低調),a2(升調),a4(降調);帶調的單個輔音,例如s的四種發 音,si (高調),s (低調),s2 (升調),s4 (降調);帶調的輔音元音組合,例如sa的四種發 音,sal (高調),sa (低調),sa2 (升調),sa4 (降調)
[0092] 查詢模塊,用於獲取待合成的多語言單元的每個音節,並查詢語音資料庫以獲取 該音節的語音;其中多語言單元包括以下中的一種或多種:漢語、至少一種外語;
[0093] 播放模塊,用於將獲取的多語言單元的語音進行播放。
[0094] 上述的多語言語音合成裝置,實現了多種語言的語音合成,且語言合成是建立使 用者所熟悉的語言(漢語)的基礎上進行的,由此,不僅提高了語音合成的效率,也能夠使 得合成的語言能更接近使用者的要求。
[0095] 本發明所提供的語音合成器具有如下特點:
[0096] 語音合成器(多語言語音合成裝置),由於引進了四種基本聲調,效果好,成本低 廉,性價比高。目前對於一個擁有10萬詞的漢語或者是英文系統而言,至少需要錄音10萬 次,工作量很大;國際拼音語音合成器,只需要錄音1800次,性價比很高,提高了效率。
[0097] 本發明實施例1提供了以漢語拼音所做成的資料庫(國際拼音注音系統的數據 庫)作為基礎音標資料庫,以英語作為待學習的語言,所形成使用漢語拼音替代英語音標 的替代關係。
[0098] 經過本發明所提供的多語言注音方法的相應步驟,使漢語拼音和國際音標(英語 音標)按照如下幾個表格進行替代,其中對於不同學習階段的人群,還可以分為兩種不同 的方案,一是英文音標與漢語拼音不嚴格對應的注音方式,也就是相似的音標米用同一個 聲母,或者韻母來替代,即寬式音標;二是音標與拼音嚴格對應的注音方式,也就是每種音 標只與一種聲母,或者韻母相對應,對發音上有嚴格的區分,即嚴式音標。同時也提供了德 語的音標資料庫。具體音標數據格式如下:
[00"] 聲調(表1)
[0100] 英語輔音,元音替換表和單詞舉例(表2,3, 4,5)
[0101] 德語輔音,元音替換表和單詞舉例(表6和表7)
[0102] 表1-聲調符號
[0103]

【權利要求】
1. 一種基於漢語拼音構建多語言音標資料庫的方法,其特徵在於,包括: 根據漢語拼音構建基礎音標資料庫; 獲取漢語以外的至少一種外語的標準發音的音節; 針對所述外語的每一個音節,識別出該音節的每一個元音和輔音; 對於識別出的每一個所述元音或輔音,若其與所述基礎音標資料庫中的漢語拼音的發 音相同,則確定其音標為共用音標;若其與所述基礎音標資料庫中的任一漢語拼音的發音 均不同,則確定其音標為非共用音標; 將所述共用音標採用與其發音相同的漢語拼音進行替代,並將所述非共用音標以預設 方式加入所述基礎音標資料庫中,以形成擴展音標資料庫。
2. 根據權利要求1所述的方法,其特徵在於,包括:將所述非共用音標以預設方式加入 所述基礎音標資料庫中,包括: 對於每個所述非共用音標,判斷其發音與所述基礎音標資料庫中的漢語拼音的發音的 相似度是否滿足預設條件,若是,則將其替代為發音相似度滿足所述預設條件的漢語拼音; 否則,直接將其加入所述基礎音標資料庫中。
3. -種多語言注音方法,包括如權利要求1-2任一所述的基於漢語拼音構建多語言音 標資料庫的方法,其特徵在於,還包括: 利用所述擴展音標資料庫對所述外語進行注音。
4. 根據權利要求3所述的方法,其特徵在於,利用所述擴展音標資料庫對所述外語進 行注音,包括: 獲取所述外語的待注音單元;其中,所述待注音單元為待注音的單詞或句子; 針對所述待注音單元的每個音節,從所述擴展音標資料庫中查找其音標,並確定其聲 調; 根據所述待注音單元的每個音節的音標及聲調,對所述待注音單元進行注音。
5. 根據權利要求4所述的方法,其特徵在於,所述聲調包括基本聲調和合成聲調,所述 基本聲調包括4種:高調、低調、升調和降調;所述合成聲調包括所述基本聲調合成的聲調; 其中,所述高調對應漢語拼音中的一聲,所述低調對應漢語拼音中的輕聲,所述升調對應漢 語拼音中的二聲,所述降調對應漢語拼音中的四聲。
6. 根據權利要求5所述的方法,其特徵在於,利用所述擴展音標資料庫對所述外語進 行注音,包括: 按照漢語拼音的聲韻調順序對所述外語進行注音。
7. 根據權利要求6所述的方法,其特徵在於,所述至少一種外語包括英語; 利用所述擴展音標資料庫對英語進行注音,包括: 將待注音的英語單元中的重音轉化為高調或降調,輕音轉化為低調。
8. 根據權利要求3所述的方法,其特徵在於,利用所述擴展音標資料庫對所述外語進 行注音,包括: 根據所述擴展音標資料庫中的輔音音標,生成待注音單元的輔音音標或輔音串音標。
9. 一種多語言語音合成裝置,包括:採用如權利要求1-2所述的方法所構建的擴展音 標資料庫,其特徵在於,還包括: 構建模塊,用於針對漢語及所述至少一種外語的每個音節,根據所述擴展音標資料庫 確定其音標,根據所述音節的音標和聲調,形成帶調音節,針對每一個帶調音節,採集相應 的標準發音以形成語音資料庫; 查詢模塊,用於獲取待合成的多語言單元的每個音節,並查詢所述語音資料庫以獲取 該音節的語音;其中所述多語言單元包括以下中的一種或多種:漢語、所述至少一種外語; 播放模塊,用於將獲取的所述多語言單元的語音進行播放。
10.根據權利要求9所述的裝置,其特徵在於,所述標準發音為所述音節的音標和聲調 組合的發音。
【文檔編號】G06F17/30GK104239579SQ201410535621
【公開日】2014年12月24日 申請日期:2014年10月11日 優先權日:2014年10月11日
【發明者】魯冠軍, 馬方旭, 宮宸 申請人:北京千鈺千尋科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀