語音合成裝置、語音合成方法以及gps語音導航系統的製作方法
2023-05-19 06:13:46
專利名稱:語音合成裝置、語音合成方法以及gps語音導航系統的製作方法
技術領域:
本發明涉及一種語音合成技術,特別涉及一種應用於GPS語音導航系統的語音合成裝置以及方法。
背景技術:
GPS導航是使用IT裝備向汽車駕駛員提供地理信息、路徑導航的功能,由於現實中,駕駛者需要關注車輛周圍的複雜交通情況,不能時時去注意電子地圖,於是語音導航成為了GPS導航系統的重要功能之一。
在車載導航領域,語音導航系統有錄音導航系統和語音合成的導航系統兩種。目前的錄音導航系統只能做到簡單的語音內容提示,如″前方100米請往左拐″,若要提示″前方100米請往左拐,進入長安街″則無能為力,這是因為千變萬化的類似路名信息,採用錄音技術是不現實的。隨著語音技術的發展,以語音合成、語音識別、語音編解碼為代表的智能語音技術應用在車載領域,通過車內語音信息服務和車內語音聲控操作,改變了汽車現有的人機信息交流方式,使汽車更具備人性化魅力和個性化特色,提高駕車更安全性。該技術已引起國內外汽車業界的廣泛關注,尤其在美國、歐洲、日本等汽車工業發達國家,都在不斷加大研究和產業化的力度。
此外,現有技術中一般GPS語音導航設備都是基於winCE平臺的,而且採用的語音合成技術均是基於字庫,合成的語音信息沒有語調,與真人發音差距較大。
發明內容本發明的主要目的是提供一種可提供複雜的語音內容提示的GPS語音導航系統。
為實現上述目的,本發明提供一種語音合成裝置,用於GPS語音導航系統中,該GPS語音導航系統還包括與語音合成裝置連接的GPS導航裝置,該語音合成裝置包括基礎資料庫以及語音播放執行模塊,其中,該基礎資料庫進一步包括語音存儲單元,用以儲存道路導航過程中所使用到的以詞段為單位的語音格式道路信息,以及索引存儲單元,存儲至少包含該語音格式道路信息的文本描述、偏移量及數據長度的文本格式道路信息,且該文本格式道路信息與語音格式道路信息為一一對應關係;該語音播放執行模塊進一步包括分析單元,在播放一導航語句之前,先將導航語句拆分為多個語音格式道路信息,並以一預定關鍵詞檢索基本資料庫中的文本格式道路信息,再通過對文本格式道路信息的解析,獲得與之對應的語音格式道路信息;以及播放單元,先將所有以詞段為單位的語音格式道路信息重組形成所述導航語句,再進行播報。
本發明還提供一種語音合成方法,用於GPS語音導航系統中,該GPS語音導航系統包括基礎資料庫、語音合成裝置及GPS導航裝置,該語音合成方法包括下列步驟首先,儲存道路導航過程中所使用到的以詞段為單位的語音格式道路信息;由該語音格式道路信息對應地生成至少包含所述語音格式道路信息的文本描述、偏移量及數據長度的文本格式道路信息;在播放一導航語句之前,先將導航語句拆分為多個語音格式道路信息,並以一預定關鍵詞檢索基本資料庫中的文本格式道路信息;解析檢索到的文本格式道路信息,獲得與之對應的語音格式道路信息;最後,將所述導航語句涉及到的以詞段為單位的語音格式道路信息重組,再進行語音播報。
本發明還提供一種GPS語音導航系統,該GPS語音導航系統採用前述的語音合成裝置合成導航語句,再予以播放。
由於本發明的語音合成裝置、語音合成方法以及GPS語音導航系統是以詞段為基本語音單位,該詞段可為道路名、道路口名、轉向信息、行駛速度或行駛距離等信息,因此可實現更複雜準確的導航服務,此外,由於本發明採用文本格式道路信息與語音格式信息結合的方式,減少了現有技術的導航服務系統在使用中由於系統內部操作造成提高語音提示的速度延遲,進而提高了服務質量。
圖1顯示本發明較佳實施例的語音合成裝置的方框圖;圖2顯示本發明較佳實施例的語音合成裝置中文本格式道路信息與語音格式道路信息的對應關係;以及圖3顯示顯示本發明的語音合成方法的工作流程圖。
實施方式為了更清楚地說明本發明的技術方案以及技術效果,以下結合
本發明的語音合成裝置、語音合成方法以及具有該語音合成裝置的GPS語音導航系統的較佳實施例。
請參閱圖1,其中顯示本發明的較佳實施例的語音合成裝置的方框圖。如圖所示,本發明的語音合成裝置10,用於GPS語音導航系統1中,該GPS語音導航系統1還包括與該語音合成裝置10連接的GPS導航裝置20,該語音合成裝置10包括基礎資料庫100以及語音播放執行模塊110,本實施例中,該GPS語音導航系統1採用基於詞庫的文/本語音合成技術。
該基礎資料庫100進一步包括,語音存儲單元1001,用以儲存道路導航過程中所使用到的以詞段為單位的語音格式道路信息,在本實施例中,該語音格式道路信息為真人發音的wav格式文件,包含了道路導航過程中所用到的一些路名信息、轉向、距離或者行駛速度等,所有的這些語音格式道路信息都存儲在該語音存儲單元1001的數據區data block;以及索引存儲單元1002,存儲至少包含所述語音格式道路信息的文本描述、偏移量及數據長度的文本格式道路信息,在本實施例中,所述文本格式道路信息以記錄為存儲單位,每條記錄包括語音內容的文本描述、偏移量、數據長度(以字節為單位),其中,偏移量是該段語音內容在語音存儲單元中的位置偏移量,數據長度為語音數據長度,語音內容的文本描述作為關鍵字用於索引,而偏移量和數據長度用於定位,且請結合圖2所示,其中顯示該文本格式道路信息與語音格式道路信息的對應關係。更詳細地說,考慮到存儲空間的大小,本實施例中是採用22050Hz和單聲道的採樣格式對道路信息進行採樣錄製,保存在該語音存儲單元1001的數據區data block中,每段語音數據間以4位元組全零間隔開,整個語音存儲單元1001即包含文件頭和數據區,其文件頭的內容參見如下表1。
表1其中,語音數據的存儲格式為先左聲道,後右聲道(0左聲道,1右聲道);先低字節,後高字節。最終錄製完成的語音存儲單元容量為200M左右。
該語音播放執行模塊110進一步包括,分析單元1101,在播放一導航語句之前,先將目標導航語句拆分為多個語音格式道路信息,並以一預定關鍵詞檢索基本資料庫100中的文本格式道路信息,再通過對文本格式道路信息的解析,獲得與之對應的語音格式道路信息,本實施例中,在需要播放目標導航語句時,調用該分析單元1101解析該語音格式道路文件的文件頭信息,此外,當需要擴展或者更新導航區域時,還可以錄製新的語音格式道路信息,在錄製時,調用該分析單元1101生成新的語音格式道路文件的文件頭信息,參照表1所示的文件頭內容可獲得所有與該語音格式道路信息相關的參數;以及播放單元1102,先將所有以詞段為單位的語音格式道路信息重組形成所述導航語句,再進行播報,在本實施例中,由該播放單元1102進行實際的放音操作,它的主要工作有打開音頻設備和基礎資料庫100的語音存儲單元1001,解析文件頭,根據文件頭設置音頻設備的參數(包括通道數、採樣頻率、採樣精度等),並定位到語音存儲單元1001的數據區,循環地讀取數據到內存中,既而將其寫入音頻設備,讀寫完成後關閉音頻設備和基礎資料庫100的語音存儲單元1001;當需要進行錄音操作,主要工作是打開音頻設備和基礎資料庫100的語音存儲單元1001,讀取音頻設備的參數設置並根據這些信息生成語音存儲單元1001的文件頭,從音頻設備讀取音頻數據到內存中,接著將其寫到語音存儲單元1001的數據區中,直到錄音結束為止,關閉音頻設備和基礎資料庫100的語音存儲單元1001。
請參閱圖3,其中顯示本發明的語音合成方法的工作流程圖。以下結合具體實施例進行說明,當在GPS語音導航系統1中在GPS導航過程中行駛到赤峰路與四平路的交叉路口時,需要播放的一個導航語句″前方左轉到達四平路″,步驟S10,將該導航語句劃分為單個詞段″前方″、″左轉″、″到達″以及″四平路″,即實際上傳到語音合成裝置10中的參數是拼接成該導航語句的各個詞段。
步驟S11,在索引存儲單元中以詞段對應的語音格式道路信息的信息文本描述為關鍵字查找該詞段的記錄。
步驟S12,判斷最近取出的詞段是不是該導航語句的最後一個詞段,若不是則進至步驟S13,否則進至步驟S17。
步驟S13,判斷最近取出的詞段是不是該導航語句的起始詞段,若是則進至步驟S14,否則直接進至步驟S15。
步驟S14,在內存中創建一個臨時語音文件,該臨時語音文件即表示當前需要播報的導航語句,同時生成該文件的文件頭信息,該臨時語音文件及文件頭也可存儲在語音存儲單元,並且生成與該臨時語音文件對應的臨時文本文件,該臨時文本文件也可存儲在索引存儲單元中。
步驟S15,根據詞段記錄的″文本描述″為關鍵詞在索引存儲單元中讀取詞段記錄。
步驟S16,根據詞段記錄的″偏移量″在語音存儲單元中讀取「數據大小」長度的語音數據到內存中。
步驟S17,在讀取完該導航語句的最後一個詞段後,關閉臨時語音文件。
步驟S18,播放生成的完整導航語句。
在本實施例中,將上述語音合成裝置設置於視覺和語音的集成GPS導航系統1中,該GPS導航系統1中還包括由GPS導航裝置20,其主要通過GPS接收機接收衛星信號,根據演算出來的經緯度,確定當前車輛所在位置,並以該位置為導航地圖的中心放大顯示到整個地圖顯示界面,實時刷導航地圖,顯示車輛周圍區域的環境情況。當獲得有效的GPS數據時,啟動語音導航裝置給以導航語句的語音提示,同時在導航地圖上顯示文字說明,包括當前行駛的道路名、道路信息和當前速度。當車輛接近道路交叉口時,系統語音提示轉向及下一個路口名,同時對於超速行駛,即車輛的行駛速度超出交通規則的限定,將語音提示駕駛者安全駕駛。
對於該語音合成裝置10與該GPS導航裝置20是通過主程序創建一個子進程專用於執行語音合成,每當需要進行語音導航提示時,主程序將所要播放的導航語句以詞段為單位傳遞給子進程,再由子進程完成語音播放的全過程。所述子進程即為圖3所示流程。
本發明的GPS語音導航系統在GPS數據處理以及圖像顯示方面的硬體結構及流程實現與現有技術基本相同,在此不詳細描述。
權利要求
1.一種語音合成裝置,用於GPS語音導航系統中,所述GPS語音導航系統還包括與所述語音合成裝置連接的GPS導航裝置,所述語音合成裝置包括基礎資料庫以及語音播放執行模塊,其特徵在於所述基礎資料庫進一步包括(1)語音存儲單元,用以儲存道路導航過程中所使用到的以詞段為單位的語音格式道路信息,以及(2)索引存儲單元,存儲至少包含所述語音格式道路信息的文本描述、偏移量及數據長度的文本格式道路信息,且所述文本格式道路信息與語音格式道路信息為一一對應關係;所述語音播放執行模塊進一步包括(1)分析單元,在播放一導航語句之前,先將所述導航語句拆分為多個語音格式道路信息,並以一預定關鍵詞檢索所述基本資料庫中的文本格式道路信息,再通過對文本格式道路信息的解析,獲得與之對應的語音格式道路信息;以及(2)播放單元,先將所有以詞段為單位的語音格式道路信息重組形成所述導航語句,再進行播報。
2.根據權利要求1所述的語音合成裝置,其特徵在於,所述語音格式道路信息是wav文件。
3.根據權利要求1所述的語音合成裝置,其特徵在於,所述詞段為道路名、道路口名、轉向信息、行駛速度或行駛距離。
4.根據權利要求1所述的語音合成裝置,其特徵在於,所述文本格式道路信息是txt文件。
5.根據權利要求1所述的語音合成裝置,其特徵在於,所述偏移量為所述語音格式道路信息在所述語音存儲單元中的存儲位置偏移量。
6.根據權利要求1所述的語音合成裝置,其特徵在於,所述數據長度為所述語音格式道路信息的以字節為單位的語音數據長度。
7.根據權利要求1所述的語音合成裝置,其特徵在於,所述預定關鍵詞為所述語音格式道路信息的文本描述。
8.根據權利要求1所述的語音合成裝置,其特徵在於,所述播放單元還可依據導航區域的擴展或者變化,重新錄製新的語音格式道路信息。
9.根據權利要求8所述的語音合成裝置,其特徵在於,當所述播放單元錄製生成新的語音格式道路信息時,應同時生成與之對應的文本格式道路信息。
10.一種GPS語音導航系統,其特徵在於,所述GPS語音導航系統採用權利要求1所述的語音合成裝置合成導航語句,再予以播放。
11.一種語音合成方法,用於GPS語音導航系統中,所述GPS語音導航系統包括基礎資料庫、語音合成裝置及與所述語音合成裝置相互連接的GPS導航裝置,其特徵在於,所述語音合成方法包括儲存道路導航過程中所使用到的以詞段為單位的語音格式道路信息;由所述語音格式道路信息對應地生成至少包含所述語音格式道路信息的文本描述、偏移量及數據長度的文本格式道路信息;在播放一導航語句之前,先將所述導航語句拆分為多個語音格式道路信息,並以一預定關鍵詞檢索所述基本資料庫中的文本格式道路信息;解析檢索到的文本格式道路信息,獲得與之對應的語音格式道路信息;將所述導航語句涉及到的以詞段為單位的語音格式道路信息重組,再進行語音播報。
全文摘要
一種語音合成裝置以及方法,用於具有GPS導航裝置的GPS語音導航系統中,其主要包括語音存儲單元、索引存儲單元,分析單元以及播放單元其儲存道路導航過程中所使用到的以詞段為單位的語音格式道路信息,並對應地生成至少包含所述語音格式道路信息的文本描述、偏移量及數據長度的文本格式道路信息,在播放一導航語句之前,先將導航語句拆分為多個語音格式道路信息,並以一預定關鍵詞檢索基本資料庫中的文本格式道路信息,接著解析檢索到的文本格式道路信息,獲得與之對應的語音格式道路信息,最後將所述導航語句涉及到的以詞段為單位的語音格式道路信息重組,再進行語音播報,本發明還提供一種包括上述語音合成裝置的GPS語音導航系統。
文檔編號G01S19/13GK1956056SQ200610117188
公開日2007年5月2日 申請日期2006年10月16日 優先權日2006年10月16日
發明者蔣昌俊, 曾國蓀, 陳閎中, 苗奪謙, 閻春鋼, 付瑛, 方鈺, 何良華 申請人:同濟大學