新四季網

使用預編程的語音特徵的語音轉換器的製作方法

2023-06-14 14:27:51 3

專利名稱:使用預編程的語音特徵的語音轉換器的製作方法
背景技術:
1.發明領域本發明涉及語音處理,尤其涉及按照多種預編程的特徵中用戶所選特徵修改接收語音信號的多個方面的語音轉換器。
2.相關領域描述語音轉換是將一說話者的語音轉換為另一說話者的語音,諸如將一男性的語音轉換為一女性的語音,反之亦然。語音轉換系統是一新概念,多數語音轉換系統仍處於研究階段。創新技術有限公司的SOUNDBLASTER軟體包是少數能在個人計算機上運行用於修改語音的已知聲響效果產品。此產品使用了包括以寬帶PCM形式的數位化模擬波形的輸入信號,並且用於根據用戶輸入以多種方式修改輸入信號。一些示例性效果被命名為女聲變男聲、男聲變女聲、神聲(Zeus)以及小松鼠聲(chipmunk)。
儘管諸如這些的產品對於一些應用有用,當考慮用於比個人計算機更小型的應用中時,或者當考慮用於要求語音轉換的更高級模式時,它們不是很適當。也就是,個人計算機提供大量的存儲、寬帶採樣頻率、巨大的處理功率以及在諸如無線電話的小型應用中並非總存在的其它這樣的資源。根據轉換的期望複雜性,為這樣小型的應用開發語音轉換系統非常困難或不可能。
伴隨已知的語音調節軟體的一附加問題是經轉換的語音並非總聽起來自然。儘管造成此的原因可能對其它人未知,本發明者已經發現問題在於到諸如音調和共振峰的語音質量的相同轉換的應用。
結果,由於某些未解決的問題,已知語音轉換系統並非對於所有應用總完全適當。
發明摘要大致上,本發明涉及按照多種預編程的特徵(「語音類型」)中用戶所選特徵規定修改輸入語音的多個方面的語音轉換方法。開始,語音轉換器接收信號,此信號包括表示輸入語音信號的共振峰信號和表示輸入信號的基本頻率的音調信號。可選地,一個或兩個下列信號也被另外接收包括指示語音信號是有聲的或無聲的或混合的發聲信號,以及/或者表示輸入信號的能量的增益信號。語音轉換器也接收多種語音類型中用戶所選的一類型,每個語音類型規定一種修改一個或多個接收信號(即,共振峰、發聲、音調、增益)的方式。例如,不同的語音類型可以規定信號的修改以創建單調語音、低沉的語音、女性語音、悅耳的語音、耳語語音或其它效果。語音轉換器按照所選語音類型規定修改一個或多個接收信號。
本發明向它的用戶提供幾個明顯的優點。例如,本發明提供特徵上為小型但功能強大的語音轉換器。另外,語音轉換器與諸如車載的無線電話所使用的信號的窄帶信號相兼容。本發明的另一個優點是可以開分修改語音質量,諸如音調和共振峰。這避免了傳統語音轉換包產生的非自然語音,統語音轉換包將同一轉換率應用於音調和共振峰信號。
本發明也提供幾個其它優點和好處,它們通過本發明的下列描述將變得明顯。
附圖的簡要描述

圖1是語音處理系統的硬體組件和互連的框圖。
圖2是數字數據處理機器的框圖。
圖3示出了示例性信號承載媒體。
圖4是包括語音轉換器的無線電話的框圖。
圖5是按照多種預編程的特徵中用戶所選特徵規定,通過修改輸入語音信號而語音轉換的操作順序流程圖。
優選實施例的詳細描述通過考慮下面提出的結合附圖的詳細描述,對於本領域的技術人員本發明的特徵、性質和優點將變得更加明顯。
硬體組件與互連整體結構本發明的一方面涉及語音處理系統,可以由多種硬體組件和互連實施,一示例由圖1中示出的語音處理系統100描述。語音處理系統100包括多種子組件,每個子組件可用硬體設備、軟體設備、硬體或軟體設備的一部分、或者上述的組合來實現。下面結合示例性的數字數據處理裝置、邏輯電路以及信號承載媒體更加詳細地描述這些子組件的組成。
大致上,系統100接收輸入語音108,使用編碼器102對輸入語音編碼,使用語音轉換器104修改經編碼的語音,使用解碼器106對經修改的語音解碼,以及可選地再使用語音轉換器104修改經解碼的語音。結果為輸出語音136。
不像諸如SOUNDBLASTER軟體包的先前產品,系統100使用語音產生類型來描述正由系統100處理的語音。語音產生類型在人造語音生成領域公知,它認為語音能夠按激勵源、表示聲道的頻率響應的濾聲器以及嘴唇的多種輻射特性建模。激勵源可以包括有聲源和無聲源或者它們的組合,有聲源是喉脈衝的準周期串,無聲源是在聲道的不同地方產生的隨機變化的噪聲。一個全極點無線衝激響應濾波器對聲道傳遞函數建模,其中極點被用於描述聲道的共振頻率或共振峰頻率。對於每個個體,激勵源由於有聲語音的基本頻率而被區分。共振峰頻率由於聲道的幾何結構而被區分。為了獨立地修改共振峰和音調,本發明將編碼器內的共振峰和音調分離,編碼器是基於語音產生類型被設計的。
編碼器102和解碼器106可以使用多種商用產品的原理來實現。例如,編碼器102可以使用被提供在車上的無線電話的多種已知信號編碼器來實現。解碼器106可以使用已知實現在基站、集線器、交換器或者無線電話網絡的其它網絡設施處的多種信號編碼器的原理來實現。數字無線電話學中的每個連接實現某種類型的編碼器和解碼器。然而系統100不像編碼器和解碼器,它包括語音轉換器104包含的中頻組件,下面更詳細地描述。而且,如下面更詳細地描述,編碼器和解碼器都被提供在同一無線電話或其它計算單元中。
編碼器更加詳細地參考圖1,編碼器102分析輸入語音108以標識輸入語音的多種屬性,所述輸入語音包括共振峰、發聲、音調和增益。這些特性被提供在輸出112a、114a、116a和118a上。可任選地,對於不試圖修改語音的這些方面的應用,發聲和/或增益信號以及隨後它們的處理被忽略。編碼器102包括預濾波器110,此預濾波器將輸入語音分為適當大小的窗,如20毫秒。在示出的實施例中,輸入語音的隨後處理按逐個窗執行。而且,預濾波器110可以執行其它功能,諸如阻止DC信號或抑制噪聲。LPC分析器112將線性預測編碼(LPC)應用於預濾波器110的輸出。如所說明,LPC分析器112和隨後的處理階段每時刻一窗地處理輸入語音。然而為了參考簡單,處理大致按照輸入語音和它的副產品被討論。LPC分析是將源信號從語音的聲道特性中分離的已知技術,在多個參考中有說明,包括文本L.RabingerB.Juang所著的語音識別基礎。此參考通過引用完全被結合與此。LPC分析器112提供LPC係數(在輸出112a上)和輸出112b上的殘餘信號。LPC係數是描述共振峰的特性。
殘餘信號被指向發聲檢測器114、音調搜索器116和增益計算器118,在各個輸出114a、116a、118a處提供輸出信號。組件114、116、118處理殘餘信號以提取分別表示發聲、音調和增益的源信息。在一示例中,「發聲」表示輸入語音108是有聲的、無聲的或混合的;「音調」表示輸入語音108的基本頻率;「增益」表示輸入語音108的能量,以dB或其它適當的單位表示。可任選地,發聲檢測器114和增益計算器118的一個或兩個可以從編碼器102中被忽略。
語音轉換器大致上,語音轉換器104從編碼器102接收共振峰、發聲、音調和增益信號,然後按照語音類型庫130中包括的多種預編程的語音類型中用戶所選類型規定而修改這些信號的一個、一些或全部。庫130可以使用電路存儲、磁碟存儲、諸如磁帶的順序媒體或者任何其它存儲媒體來實現。每個語音類型表示不同的特性,這些特性包含關於如何修改規定的一個或多個共振峰、發聲、音調和/或增益的指令,以達到期望的語音轉換結果。下面稍後討論一些示例性的特性。
庫130接收指示期望的語音類型的用戶選擇的用戶輸入130a。用戶輸入130a可以通過諸如小鍵盤、按鈕、開關、撥號盤、觸控螢幕或任何其它人類用戶接口的接口而被接收。或者,當用戶是非人類時,輸入130a可以來自網絡、通信信道、存儲器、無線鏈路或者接收來自諸如主機、網絡附加處理器、應用程式等等的輸入的其它通信接口。
按照用戶所選輸入130a,語音類型庫130使所選語音類型的各個組件對於共振峰調節器122、發聲調節器124、音調調節器126、增益調節器128以及(下面分開描述的)後濾波器120可用。或者,不將用戶輸入130a指向庫130,用戶輸入130a可以指向組件122、124、126、128,使這些組件從庫130檢索期望的語音類型。每個語音類型規定當此語音類型被用戶輸入130a選中時由每個組件122、124、126、128應用的修改(如果存在)。
共振峰調節器122可以被實現以執行多種功能,下面更加詳盡地描述。在一示例中,共振峰調節器122將線112a上的LPC係數與用戶所選語音類型規定或包含的矩陣中規定的乘數相乘。在另一示例中,共振峰調節器122將LPC係數轉換為線性頻譜對(LSP)域,將得到的LSP對與一常數相乘,然後將LSP對轉換回LPC係數。LSP技術在參考Rabinger和Juang的標題為「語音識別基礎」的上述引用中被討論。
發聲調節器124按照用戶所選語音類型規定將發聲信號114a變為有聲的、無聲的或混合的期望值。音調調節器126將音調信號116a與諸如0.5、1.5的比率相乘或將應用於不同音節、時間片或來自116a的信號的其它子組件的不同比率的表相乘。如另一可選實施例,音調調節器126可以將音調變為預定值(單音)或多個不同的預定值(如曲調)。增益調節器128通過將增益信號118a與一比率或者將隨時間應用不同比率的表相乘而改變它。
語音類型130被被設計以提供多種預編程的語音轉換效果。例如,通過使用某些比率修改音調和共振峰,語音可以從男性被轉換到女性,反之亦然。在一些情況下,一比率被應用於音調,不同的比率被應用於共振峰,以便達到更多的自然音響變換語音。或者,可以通過將音調替換為預定的音調聲調模式而引入口音,以及可任選地在某些語音上修改共振峰。如另一示例,機器人語音可以通過將音調固定在某一值上而建立,可任選地固定發聲特性以及可選擇地通過增加共振來修改共振峰。在又一示例中,通過將音調變到預定曲調的音調而使講話語音被轉換到歌唱語音。
可任選地,語音轉換器104可以包括後濾波器120。按照來自類型庫130的用戶所選語音類型的內容,後濾波器120將適當的濾波過程應用於來自解碼器106的信號(下面討論)。在一實施例中,後濾波器120執行經解碼的語音的頻譜斜率修改。如一不同或附加功能,後濾波器120可以將應用諸如低通、高通或者活動濾波的濾波。一些示例包括有限衝激響應和無限衝激響應濾波器。一示例性的濾波方案應用y(n)=x(n)+x(n-L)以產生回聲效果。
解碼器一般地,解碼器106執行與編碼器102相反的功能,即將共振峰、發聲、音調和增益(按照語音轉換器104所修改)重組成輸出語音。解碼器106包括激勵信號生成器132,此生成器從轉換器104接收發聲、音調和增益信號(具有任何修改)並且在線132a上提供代表性的LPC殘餘信號。生成器132的結構和操作可以按照與相關領域中原理相似的原理。
LPC合成器134,將反向LPC處理應用於來自共振峰調節器122的共振峰和來自生成器132的殘餘信號132a,以便在輸出134a上產生代表性的語音信號。因此,合成器134和生成器132組合地執行與LPC分析器112相反的功能。合成器134的結構和操作可以按照與相關領域中原理相似的原理。
在一實施例中,LPC合成器134的輸出134a可以被用作輸出語音136。或者,如上所述並且在圖1中說明的,LPC合成器輸出的語音信號134a可以被路由回後濾波器120並且按照用戶所選語音類型規定而修改。這樣,後濾波器120的輸出變為如圖1中說明的輸出語音136。
示例性數字數據處理裝置如上面提到的,數據處理實體,諸如語音處理系統100或者它們的一個或多個獨立組件,可以用多種形式被實現。一示例為數字數據處理裝置,由圖2的數字數據處理裝置200的硬體組件和互連例示。
裝置200包括處理器202,諸如微處理器、個人計算機、工作站或者其它處理機器,它們被耦合到存儲器204。在本示例中,存儲器204包括快速訪問存儲器206以及非易失存儲器208。快速訪問存儲器206可以包括隨機訪問存儲器(「RAM」),可以被用於存儲由處理器202執行的編程指令。非易失存儲器208可以包括如,電池支持的RAM、EEPROM、諸如「硬驅動」、磁帶驅動(磁帶驅動)的一個或多個磁數據存儲盤、或者任何其它適當的存儲設備。裝置200也包括輸入/輸出210,諸如線、總線、電纜、電磁鏈路、或者處理器202與到裝置200的其它硬體外接交換數據的其它裝置。
儘管前面特定的描述,普通技術人員(得益於本揭示)將認識到,上述裝置可以使用不同構造的一機器來實現,而不違背本發明的外圍。如一特定實例,可以除去組件206、208中的一個,而且存儲器204、206和/208可以被提供在處理器202的板上,或者甚至被提供在裝置200的外面。
邏輯電路與上述數字數據處理裝置相反,本發明的一個不同實施例使用邏輯電路來代替計算機執行指令,以實現語音處理系統100的一些或所有處理實體。按照速度、費用、加工成本等等方面的應用的某些要求,此邏輯可以通過構造具有數千個微集成電晶體的應用專用集成電路(ASIC)來實現。這樣的ASIC可以使用CMOS、TTL、VLSI或者另一個適當的構造來實現。其它選擇包括數位訊號處理晶片(DSP)、離散電路(諸如,電阻、電容、二極體、電感以及電晶體)、現場可編程門陣列(FPGA)、可編程邏輯陣列(PLA)、可編程邏輯設備(PLD)等等。
無線電話在一示例性應用中,無任何限制,語音處理系統100可以在無線電話400(圖4)中與無線電話領域內已知的其它電路一起被實現。電話400包括揚聲器408、用戶界面410、麥克風414、收發機404、天線406以及管理器402。管理器402,可以通過諸如上面結合圖3-4描述的電路來實現,它管理組件404、408、410和414的操作和它們之間的信號路由。管理器402包括系統100包含的語音轉換模塊402a。模塊402a執行功能如,從諸如麥克風414和/或收發機404的默認或用戶特定源獲取輸入語音並且按照來自通過接口410接收的用戶的指示修改輸入語音,然後將輸出語音提供到擴音器408、收發機404、或者其它默認和用戶特定目的地。
作為電話400的又一選擇,系統100可以用多種其它設備來實現,諸如個人計算機、計算工作站、網絡開關、個人數字助理(PDA)、或者任何其它有用的應用。
操作已經描述了本發明的結構特性,下面將描述本發明的操作方面。
信號承載媒體無論本發明的一些功能使用一個還是多個機器執行的程序序列來實現,這些序列可以包含在多種形式的信號承載媒體中。在圖2的上下文中,例如,這樣的信號承載媒體可以包括存儲器204或另一個信號承載媒體,如磁數據存儲軟盤300(圖3),它們由處理器202直接或間接訪問。無論包含在存儲器206、軟盤300或者其它地方,指令可以被存儲在多種機器可讀數據存儲媒體上。一些示例包括直接訪問存儲器(如,通常的「硬碟」、廉價盤的冗餘陣列(「RAID」)、或者另一個直接訪問存儲設備(「DASD」))、諸如磁或光帶的順序訪問存儲器、電的非易失存儲器(如,ROM、EPROM或EEPROM)、電池支持的RAM、光存儲器(如,CDROM、WORM、DVD、數字的光帶)、紙質「打孔」卡、或者其它適當的信號傳輸媒體,包括邏輯的或數字的傳輸媒體、邏輯和通信鏈路以及無線通信。在本發明的說明性實施例中,機器可讀指令可以包括軟體目標代碼,經諸如彙編語言、C等的語言編譯。
邏輯電路與上述信號傳輸媒體不同,一些或所有本發明的功能使用邏輯電路被實現,而非使用處理器來執行指令。因此,這樣的邏輯電路被配置以執行實現本發明的方法的操作。邏輯電路可以使用多種不同類型的電路來實現,電路如上所述。
操作的總體順序圖5示出了語音轉換順序500,以說明本發明的一個操作實施例。大致上,該順序包括按照多種預編程的語音類型中用戶所選的一類型修改接收語音信號的多個方面的任務。通過按照用戶所選語音類型規定來修改語音信號的共振峰、發聲、音調和/或增益實現此。為了解釋方便,而非要想任何限制,圖5的示例在上述語音處理系統100的上下文中被描述。
序列500開始於步驟501,當編碼器102接收輸入語音108。接著是編碼過程502。在步驟503中,預濾波器110將輸入語音分為適當大小的窗,諸如20毫秒。在示出的實施例中,輸入語音的隨後處理被逐窗地執行。另外,預濾波器110可以執行其它功能,如阻擋DC信號或抑制噪聲。在步驟504中,LPC分析器112將LPC應用於預濾波器110的輸出。如所示出,LPC分析器112和每個隨後的處理階段分別處理輸入語音的每個窗。然而為了參考方便,處理大致上根據輸入語音和它的副產品被討論。LPC分析器112在輸出112a上提供LPC係數(共振峰)以及在輸出112b上提供殘餘信號。
在步驟506中,殘餘信號被分流。換言之,LPC分析器112將殘餘信號指向發聲檢測器114、音調搜索器116和增益計算器118,而且這些組件在它們各自的輸出114a、116a、118a提供輸出信號。組件114、116、118處理殘餘信號,以提取表示發聲、音調和增益的源信息。在本示例中,如上面所提到,「發聲」表示輸入語音108是有聲的、無聲的或者混合的;「音調」表示輸入語音108的基本頻率;「增益」表示輸入語音108的能量,以dB或其它適當的單位表示。可選地,如果從編碼器102中忽略發聲檢測器114和增益計算器118的一個或兩個,則這裡示出的這些組件的功能也被忽略。
在步驟502之後,語音轉換發生在507中。在步驟508中,用戶從將被語音轉換器104應用的語音類型庫130中選擇一語音類型。也在步驟508中,語音類型庫130接收用戶輸入130a然後相應地使所選特性的各個組件可用於共振峰調節器122、發聲調節器124、音調調節器126以及增益調節器128。在一可選實施例中,用戶輸入130a可以被指向組件122、124、126、128而非庫130,使這些組件從庫130中檢索期望的語音類型。當語音類型被選擇時,每種語音類型規定一特定的修改(如果存在)被組件122、124、126、128中的一個或多個應用。
每種語音類型規定修改接收信號(即,共振峰、發聲、音調、增益)的至少一個的一方式。「用戶」可以是人類操作員、主控機器、網絡連接的處理器、應用程式、或者其它功能實體。在步驟509、510、512、514中,組件122、124、126、128接收和修改它們各自的輸入信號112a、114a、116a、118a。換言之,共振峰112接收表示輸入語音信號108的共振峰信號112a(步驟509);發聲調節器124接收包括指示輸入語音信號108是有聲的、無聲的或者混合的發聲信號114(步驟510);音調調節器126接收包括輸入語音信號108的基本頻率的表示的音調輸入語音信號116a(步驟512);增益調節器128接收表示輸入語音信號108的能量的增益信號118a(步驟514)。
同樣在步驟509、510、512、514中,組件122、124、126和/或128按照用戶輸入130a所選的語音類型修改接收信號112a、114a、116a、118a中的一個或多個。例如,步驟509可以包括共振峰調節器122,調節器122通過將輸入信號的LPC係數轉換為LSP而修改共振峰信號112a、按照用戶所選語音類型修改LSP,然後將修改的LSP轉換回LPC係數。用於修改LSP的一示例性技術由等式1示出,如下。
LSPnew(i)=LSP(i)*F*(11-i)/(F+10-i)其中i從1到10。
F是範圍從0.5到2的共振峰移動因數,取決於相關語音類型的期望效果。例如,當F=1時,LSPnew9(i)=LSP(I)並且無移動。
另一個用於移動共振峰的技術由等式2表示,如下。
LSPnew(i)=LSP(i)*F其中i從1到10。
F是期望的共振峰移動因數。
如步驟510的示例,發聲調節器124可以包括改變發聲信號114a,以便將輸入語音108變為發聲的、無聲的或者混合的不同性質。如步驟512的示例,音調調節器116可以修改音調信號116a,通過乘以預定係數(諸如,0.5、0.2或另一比率),將音調乘以將應用於不同音節或時間片或其它組件的微分係數矩陣,用一個或多個音調的固定模式替換音調,或者另一操作。如步驟514的示例,增益調節器128可以修改信號118a,以便將輸入語音108的增益標準化到預定的或用戶輸入的值。
在語音轉換507之後,發生解碼515。在步驟516中,激勵信號生成器132從轉換器104接收發聲、音調和增益信號(具有任何修改),並且在132a提供代表性的LPC殘餘信號。因此,生成器132執行LPC分析器112的功能的逆。在步驟518中,合成器134將逆LPC處理應用於共振峰(來自共振峰調節器122)和殘餘信號132a(來自生成器132),以便在134a處產生代表性的語音輸出信號。因此,合成器134執行LPC分析器112的功能的逆。在一實施例中,LPC合成器134的輸出134a可以被用作輸出語音136。
或者,如上所述,在步驟519中LPC合成器134輸出的語音信號134a可以被路由返回用於更多語音轉換。換言之,在步驟520中,後濾波器120按照用戶所選語音類型修改LPC合成器134的信號,這種情況下後濾波器120(而非合成器134)的輸出在步驟522中構成輸出語音136。在一實施例中,後濾波器120執行輸出語音的頻譜斜率修改。後濾波器120可以應用濾波,諸如低通、高通、或者活動的濾波。一些示例包括有限脈衝響應或者無限脈衝響應濾波。更特別的示例是應用諸如y(n)=x(n)+x(n-L)的函數以產生回聲效果。
其它實施例前面的揭示示出了本發明的幾個示例性實施例,然而對其中進行多種改變和修改對於本領域的技術人員是顯而易見的,同時不違背本附加權利要求書定義的發明範圍。而且,儘管本發明的元件可以被描述或聲明為單數的,也可以考慮使用複數,除非明確表明限於單數。另外,普通技術人員將認識到,為了解釋和聲明,操作序列必須以某特定順序陳列,但是本發明允許超出這些特定順序的多種改變。
權利要求
1.一種用於語音信號轉換的方法,包括操作接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括指示輸入信號是有聲的、無聲的或混合的發聲信號;包括表示輸入語音信號的基本頻率的音調信號;包括表示輸入語音信號內能量的增益信號;接收多個語音類型的至少一個的用戶選擇,每個類型規定修改至少一個接收信號的一個方式;按照所選語音類型修改至少一個接收信號;提供包括所述修改的接收信號的輸出。
2.如權利要求1所述的方法,其特徵在於,修改操作包括通過執行各種操作而修改共振峰信號,所執行的各種操作包括將共振峰信號的線性預測編碼係數轉換為線性頻譜對;按照所選語音類型所規定修改線性頻譜對;將經修改的線性頻譜對轉換為線性預測編碼係數。
3.如權利要求1所述的方法,修改操作包括修改音調信號,所執行的操作包括下列之一將音調信號與預定的係數相乘;將音調信號隨時間與微分係數的矩陣相乘;用一個或多個電平的固定音調模式代替音調信號。
4.如權利要求1所述的方法,修改操作包括將增益信號標準化為一固定值。
5.如權利要求1所述的方法,修改操作包括將發聲信號改變至有聲的、無聲的或混合的不同值。
6.如權利要求1所述的方法,每個語音類型還規定濾波器類型,操作還包括按照所選語音類型規定將輸出濾波。
7.如權利要求1所述的方法,修改操作包括將第一轉換應用於共振峰信號;將第二轉換應用於音調信號,第二轉換不同於第一轉換。
8.一種用於語音信號轉換的方法,包括操作接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括表示輸入語音信號的基本頻率的音調信號;接收多個語音類型中至少一個的用戶選擇,每個類型規定修改共振峰信號的一個方式和修改音調信號的一不同方式;按所選語音類型規定修改接收信號;按照修改提供接收信號的輸出。
9.一種處理語音的方法,包括操作將線性預測編碼應用於輸入語音,以產生共振峰輸出和殘餘輸出;處理殘餘輸出,以產生表示輸入語音的音調、增益和發聲的各個輸出;接收多個預定語音類型中至少一個的用戶選擇,每個語音類型規定修改共振峰、音調、增益和發聲輸出中至少一個的一個方式和按照所選語音類型修改共振峰、音調、增益和發聲中一個或多個的一個方式;再組合包括任何修改的共振峰、音調、增益和發聲輸出,以形成經編碼的輸出信號。
10.信號承載媒體有形地體現為數字處理裝置可執行的機器可讀指令的程序,以執行語音轉換操作,所述操作包括接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括指示輸入信號是有聲的、無聲的或混合的發聲信號;包括表示輸入語音信號的基本頻率的音調信號;包括表示輸入語音信號內能量的增益信號;接收多個語音類型的至少一個的用戶選擇,每個類型規定修改至少一個接收信號的一個方式;按照所選語音類型修改至少一個接收信號;提供包括所述修改的接收信號的輸出。
11.如權利要求10所述的媒體,其特徵在於,修改操作包括通過執行各種操作修改共振峰信號,所執行的各種操作包括將共振峰信號的線性預測編碼係數轉換為線性頻譜對;按照所選語音類型所規定修改線性頻譜對;將經修改的線性頻譜對轉換為線性預測編碼係數。
12.如權利要求10所述的媒體,修改操作包括修改音調信號,所執行的操作包括下列之一將音調信號與預定的係數相乘;將音調信號隨時間與微分係數的矩陣相乘;用一個或多個電平的固定音調模式代替音調信號。
13.如權利要求10所述的媒體,修改操作包括將增益信號標準化為一固定值。
14.如權利要求10所述的媒體,修改操作包括將發聲信號改變至有聲的、無聲的或混合的不同值。
15.如權利要求10所述的媒體,每個語音類型還規定濾波器類型,操作還包括按照所選語音類型規定將輸出濾波。
16.如權利要求10所述的媒體,修改操作包括將第一轉換應用於共振峰信號;將第二轉換應用於音調信號,第二轉換不同於第一轉換。
17.信號承載媒體有形地體現為數字處理裝置可執行的機器可讀指令的程序,以執行語音轉換操作,所述操作包括接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括表示輸入語音信號的基本頻率的音調信號;接收多個語音類型中至少一個的用戶選擇,每個類型規定修改共振峰信號的一個方式和修改音調信號的一不同方式;按所選語音類型規定修改接收信號;按照修改提供接收信號的輸出。
18.信號承載媒體有形地體現為數字處理裝置可執行的機器可讀指令的程序,以執行語音轉換操作,所述操作包括將線性預測編碼應用於輸入語音,以產生共振峰輸出和殘餘輸出;處理殘餘輸出,以產生表示輸入語音的音調、增益和發聲的各個輸出;接收多個預定語音類型中至少一個的用戶選擇,每個語音類型規定修改共振峰、音調、增益和發聲輸出中至少一個的一個方式和按照所選語音類型修改共振峰、音調、增益和發聲中一個或多個的一個方式;再組合包括任何修改的共振峰、音調、增益和發聲輸出,以形成經編碼的輸出信號。
19.多個互連的導電元件的電路被配置用於執行語音轉換操作,所述操作包括接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括指示輸入信號是有聲的、無聲的或混合的發聲信號;包括表示輸入語音信號的基本頻率的音調信號;包括表示輸入語音信號內能量的增益信號;接收多個語音類型的至少一個的用戶選擇,每個類型規定修改至少一個接收信號的一個方式;按照所選語音類型修改至少一個接收信號;提供包括所述修改的接收信號的輸出。
20.如權利要求19所述的電路,其特徵在於,修改操作包括通過執行各種操作修改共振峰信號,所執行的各種操作包括將共振峰信號的線性預測編碼係數轉換為線性頻譜對;按照所選語音類型所規定修改線性頻譜對;將經修改的線性頻譜對轉換為線性預測編碼係數。
21.如權利要求19所述的電路,修改操作包括修改音調信號,所執行的操作包括下列之一將音調信號與預定的係數相乘;將音調信號隨時間與微分係數的矩陣相乘;用一個或多個電平的固定音調模式代替音調信號。
22.如權利要求19所述的電路,修改操作包括將增益信號標準化為一固定值。
23.如權利要求19所述的電路,修改操作包括將發聲信號改變至有聲的、無聲的或混合的不同值。
24.如權利要求19所述的電路,每個語音類型還規定濾波器類型,操作還包括按照所選語音類型規定將輸出濾波。
25.如權利要求19所述的電路,修改操作包括將第一轉換應用於共振峰信號;將第二轉換應用於音調信號,第二轉換不同於第一轉換。
26.多個互連的導電元件的電路被配置用於執行語音轉換操作,所述操作包括接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括表示輸入語音信號的基本頻率的音調信號;接收多個語音類型中至少一個的用戶選擇,每個類型規定修改共振峰信號的一個方式和修改音調信號的一不同方式;按所選語音類型規定修改接收信號;按照修改提供接收信號的輸出。
27.多個互連的導電元件的電路被配置用於執行語音轉換操作,所述操作包括將線性預測編碼應用於輸入語音,以產生共振峰輸出和殘餘輸出;處理殘餘輸出,以產生表示輸入語音的音調、增益和發聲的各個輸出;接收多個預定語音類型中至少一個的用戶選擇,每個語音類型規定修改共振峰、音調、增益和發聲輸出中至少一個的一個方式和按照所選語音類型修改共振峰、音調、增益和發聲中一個或多個的一個方式;再組合包括任何修改的共振峰、音調、增益和發聲輸出,以形成經編碼的輸出信號。
28.無線通信設備,包括耦合到一天線的收發機;揚聲器;麥克風;用戶接口;耦合到多個組件的管理器,組件包括收發機、揚聲器、麥克風和用戶接口以管理這些組件的操作,所述管理器包括語音轉換系統,被配置用於執行下述操作接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括指示輸入信號是有聲的、無聲的或混合的發聲信號;包括表示輸入語音信號的基本頻率的音調信號;包括表示輸入語音信號內能量的增益信號;接收多個語音類型的至少一個的用戶選擇,每個類型規定修改至少一個接收信號的一個方式;按照所選語音類型修改至少一個接收信號;提供包括所述修改的接收信號的輸出。
29.無線通信設備,包括耦合到一天線的收發機;揚聲器;麥克風;用戶接口;耦合到多個組件的管理器,組件包括收發機、揚聲器、麥克風和用戶接口以管理這些組件的操作,所述管理器包括語音轉換系統,被配置用於執行下述操作將線性預測編碼應用於輸入語音,以產生共振峰輸出和殘餘輸出;處理殘餘輸出,以產生表示輸入語音的音調、增益和發聲的各個輸出;接收多個預定語音類型中至少一個的用戶選擇,每個語音類型規定修改共振峰、音調、增益和發聲輸出中至少一個的一個方式和按照所選語音類型修改共振峰、音調、增益和發聲中一個或多個的一個方式;再組合包括任何修改的共振峰、音調、增益和發聲輸出,以形成經編碼的輸出信號。
30.無線通信設備,包括編碼器,包括線性預測編碼(LPC)分析器,所述分析器被耦合到發聲檢測器、音調搜索器以及增益計算器;語音轉換模塊,包括與LPC分析器通信的共振峰調節器、與發聲檢測器通信的發聲調節器、與音調搜索器通信的音調調節器以及與所有調節器通信的語音類型庫;解碼器包括激勵信號生成器,所述生成器與發聲調節器、音調調節器和增益調節器通信,所述解碼器也包括耦合到激勵信號生成器的的LPC合成器。
31.無線通信設備,包括耦合到一天線的收發機;揚聲器;麥克風;用戶接口;耦合到多個組件的管理器,組件包括收發機、揚聲器、麥克風和用戶接口以管理這些組件的操作,所述管理器包括語音轉換系統,被配置用於執行下述操作接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括表示輸入語音信號的基本頻率的音調信號;接收多個語音類型中至少一個的用戶選擇,每個類型規定修改共振峰信號的一個方式和修改音調信號的一不同方式;按所選語音類型規定修改接收信號;按照修改提供接收信號的輸出。
32.無線通信設備,包括耦合到一天線的收發機;揚聲器;麥克風;用戶接口;用於管理收發機、揚聲器、麥克風和用戶接口的裝置以及附加包括用於語音轉換的裝置,所述語音轉換通過接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括指示輸入信號是有聲的、無聲的或混合的發聲信號;包括表示輸入語音信號的基本頻率的音調信號;包括表示輸入語音信號內能量的增益信號;接收多個語音類型的至少一個的用戶選擇,每個類型規定修改至少一個接收信號的一個方式;按照所選語音類型修改至少一個接收信號;提供包括所述修改的接收信號的輸出。
33.無線通信設備,包括耦合到一天線的收發機;揚聲器;麥克風;用戶接口;用於管理收發機、揚聲器、麥克風和用戶接口的裝置以及附加包括用於語音轉換的裝置,所述語音轉換通過將線性預測編碼應用於輸入語音,以產生共振峰輸出和殘餘輸出;處理殘餘輸出,以產生表示輸入語音的音調、增益和發聲的各個輸出;接收多個預定語音類型中至少一個的用戶選擇,每個語音類型規定修改共振峰、音調、增益和發聲輸出中至少一個的一個方式和按照所選語音類型修改共振峰、音調、增益和發聲中一個或多個的一個方式;再組合包括任何修改的共振峰、音調、增益和發聲輸出,以形成經編碼的輸出信號。
34.無線通信設備,包括用於編碼的裝置,包括用於線性預測編碼(LPC)分析的裝置,所述裝置被耦合到用於LPC分析的裝置、用於發聲檢測的裝置、用於音調搜索的裝置以及用於增益計算的裝置;用於語音轉換的裝置,包括被偶合到用於LPC分析的裝置的用於修改共振峰的裝置、被耦合到用於發聲檢測的裝置的用於發聲修改的裝置、與用於音調搜索的裝置通信的用於修改音調的裝置、與用於增益計算的裝置通信的用於修改增益的裝置以及語音類型庫;解碼器裝置,包括被耦合到用於LPC分析的裝置的用於LPC合成的裝置以及用於激勵信號生成的裝置,激勵信號生成裝置被附加耦合到用於發聲修改的裝置、用於音調調節的裝置和用於增益調節的裝置。
35.無線通信設備,包括耦合到一天線的收發機;揚聲器;麥克風;用戶接口;用於管理包括收發機、揚聲器、麥克風和用戶接口的組件的以管理組件的操作的裝置以及管理包括用於執行語音轉換系統的裝置的裝置,所述語音轉換通過接收信號,所述信號包括表示輸入語音信號的共振峰信號;包括表示輸入語音信號的基本頻率的音調信號;接收多個語音類型的至少一個的用戶選擇,每個類型規定修改至少一個接收信號的一個方式;按照所選語音類型修改至少一個接收信號;按照所述修改提供接收信號的輸出。
全文摘要
語音處理系統按照多種預編程的語音類型中用戶所選類型來修改輸入語音的各個方面。開始,語音轉換器接收表示輸入語音信號的共振峰信號和表示輸入信號的基本頻率的音調信號。以下一個或兩個也可以被接收包括指示輸入信號是有聲的、無聲的或混合的發聲信號,以及/或者表示輸入語音信號的能量的增益信號。語音轉換器也接收多個預編程的語音類型中用戶所選類型,每個類型規定修改一個或多個接收信號(即,共振峰、發聲、音調、增益)的一個方式。語音轉換器按所選語音類型修改共振峰、發音、音調和/或增益信號中至少一個。
文檔編號G10L21/00GK1647159SQ03808552
公開日2005年7月27日 申請日期2003年2月19日 優先權日2002年2月19日
發明者N·畢, A·P·德加科 申請人:高通股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀