新四季網

信息處理裝置、信息處理方法和程序的製作方法

2023-10-11 09:12:14

專利名稱:信息處理裝置、信息處理方法和程序的製作方法
技術領域:
本發明涉及信息處理裝置、信息處理方法和程序。

背景技術:
近年來,將作為數字數據的由TV廣播所廣播的節目記錄到諸如DVD(數字多功能光碟)或HDD(硬碟驅動器)之類的具有隨機存取性能的記錄介質中的視頻一記錄/回放裝置迅速普及。此外,通過網際網路對諸如視頻和音頻之類的內容進行發行變得流行,並且具有內置HDD或快閃記憶體的回放裝置已經廣泛普及,通過該回放裝置能夠在室內或室外欣賞從網際網路下載得到的內容。
利用數字和隨機存取特性,將如上所述的用於數字內容的回放裝置實現為具有各種功能。變速回放功能可以作為示例,其在維持聲音的恆定音高(pitch)的同時可變地設定回放速度。變速回放功能是減緩或加快視頻和音頻的回放速度的功能,並且例如,該功能針對語言的初學者等將回放速度減緩大約20%(慢回放),或者將回放速度加快大約50%以節省觀看時間等(快回放)。變速回放功能是這樣的功能,其從數字內容回放裝置開始普及起就被一般地實現在該裝置中,並且如今,數字內容回放裝置已經十分普遍。本發明不僅關注音頻內容,而且關注視頻內容的音頻部分。
在數字內容的回放裝置中,在維持聲音的恆定音高的同時可變地設定回放速度的技術被稱作語速轉換。在下文中,語速轉換意味著在維持聲音的恆定音高的同時拉伸或壓縮信號的轉換。已知幾種用於語速轉換的方法,例如,用作在對應於數字音頻信號的時域上的時間軸拉伸/壓縮算法的PICOLA(指針間隔控制交疊和相加)(參見「Expansion/compression on theaudio time-axis using duplication adding method by pointer amount-of-movement control(PICOLA)and its evaluation」,by Morita and Itakura,Acoustic Society of Japan collected papers,October 1986,pp.149-150)。該算法的優點在於雖然其處理簡單輕量,但是可以獲得好的聲音質量。


發明內容
然而,經過語速轉換,在維持聲音的恆定音高的同時執行了回放速度轉換,已經很難在聽覺上識別轉換後的回放速度。
因此,考慮到上述問題而提出本發明,並且期望提供在轉換音頻信號的回放速度時使得能夠在聽覺上識別轉換後的回放速度的新的並改良的信息處理裝置、新的並改良的信息處理方法以及新的並改良的程序。
根據本發明的實施例,提供了一種信息處理裝置,該信息處理裝置包括參數調節部分,其根據指示所輸入的回放速度變量因子的第一參數來設定第二參數和第三參數;以及信號處理部分,其基於第二參數和第三參數來調節音頻信號的回放速度和聲音音高中的至少一個,其中信號處理部分在所輸入的回放速度變量因子小於預定閾值時調節音頻信號的回放速度,並且在所輸入的回放速度變量因子在預定閾值以上時調節音頻信號的回放速度和聲音音高。
通過這樣的配置,參數調節部分根據指示所輸入的回放速度變量因子的第一參數來設定第二參數和第三參數,並且信號處理部分基於第二參數和第三參數來調節音頻信號的回放速度和聲音音高的至少一個。在此,信號處理部分在所輸入的回放速度變量因子小於預定閾值時調節音頻信號的回放速度,並且在所輸入的回放速度變量因子在預定閾值以上時調節音頻信號的回放速度和聲音音高。因此,通過根據本發明的信息處理裝置,在音頻信號的回放速度被轉換的情況下,可以在聽覺上識別轉換後的回放速度。
信號處理部分包括回放速度轉換部分,其轉換音頻信號的回放速度;以及音高調節部分,其調節音頻信號的聲音音高,並且回放速度轉換部分可以基於第二參數來轉換音頻信號的回放速度,而音高調節部分可以基於第三參數來調節音頻信號的聲音音高。
第一參數可以近似等於第二參數和第三參數的乘積。
信號處理部分還包括音頻信號輸出控制部分,其控制將從信號處理部分中被輸出的、被執行了預定信號處理的音頻信號的輸出,並且當回放速度和聲音音高均經過調節的音頻信號從信號處理部分中被輸出時,音頻信號輸出控制部分可以降低回放速度和聲音音高均經過調節的音頻信號的音頻音量。
信號處理部分還包括擬聲聲音(onomatopoeic sound)切換判斷部分,其根據第一參數,判斷是調節音頻信號的回放速度和聲音音高的至少一個,還是將音頻信號切換到指示正在執行高速回放的預定擬聲聲音,並且當第一參數在預定閾值以上時,擬聲聲音切換判斷部分可以判斷將音頻信號切換到預定擬聲聲音;並且當擬聲聲音切換判斷部分判斷將音頻信號切換到預定擬聲聲音時,音頻信號輸出控制部分可以在將音頻信號切換到預定擬聲聲音後輸出音頻信號。
信息處理裝置還包括內容管理部分,該內容管理部分管理包括音頻信號的內容,並且參數調節部分可以根據待輸入的第一參數來確定第四參數,該第四參數對將從內容管理部分被輸出到信號處理部分的音頻信號的數據量進行調節。
當第一參數在預定閾值以上時,參數調節部分可以減小第四參數以減小將從內容管理部分被輸出到信號處理部分的內容的數據量。
第一參數和第四參數的乘積可以近似等於第二參數和第三參數的乘積。
信息處理裝置還包括內容管理部分,該內容管理部分管理包括音頻信號的內容,並且參數調節部分可以基於對將從內容管理部分被輸出到信號處理部分的音頻數據的數據量進行調節的第四參數和待輸入的第一參數,確定第二參數和第三參數。
當第一參數在預定閾值以上時,內容管理部分可以減小第四參數以減小將從內容管理部分被輸出到信號處理部分的內容的數據量。
信息處理裝置還包括存儲部分,該存儲部分存儲其中待輸入的第一參數與第二參數和第三參數相互相關的資料庫,並且參數調節部分可以通過參考在存儲部分中所存儲的資料庫來確定第二參數和第三參數。
信息處理裝置還包括存儲部分,該存儲部分存儲其中待輸入的第一參數與第二參數、第三參數和第四參數相互相關的資料庫,並且參數調節部分可以通過參考在存儲部分中所存儲的資料庫來確定第二參數、第三參數和第四參數。
當第一參數在預定閾值以上時,參數調節部分可以根據第一參數與預定閾值之間的差來增大第二參數。
資料庫被存儲為指示第二參數和第三參數隨第一參數的變化的曲線,並且指示第三參數的變化的曲線可以在預定閾值前後具有平滑的形狀。
根據本發明的另一實施例,提供了一種信息處理方法,該信息處理方法包括參數調節步驟,其根據指示所輸入的回放速度變量因子的第一參數來設定第二參數和第三參數;以及信號處理步驟,其基於第二參數和第三參數,調節音頻信號的回放速度和聲音音高的至少一個,其中信號處理步驟在所輸入的回放速度變量因子小於預定閾值時,基於第二參數來調節音頻信號的回放速度,並且在所輸入的回放速度變量因子在預定閾值以上時,基於第二參數和第三參數來調節音頻信號的回放速度和聲音音高。
通過這樣的配置,參數調節步驟根據指示所輸入的回放速度變量因子的第一參數來設定第二參數和第三參數,並且信號處理步驟基於第二參數和第三參數來調節音頻信號的回放速度和聲音音高的至少一個。此時,信號處理步驟在所輸入的回放速度變量因子小於預定閾值時,基於第二參數來調節音頻信號的回放速度,並且在所輸入的回放速度變量因子在預定閾值以上時,基於第二參數和第三參數來調節音頻信號的回放速度和聲音音高。因此,通過根據本發明的信息處理裝置,在音頻信號的回放速度被轉換的情況下,可以在聽覺上識別轉換後的回放速度。
在參數調節步驟中,可以確定第二參數和第三參數以使得第一參數可以近似等於第二參數和第三參數的乘積。
在信號處理步驟中,可以對音頻信號的信號波形振幅進行控制以使得當音頻信號的回放速度和聲音音高均經過調節時,音頻信號的音頻音量可以較小。
在信號處理步驟中,當第一參數在預定閾值以上時,音頻信號可以被切換到指示正在執行高速回放的預定擬聲聲音。
在參數調節步驟中,還可以根據第一參數來確定第四參數,該第四參數對將在信號處理步驟中被處理的音頻信號的數據量進行調節。
在參數調節步驟中,當第一參數在預定閾值以上時,第四參數可以被減小以減小音頻信號的數據量。
在參數調節步驟中,可以根據對將在信號處理步驟中被處理的音頻信號的數據量進行調節的第四參數和第一參數來確定第二參數和第三參數。
在參數調節步驟中,可以確定第二參數、第三參數和第四參數以使得第一參數和第四參數的乘積可以近似等於第二參數和第三參數的乘積。
根據本發明的另一實施例,提供了一種在計算機中實現的程序參數調節功能,其根據指示所輸入的回放速度變量因子的第一參數來設定第二參數和第三參數;以及信號處理功能,其基於第二參數和第三參數來調節音頻信號的回放速度和聲音音高的至少一個。
通過這樣的配置,電腦程式被存儲在計算機中所包括的存儲部分中,並且被計算機中所包括的CPU讀取以執行,因此,該程序使計算機用作上述的信息處理裝置。此外,還可以提供一種其中記錄了電腦程式並且可以被計算機讀取的記錄介質。記錄介質例如是磁碟、光碟、磁光碟和快閃記憶體。此外,例如可以經由網絡來發布上述的電腦程式而無需使用記錄介質。
根據上述本發明的實施例,在音頻信號的回放速度被轉換的情況下,可以在聽覺上識別轉換後的回放速度。



圖1A是示出通過PICOLA來拉伸音頻信號的方法的說明性示圖。
圖1B是示出通過PICOLA來拉伸音頻信號的方法的說明性示圖。
圖1C是示出通過PICOLA來拉伸音頻信號的方法的說明性示圖。
圖1D是示出通過PICOLA來拉伸音頻信號的方法的說明性示圖。
圖2A是示出搜索類似波形長度的示例的說明性示圖。
圖2B是示出搜索類似波形長度的示例的說明性示圖。
圖2C是示出搜索類似波形長度的示例的說明性示圖。
圖3A是示出通過PICOLA來拉伸音頻信號的方法的說明性示圖。
圖3B是示出通過PICOLA來拉伸音頻信號的方法的說明性示圖。
圖4A是示出通過PICOLA來壓縮音頻信號的方法的說明性示圖。
圖4B是示出通過PICOLA來壓縮音頻信號的方法的說明性示圖。
圖4C是示出通過PICOLA來壓縮音頻信號的方法的說明性示圖。
圖4D是示出通過PICOLA來壓縮音頻信號的方法的說明性示圖。
圖5A是示出通過PICOLA來壓縮音頻信號的方法的說明性示圖。
圖5B是示出通過PICOLA來壓縮音頻信號的方法的說明性示圖。
圖6是示出通過PICOLA來拉伸音頻信號的方法的流程圖。
圖7是示出通過PICOLA來壓縮音頻信號的方法的流程圖。
圖8是示出根據PICOLA的語速轉換裝置的配置的框圖。
圖9是示出檢測類似波形長度的處理的流程圖。
圖10是示出檢測類似波形長度的處理的流程圖。
圖11是示出生成交叉淡入淡出信號的處理示例的流程圖。
圖12是示出降低採樣率的方法的說明性示圖。
圖13是示出提高採樣率的方法的說明性示圖。
圖14A是示出與回放速度成比例地升高聲音音高的處理示例的說明性示圖。
圖14B是示出與回放速度成比例地升高聲音音高的處理示例的說明性示圖。
圖14C是示出與回放速度成比例地升高聲音音高的處理示例的說明性示圖。
圖15A是示出在相關技術的第一回放裝置中回放速度變量因子與語速轉換率之間關係的坐標圖。
圖15B是示出在相關技術的第一回放裝置中回放速度變量因子與聲音音高之間關係的坐標圖。
圖16A是示出在相關技術的第二回放裝置中回放速度變量因子與語速轉換率之間關係的坐標圖。
圖16B是示出在相關技術的第二回放裝置中回放速度變量因子與聲音音高之間關係的坐標圖。
圖17是示出包括根據本發明第一實施例的信息處理裝置的回放速度轉換系統的說明性示圖。
圖18是示出根據本實施例的信息處理裝置配置的框圖。
圖19A是示出第一參數R和第二參數Rs之間關係的坐標圖。
圖19B是示出第一參數R和第三參數Rp之間關係的坐標圖。
圖20是示出根據本實施例的信息處理裝置的處理流程的流程圖。
圖21是示出根據本實施例的信息處理部分的功能的框圖。
圖22A是示出第一參數R和第二參數Rs之間關係的坐標圖。
圖22B是示出第一參數R和第三參數Rp之間關係的坐標圖。
圖23是示出根據本實施例的信號處理方法的流程圖。
圖24A是以樣本為單位示出由根據本實施例的信息處理裝置所執行的信號處理示例的說明性示圖。
圖24B是以樣本為單位示出由根據本實施例的信息處理裝置所執行的信號處理示例的說明性示圖。
圖24C是以樣本為單位示出由根據本實施例的信息處理裝置所執行的信號處理示例的說明性示圖。
圖24D是以樣本為單位示出由根據本實施例的信息處理裝置所執行的信號處理示例的說明性示圖。
圖25A是以樣本為單位示出由根據本實施例的信息處理裝置所執行的信號處理的另一示例的說明性示圖。
圖25B是以樣本為單位示出由根據本實施例的信息處理裝置所執行的信號處理的另一示例的說明性示圖。
圖25C是以樣本為單位示出由根據本實施例的信息處理裝置所執行的信號處理的另一示例的說明性示圖。
圖25D是以樣本為單位示出由根據本實施例的信息處理裝置所執行的信號處理的另一示例的說明性示圖。
圖26A是示出第一參數R和第二參數Rs之間關係的坐標圖。
圖26B是示出第一參數R和第三參數Rp之間關係的坐標圖。
圖27A是示出第一參數R和第二參數Rs之間關係的坐標圖。
圖27B是示出第一參數R和第三參數Rp之間關係的坐標圖。
圖28A是示出第一參數R和第二參數Rs之間關係的坐標圖。
圖28B是示出第一參數R和第三參數Rp之間關係的坐標圖。
圖29是示出根據本實施例的信號處理部分的修改示例的框圖。
圖30是示出根據修改示例的信號處理方法的流程圖。
圖31是示出轉換採樣率的另一種方法的說明性示圖。
圖32是示意性示出回放速度變量因子隨時間的變化的說明性示圖。
圖33是示出根據本發明第二實施例的信息處理裝置的功能的框圖。
圖34A是示出第一參數R和第四參數Rt之間關係的坐標圖。
圖34B是示出第一參數R和將被輸入到信號處理部分的音頻信號數據量之間關係的坐標圖。
圖35A是示出根據本實施例的調節數據讀取速度的方法示例的說明性示圖。
圖35B是示出根據本實施例的調節數據讀取速度的方法示例的說明性示圖。
圖36A是示出根據本實施例的調節數據讀取速度的方法示例的說明性示圖。
圖36B是示出根據本實施例的調節數據讀取速度的方法示例的說明性示圖。
圖37A是示出根據本實施例的調節數據讀取速度的方法示例的說明性示圖。
圖37B是示出根據本實施例的調節數據讀取速度的方法示例的說明性示圖。
圖37C是示出根據本實施例的調節數據讀取速度的方法示例的說明性示圖。
圖38A是示出第一參數R和第二參數Rs之間關係的坐標圖。
圖38B是示出第一參數R和第三參數Rp之間關係的坐標圖。
圖39是示出根據本實施例的信息處理裝置的處理流程的流程圖。
圖40是示出根據本實施例的信號處理部分的功能的框圖。
圖41A是示出第一參數R和第二參數Rs之間關係的坐標圖。
圖41B是示出第一參數R和第三參數Rp之間關係的坐標圖。
圖42是示出根據本實施例的信號處理方法的流程圖。
圖43是示出根據本實施例的信息處理裝置的第一修改示例的功能的框圖。
圖44是示出根據本修改示例的信號處理方法的流程圖。
圖45是示出根據本實施例以及本修改示例的信號處理部分的修改示例的框圖。
圖46是示出根據本修改示例的信號處理方法的流程圖。
圖47是示出根據本發明每個實施例的信息處理裝置的硬體配置的框圖。

具體實施例方式 在下文中,將參考附圖詳細描述本發明的優選實施例。應注意,在本說明書和附圖中,用相同標號來表示實質上具有相同功能和結構的結構元件,並且省略對這些結構元件的重複說明。
順便提及,以下,由語音構成的信號稱作語音信號,由諸如音樂之類的除語音外的聲音構成的信號稱作聲響信號,並且由語音信號和聲響信號構成的信號稱作音頻信號。
(基礎技術描述) 首先,在給出對本發明的優選實施例的詳細描述之前,將描述實現本發明所基於的技術問題。順便提及,本發明被配置為能夠通過改進如下所述的基礎技術來獲得顯著效果。因此,與改進有關的技術是本實施例的特徵。也就是,雖然本實施例遵循如下所述的技術問題的基本概念,但是實施例的本質關注改進,並且應注意,所述配置清楚地區別於基礎技術,並且在本實施例的效果和基礎技術的效果之間存在清楚的差別。
(PICOLA描述) 如上所述,PICOLA是在對應於數字語音信號的時域上的時間軸拉伸/壓縮算法,並且如下所述,對語音信號執行拉伸和壓縮。以下,通過參考圖1A到圖5B,將描述根據PICOLA的信號處理方法。
圖1A到1D是示出通過PICOLA來拉伸音頻信號的方法的說明性視圖。順便提及,在以下描述中,原始波形是信號最初被輸入到PICOLA時的波形。此外,在圖1A到1D中,縱軸代表信號振幅(即強度),並且橫軸代表時間。
(根據PICOLA對波形進行拉伸的處理) 根據PICOLA,首先,從原始波形中檢測到具有類似波形的周期A和周期B。如圖1A所示,周期A和周期B是連續並且具有相同長度的兩個周期,並且周期A的樣本數和周期B的樣本數相同。隨後,生成在圖1B中示出的波形,圖1B的波形在所檢測到的周期A中保持不變,然後在所檢測到的周期B中淡出(fade out)。類似地,生成在圖1C中示出的波形,圖1C的波形從周期A開始淡入(fade in)並且在周期B中保持不變。然後,通過相加在圖1B和圖1C中示出的所生成波形,可以獲得在圖1D中示出的經拉伸的波形。
如上所述的相加淡出波形和淡入波形被稱作交叉淡入淡出(cross-fade)。當周期A和周期B的交叉淡入淡出周期被表示為周期A×B並且上述操作被執行時,在圖1A中示出的原始波形的周期A和周期B變為在圖1D中示出的經拉伸波形的周期A、周期A×B和周期B。
(類似波形長度檢測) 在此,在如上所述的拉伸波長的處理中,將要從所輸入的信號中檢測出連續並且具有類似波形的兩個周期。在下文中,通過參考圖2A到圖2C,來描述檢測具有類似波形的周期A和周期B的周期長度W的方法。圖2A到圖2C是示出搜索類似波形長度的示例的說明性示圖。順便提及,在以下的描述中,周期A和周期B的周期長度被稱作類似波形長度。
首先,使信號波形中的處理開始位置P0作為開始點,如圖2A所示,j個樣本的周期A和周期B被指定。接下來,如圖2A→圖2B→圖2C所示,j(即,樣本數)逐漸增大,並且彼此十分類似的具有周期A的j和具有周期B的j被檢測到。在此,作為測量周期A與周期B之間的相似性的尺度,例如,可以使用如以下等式1所示的函數D(j)。 ...(等式1) 在類似長度波形的搜索範圍的最小值(WMIN)到最大值(WMAX)的範圍內(即,WMIN≤j≤WMAX)計算函數D(j),並且導致最小D(j)的j被獲得。該導致最小D(j)的參數j是周期A和周期B的周期長度W。順便提及,上述j、WMIN和WMAX表示周期的樣本數。
在此,在上述的等式1中,x(i)代表周期A的每個樣本值,並且y(i)代表周期B的每個樣本值。此外,x(i)代表周期B的每個樣本值並且y(i)代表周期A的每個樣本值是可以的。順便提及,例如,類似波形長度的搜索頻率範圍可以近似是50Hz到250Hz。例如,當採樣頻率為8kHz時,近似地,WMAX是160並且WMIN是32。在如圖2B所示的示例中,j被選作使函數D(j)最小的j。
隨後,通過參考圖3A到圖3B,將描述利用PICOLA來將音頻信號拉伸到任意長度的方法。圖3A和圖3B是示出通過PICOLA來拉伸音頻信號的方法的說明性示圖。
首先,如參考圖2A到圖2C所描述的,在將處理開始位置P0作為開始點的情況下,使函數D(j)最小的j被獲得,並且W被設定為j。隨後,周期301被複製到周期303,並且周期301和周期302的交叉淡入淡出波形被產生在周期301中。然後,從在3A中示出的原始波形的位置P0到位置P0』的周期被複製到在圖3B中示出的經拉伸的波形。通過如上所述的操作,從在圖3A中示出的原始波形的位置P0到位置P0』的L個樣本變為在圖3B中示出的經拉伸波形的W+L個樣本,並且樣本數變為r倍。在此,利用如下等式2來定義表示樣本數的拉伸率(樣本數的增長率)的r。 ...(等式2) 在此,關於L重寫上述等式2得出如下等式3。
...(等式3) 也就是,從等式3顯然可見,當期望將原始波形的樣本數乘以r時,可以通過利用如下等式4指定位置P0』來實現。
P0′=P0+L ...(等式4) 此外,通過定義如下式5所示的參數Rs,樣本數L可以被表示為如下等式6。
...(等式5) ...(等式6) 通過使用如上文所定義的Rs,使得能夠實現諸如原始波形「以Rs倍速度被回放」之類的表達。在下文中,Rs將被稱作「語速轉換率」。
當完成了對原始波形的位置P0到位置P0』的處理時,位置P0』被切換到將被視為進行處理的新的開始點的位置P1,並且相同處理被重複。通過重複這樣的處理,原始波形可以被拉伸。
在如圖3A和3B所示的示例中,樣本數L近似是2.5W,因此,根據等式2和5,語速轉換率Rs近似是0.7。也就是,如圖3A和3B所示的示例對應於具有近似0.7倍速度的慢回放。
(根據PICOLA對波形進行壓縮的處理) 隨後,通過參考圖4A到圖5B,來描述通過PICOLA對波形進行壓縮的處理。
圖4A到4D是示出通過使用PICOLA來壓縮音頻信號的示例的說明性視圖。根據PICOLA,首先,從如圖4A所示的原始波形中檢測出具有類似波形的周期A和周期B。如圖4A所示,周期A和周期B是連續並且具有相同長度的兩個周期,並且周期A和周期B的樣本數相同。順便提及,通過參考圖2A到圖2C而描述的方法可以被應用於檢測具有類似波形的周期。隨後,在周期A中淡出的、在圖4B中示出的波形和從周期B開始淡入的、在圖4C中示出的波形被生成。然後,通過相加在圖4B和圖4C中示出的所生成波形,可以獲得在圖4D中示出的壓縮波形。通過如上所述的處理,在圖4A中示出的原始波形的周期A和周期B變為在圖4D中示出的壓縮波形的周期A×B。
隨後,通過參考圖5A和圖5B,來描述利用PICOLA來將音頻信號壓縮到任意長度的方法。圖5A和圖5B是示出通過PICOLA來壓縮音頻信號的方法的說明性示圖。
首先,如參考圖2A到圖2C所描述的,在將處理開始位置P0作為開始點的情況下,使函數D(j)最小的j被獲得,並且W被設定為j。隨後,周期501和周期502的交叉淡入淡出波形被產生在周期502中。然後,其中從在圖5A中示出的原始波形的位置P0到位置P0』的周期中排除周期501的剩餘周期被複製到在圖5B中示出的壓縮波形。通過上述操作,從在圖5A中示出的原始波形的位置P0到位置P0』的W+L個樣本變為在圖5B中示出的壓縮波形的L個樣本,並且樣本數變為r倍。在此,利用如下等式7來定義表示樣本數的壓縮率的r。
...(等式7) 在此,關於L重寫上述等式7得出如下等式8。
...(等式8) 也就是,從等式8顯然可見,當期望將原始波形的樣本數乘以r時,可以通過利用如下等式9指定位置P0』來實現。
P0′=P0+(W+L) ...(等式9) 此外,通過定義如下式10所示的參數Rs,樣本數L可以被表示為如下等式11。
...(等式10) ...(等式11) 通過使用如上文所定義的Rs,使得能夠實現諸如原始波形「以Rs倍速度被回放」之類的表達。當完成了對原始波形的位置P0到位置P0』的處理時,位置P0』被切換到將被視為進行處理的新的開始點的位置P1,並且相同處理被重複。通過重複這樣的處理,原始波形可以被壓縮。
在如圖5A和5B所示的示例中,樣本數L近似是1.5W,因此,根據等式7和10,語速轉換率Rs近似是1.7。也就是,如圖5A和5B所示的示例等價於具有近似1.7倍速度的快回放。
(根據PICOLA對信號進行拉伸的處理流程) 隨後,通過參考圖6,來簡要描述根據PICOLA對信號進行拉伸的處理流程。圖6是示出利用PICOLA來拉伸音頻信號的處理流程的流程圖。
首先,根據PICOLA,判斷在實現了PICOLA的信息處理裝置等的輸入緩衝器中是否存在待處理的音頻信號(步驟S601)。在此,如果判斷不存在待處理的音頻信號,那麼處理終止。然而,如果判斷存在待處理的音頻信號,那麼在使處理開始位置P作為開始點的情況下獲得使函數D(j)最小的j,並且W被設定為j(步驟S602)。隨後,根據PICOLA,根據由使用者所指定的語速轉換率Rs來獲得L(步驟S603),並且對應於從處理開始位置P起的W個樣本的周期A被輸出到實現了PICOLA的信息處理裝置等的輸出緩衝器(步驟S604)。
接下來,根據PICOLA,具有從處理開始位置P起的W個樣本的周期A與具有從周期A起連續的下一組W個樣本的周期B之間的交叉淡入淡出被獲得,並且被置於周期A中(步驟S605)。隨後,輸入緩衝器的具有從位置P起的L個樣本的信號被輸出到輸出緩衝器(步驟S606)。隨後,PICOLA將處理開始位置P移至P+L(步驟S607),並且返回到步驟S601以重複處理。通過重複這樣的處理直到在輸入緩衝器中不再有待處理的音頻信號,可以執行對音頻信號的拉伸處理。
(根據PICOLA對信號進行壓縮的處理流程) 隨後,通過參考圖7,來簡要描述根據PICOLA對信號進行壓縮的處理流程。圖7是示出利用PICOLA來壓縮音頻信號的處理流程的流程圖。
首先,根據PICOLA,判斷在實現了PICOLA的信息處理裝置等的輸入緩衝器中是否存在待處理的音頻信號(步驟S701)。在此,如果判斷不存在待處理的音頻信號,那麼處理終止。然而,如果判斷存在待處理的音頻信號,那麼在使處理開始位置P作為開始點的情況下獲得使函數D(j)最小的j,並且W被設定為j(步驟S702)。隨後,根據PICOLA,根據由使用者所指定的語速轉換率Rs來獲得L(步驟S703)。
接下來,具有從處理開始位置P起的W個樣本的周期A與具有從周期A起連續的下一組W個樣本的周期B之間的交叉淡入淡出被獲得,並且被置於周期B中(步驟S704)。隨後,輸入緩衝器的具有從位置P+W起的L個樣本的信號被輸出到輸出緩衝器(步驟S705)。隨後,PICOLA將處理開始位置P移至P+(W+L)(步驟S706),並且返回到步驟S701以重複處理。通過重複這樣的處理直到在輸入緩衝器中不再有待處理的音頻信號,可以執行對音頻信號的壓縮處理。
(根據PICOLA的語速轉換裝置的配置) 接下來,通過參考圖8,來描述根據PICOLA的語速轉換裝置的配置。圖8是示出根據PICOLA的語速轉換裝置的配置的框圖。順便提及,在以下描述中,在圖1A和圖4A中的周期A和周期B的周期長度被稱作類似波形長度。
如圖8所示,根據PICOLA的信息處理裝置800例如包括輸入緩衝器801、類似波形長度檢測部分802、連接信號生成部分803和輸出緩衝器804。
輸入緩衝器801,在緩衝被輸入到信息處理裝置800的音頻信號的同時,將所輸入的音頻信號發送到隨後將描述的類似波形長度檢測部分802和連接信號生成部分803,並且將根據語速轉換率Rs而生成的音頻信號輸出到輸出緩衝器804。順便提及,將被輸入到輸入緩衝器801的音頻信號可以是直接被輸入到信息處理裝置800的數位訊號,或者是被信息處理裝置800 AD(模擬到數字)轉換到數位訊號的模擬信號。
具體地,基於由隨後將描述的類似波形長度檢測部分802所檢測到的類似波形長度W,輸入緩衝器801將2W個樣本的音頻信號傳送到連接信號生成部分803。根據語速轉換率Rs,輸入緩衝器801將由連接信號生成部分803所生成的連接信號存儲到輸入緩衝器801中的適當位置中。此外,根據語速轉換率Rs,輸入緩衝器801將輸入緩衝器801中的音頻信號發送到輸出緩衝器804。
關於被輸入到輸入緩衝器801的音頻信號,類似波形長度檢測部分802檢測使函數D(j)最小的參數j,並且所檢測到的參數j被設定為類似波形長度W(W=j)。所檢測到的類似波形長度W被發送到輸入緩衝器801。順便提及,所檢測到的類似波形長度W可以直接被輸出到隨後將描述的連接信號生成部分803。此外,所檢測到的類似波形長度W可以被存儲在被配置為RAM、存儲設備等的存儲部分(未示出)中。
通過使用從輸入緩衝器801發送的音頻信號和類似波形長度W,連接信號生成部分803生成將被用於音頻信號的拉伸/壓縮處理中的連接信號,並且將所生成的連接信號發送到輸入緩衝器801。具體地,連接信號生成部分803將所接收的2W個樣本的音頻信號交叉淡入淡出為W個樣本,並且將經交叉淡入淡出的信號發送到輸入緩衝器801。此外,可以將所生成的連接信號存儲在被配置為RAM、存儲設備等的存儲部分(未示出)中。
輸出緩衝器804緩衝由輸入緩衝器801所生成的音頻信號,並且在輸出緩衝器804上執行拉伸/壓縮處理。被執行了拉伸/壓縮處理的音頻信號在經過DA(數字到模擬)轉換後,經由諸如揚聲器之類的輸出設備作為輸出音頻信號被輸出。
(類似波形長度檢測流程) 隨後,通過參考圖9和圖10,來詳細描述檢測類似波形長度的處理。圖9和圖10是示出檢測類似波形長度的處理的流程圖。
關於檢測類似波形長度,首先,作為參數的索引值j被設定為初始值WMIN(步驟S901)。在此,如上所述,WMIN是在其中搜索類似波形的搜索範圍的最小值。當設定了類似波形長度搜索的初始值時,如圖10所示的子程序在實現了PICOLA的信息處理等中被執行(步驟S902)。如隨後將描述的,該子程序是,用於計算用以判斷波形之間的相似性的函數D(j)的子程序。在此,D(j)是通過如下等式12被給出的函數。...(等式12) 在此,在上述等式12中,f是輸入音頻信號,並且例如在如圖2A到圖2C所示的示例中,在使位置P0作為開始點的情況下,它指示樣本。順便提及,等式1和等式12表示相同問題。
隨後,通過子程序而獲得的函數D(j)的值被指定給變量min,並且索引j被指定給W(步驟S903)。然後,索引j被增大1(步驟S904)。接下來,判斷索引j是否小於WMAX(步驟S905)。如果不小於WMAX(也就是,如果超過WMAX),那麼處理終止,並且當終止處理時在變量W中存儲的值是使函數D(j)最小的索引j,也就是,類似波形長度,並且此時變量min的值是函數D(j)的最小值。
此外,如果索引j小於WMAX,那麼通過上述的子程序,針對新的索引j的函數D(j)被獲得(步驟S906)。接下來,判斷針對新的索引j而獲得的函數D(j)的值是否小於min(步驟S907)。在此,如果函數D(j)的值小於min,那麼函數D(j)的值被指定給變量min,並且索引j被指定給W(步驟S908),然後處理返回步驟S904。此外,如果函數D(j)的值不小於min(也就是,如果超過min),那麼處理返回步驟S904。通過執行這樣的處理,輸入音頻信號的類似波形部分可以被搜索到,並且類似波形長度可以被檢測到。
(函數D(j)的值的計算) 隨後,通過參考圖10,來詳細描述用於計算函數D(j)的子程序流程,該函數D(j)用於判斷波形之間的相似性。
當子程序的處理開始時,首先,索引i和變量s被設定為0(步驟S1001)。接下來,判斷索引i是否小於索引j(步驟S1002)。如果索引i小於索引j,那麼執行隨後將描述的步驟S1003,並且如果索引i不小於索引j(也就是,如果索引i等於或大於索引j),那麼執行隨後將描述的步驟S1005。在此,索引j與如圖9所示的流程圖中的索引j相同。
在步驟S1003,輸入音頻信號的差被平方,然後與變量s相加。然後,索引i被增大1(步驟S1004),並且處理返回步驟S1002。此外,在步驟S1005,變量s被除以索引j,並且商被作為函數D(j)的值,然後子程序終止。
(交叉淡入淡出信號的生成) 隨後,通過參考圖11,來詳細描述在連接信號生成部分803中執行的生成交叉淡入淡出信號的方法。圖11是示出生成交叉淡入淡出信號的處理示例的流程圖。
關於生成交叉淡入淡出信號,首先,索引i被設定為0(步驟S1101)。接下來,比較索引i和類似波形長度W(步驟S1102),並且如果索引i不小於W(也就是,如果索引i等於或大於W),那麼處理終止。此外,如果索引i小於W,那麼將被用於淡入和淡出的係數h被獲得(步驟S1103)。當完成了對係數h的計算時,淡入的信號x(i)被乘以係數h,並且淡出的信號y(i)被乘以(1-h),並且這些信號的和被指定給z(i)(步驟S1104)。例如,在如圖1A到1D所示的示例中,周期A中的信號對應於x(i),並且周期B中的信號對應於y(i)。此外,在如圖4A到4D所示的示例中,周期B中的信號對應於x(i),並且周期A中的信號對應於y(i)。以這樣的方式生成的信號z(i)被作為交叉淡入淡出信號。在接下來的處理中,索引i被增大1(步驟S1105),並且處理返回到步驟S1102。通過重複這樣的處理,交叉淡入淡出信號可以被算出。
如在上文中參考圖1A到圖11所描述的,通過語速轉換算法,PICOLA,使得能夠通過任意的語速轉換率Rs(Rs<1.0,1.0<Rs)來拉伸/壓縮音頻信號,並且能夠關於語音信號實現尤其良好的聲音質量。此外,如果語速轉換率Rs是1.0,那麼信息處理裝置800可以將輸入音頻信號如其原樣地用作輸出音頻信號。
(關於語速轉換處理的考慮) 甚至在利用如上所述的語速轉換的數字內容回放裝置普及之前,針對用於盒式磁帶的模擬回放裝置等,已經存在可變地設定回放速度的裝置。然而,通過這樣的模擬回放裝置,聲音音高與回放速度成比例地改變,並且當回放速度被減緩時,聲音音高降低,並且當回放速度被加快時,聲音音高升高。
例如,當回放內容主要由諸如用於語言學習的內容或新聞節目之類的語音構成時,如果聲音音高改變,那麼出現語音內容變得很難理解的問題。此外,作為另一個問題,即使聲音音高僅略微地改變,識別說話人也變得很難。在其中知道哪個語音由哪個人物發出很重要的內容中,例如戲劇內容等,對於使用者而言,很難通過以不同速度回放的語音來識別說話人是回放裝置的缺點。此外,還存在一個問題,即就音樂內容而言,甚至聲音音高的輕微改變也會很大程度上改變音樂的情緒。在下文中,將描述如上所述的由於在以不同速度回放時聲音音高的改變而引出的問題,該問題被稱作第一問題。
在維持恆定的聲音音高的同時可變地設定回放速度的變速回放,即近年來在許多數字內容回放裝置中實現的變速回放功能,解決了第一問題。在回放速度的範圍大約是0.5到4.0倍速度的情況下,可以獲得尤其良好的結果。在下文中,其中獲得了尤其良好的結果的這個範圍被稱作第一範圍,並且沒有落入第一範圍內的範圍(即低於第一範圍的下限的範圍和高於第一範圍的上限的範圍)將被稱作第二範圍。容易理解,第一範圍根據內容而改變。例如,如果內容的說話人的語速較慢,那麼即使回放速度被大大加快也可以理解內容。然而,如果內容的說話人的語速較快,那麼即使回放速度僅略微被加快也很難理解內容。
另一方面,還存在以諸如10或20倍速度之類的高速來回放聲音的需求。例如,雖然由用於盒式磁帶的模擬回放裝置等所提供的變速回放功能具有第一問題,但是即使當以高速回放時也能夠概略地領會內容。對內容的概略領會是諸如「有個人正在說話」、「音樂正在播放」或「沒有聲音」之類的領會。即使是這個級別的領會,在目標內容中急速搜索期望部分時也是十分有用的。
此外,因為回放速度被加快越多,聲音音高變得越高,所以能夠根據聲音音高在聽覺上感受到近似的回放速度。存在如下的優點通過在聽覺上識別近似的回放速度,能夠本能地感受到內容中的每個事件之間的時間位置關係(例如,諸如「有個人正在說話」、「音樂正在播放」或「沒有聲音」之類的事件,等等)。因此,當在目標內容中搜索期望部分時,很容易控制回放速度,例如,「該部分好像不相關所以讓我們加快回放速度」或者「該部分好像相關所以讓我們減緩回放速度」。因此,當在目標內容中急速搜索期望部分時十分有用。
(基礎技術轉換聲音音高的處理) 在下文中,將考慮其中聲音音高與回放速度成比例地改變的數字內容回放裝置,例如,用於盒式磁帶的模擬回放裝置。作為將被用於與回放速度成比例地改變聲音音高的方法的示例,例如,有用於轉換採樣率的方法。在下文中,通過參考圖12和圖13,來簡要描述用於轉換採用率的方法示例。
(降低採樣率的方法) 圖12是示出用於降低採樣率的方法的說明性示圖(下採樣方法)。圖12的(a)是待處理的原始信號,其中T是採樣周期並且fs是採樣頻率。
在採樣率轉換過程中,首先,原始信號(a)通過低通濾波器(LPF)1201。低通濾波器1201是將截止頻率設定為fs/(2M)的濾波器。原始信號(a)被低通濾波器1201濾波為信號(b)。如圖12的(b)所示,原始信號(a)的波形通過低通濾波器1201變得平滑。隨後,下採樣器1202從信號(b)中間隔剔除(thin out)M-1個樣本並針對每M個樣本留下一個樣本。在如圖12所示的示例中,M是2。因此獲得的信號(c)具有採樣率fs/M,即原始信號(a)的採樣率的1/M倍。此外,信號(c)的樣本數也是原始信號(a)的樣本數的的1/M倍。當低通濾波器1201沒有被用於上述操作中時,在信號(c)中可能生成混迭分量(aliasing component)。如圖12所示的包括低通濾波器1201和下採樣器1202的配置被稱作抽取器(decimator)。
(提高採樣率的方法) 圖13是示出用於提高採樣率的方法的說明性示圖(上採樣方法)。圖13的(a)是待處理的原始信號,其中T是採樣周期並且fs是採樣頻率。
在採樣率轉換過程中,首先,預定數目的零值被插入原始信號(a)中。具體地,上採樣器1301將L-1個零值插入到原始信號(a)的每個樣本之間。在如圖13所示的示例中,L是2。圖中,經上採樣的信號是信號(b)。信號(b)具有fsL的採樣率,所述fsL是L乘以原始信號(a)的採樣率。此外,信號(c)的樣本數也是L乘以原始信號(a)的樣本數。隨後,隨著信號(b)通過低通濾波器1302,信號(c)生成。低通濾波器1302是將截止頻率設定為fs/2的濾波器。此外,在通過低通濾波器1302對信號(b)進行處理後,經處理的信號的振幅可以被調節。當低通濾波器1302沒有被用於如上所述的操作中時,在信號(c)中生成鏡像分量。如圖13所示的包括上採樣器1301和低通濾波器1302的配置被稱作內插器。
如圖12所示的抽取器和如圖13所示的內插器僅能夠轉換整數比值的採樣率。然而,通過結合這兩種配置,使得能夠進行有理數採樣率的轉換。例如,使內插器的參數L為3,並且使抽取器的參數M為2。首先由內插器來處理原始信號以獲得經處理的信號1。隨後,由抽取器來進一步處理經處理的信號以獲得經處理的信號2。因此獲得的經處理信號2以因子3被上採樣,然後被下採樣到1/2,因此採樣率被轉換為原始信號的採樣率的3/2倍。因此,通過結合抽取器和內插器,使得能夠實現L/M倍的採樣率轉換。
圖14A到圖14C是示出與回放速度成比例地升高聲音音高的處理示例的說明性示圖。首先,通過根據回放速度利用抽取器和內插器來轉換採樣率,將在圖14A中示出的採樣率為fs(=1/T)的原始信號轉換為在圖14B中示出的採樣率為fs』(=1/T』)的信號。隨後,在圖14B中示出的採樣率為fs』(=1/T』)的信號的採樣頻率被在圖14A中示出的原始信號的採樣頻率fs(=1/T)取代,並且使其變為在圖14C中示出的信號。因此獲得的在圖14C中示出的信號的聲音音高根據回放速度的改變量,高於在圖14A中示出的原始信號的聲音音高。如圖14A到圖14C所示的示例示出其中回放速度是2倍的示例。在圖14B中示出的信號的採樣頻率是在圖14A中示出的原始信號的採樣頻率的1/2倍。此外,在圖14C中示出的信號的聲音音高是在圖14A中示出的原始信號的聲音音高的2倍,並且在圖14C中示出的信號的樣本數是在圖14A中示出的原始信號的樣本數的1/2倍。
(本實施例的描述) 在以下描述中,其中聲音音高與回放速度成比例地改變的回放裝置將被稱作「相關技術的第一回放裝置」,並且其中當回放速度改變時恆定的聲音音高被維持的回放裝置將被稱作「相關技術的第二回放裝置」。
(相關技術的第一回放裝置) 圖15A是示出在相關技術的第一回放裝置中回放速度變量因子和語速轉換率之間關係的坐標圖,並且圖15B是示出在相關技術的第一回放裝置中回放速度變量因子和聲音音高之間關係的坐標圖。在此,圖15A的回放速度變量因子代表回放速度與正常回放速度的比值。例如,當以2倍的正常回放速度進行回放時,回放速度變量因子是2,並且當以一半的正常回放速度進行回放時,回放速度變量因子是0.5。此外,圖15B的聲音音高代表頻率與正常回放時的頻率的比值。例如,當以2倍的正常回放頻率進行回放時,聲音音高是2,並且當以一半的正常回放頻率進行回放時,聲音音高是0.5。
在相關技術的第一回放裝置中,因為沒有執行語速轉換,所以如圖15A所示,語速轉換率是1並且恆定。此外,如圖15B所示,在相關技術的第一回放裝置中,聲音音高與回放速度變量因子成比例,並且一般地,聲音音高等於回放速度變量因子。
順便提及,圖15A和圖15B僅示出以正常速度或以比正常速度更快的速度(換言之,回放速度變量因子為1或更大)來進行回放的情況。在下文中,為了避免自變量變得複雜,將討論比正常速度更快的回放速度。然而,顯然,針對以小於正常速度的速度(例如,0.5倍速度)進行回放的情況,可以做出相同的自變量。
(相關技術的第二回放裝置) 圖16A是示出在相關技術的第二回放裝置中回放速度變量因子和語速轉換率之間關係的坐標圖,並且圖16B是示出在相關技術的第二回放裝置中回放速度變量因子和聲音音高之間關係的坐標圖。在相關技術的第二回放裝置中,因為執行了語速轉換,所以如圖16A所示,語速轉換率與回放速度變量因子成比例,並且一般地,語速轉換率的值等於回放速度變量因子值。此外,如圖16B所示,在相關技術的第二回放裝置中,聲音音高為1並且恆定。
(關於相關技術的語速轉換裝置的再考慮) 在相關技術的第二回放裝置中,即使通過語速轉換生成了具有超出第一範圍的回放速度(換言之,在第二範圍內的回放速度)的聲音,也很難從聽覺上感受到回放速度。例如,通過諸如如上所述的PICOLA之類的語速轉換算法,即使指定了例如10倍或20倍的回放速度,也能夠生成相應聲音。然而,通過語速轉換而獲得的聲音物理上是10倍或20倍的速度,而在聽覺上感覺在10倍速度和20倍速度之間實際沒有差別。換言之,即使加快了速度,正在收聽聲音的收聽者在轉換後也不能夠在聽覺上感受到加速。因此,存在很難在聽覺上感受到第二範圍內的回放速度的問題。這樣的問題被稱作第二問題。
如上所述,就相關技術的第一回放裝置而言,雖然存在第一問題,但是沒有出現第二問題。另一方面,就相關技術的第二回放裝置而言,雖然解決了第一問題,但是出現了第二問題。
因此,本發明的發明人就上述問題進行了認真的研究,並且實現了一種包括變速回放方法的信息處理裝置,該變速回放方法通過在第一範圍內的變速回放使能夠容易領會語音內容或指定說話人,此外,通過在第二範圍內的變速回放使能夠在聽覺上感受到回放速度(換言之,即能夠同時解決第一和第二問題的變速回放)。
(第一實施例) 在下文中,通過參考圖17到圖32,來詳細描述根據本發明第一實施例的信息處理裝置。順便提及,在以下描述中,回放速度變量因子將被稱作第一參數,語速轉換率將被稱作第二參數,並且聲音音高將被稱作第三參數。
(回放速度轉換系統) 圖17是示出包括根據本實施例的信息處理裝置1701的回放速度轉換系統的說明性示圖。如圖17所示,在回放速度轉換系統中,作為用於控制回放速度變量因子的裝置的信息處理裝置1701,可以經由諸如網際網路和家用網絡之類的各種網絡1702連接到內容伺服器1703和客戶端裝置1704。此外,諸如AV設備(例如電視、DVD錄像機和音樂組件、計算機等)之類的各種外部連接裝置1705可以直接連接到根據本實施例的信息處理裝置1701。
在此,內容伺服器1703是與諸如URL(統一資源定位符)等之類位置信息、元數據等相關聯地來管理包括音頻信號的內容的伺服器。例如,內容伺服器1703可以是諸如電視、DVD錄像機和音樂組件、計算機等之類的AV設備,或者是符合DLNA(數字生活網絡聯盟)規範的DMS(數字媒體伺服器)。此外,客戶端裝置1704是從內容伺服器1703獲得各種內容以進行回放的設備。客戶端裝置1704可以是諸如電視、DVD錄像機和音樂組件、計算機等之類的AV設備,或者是符合DLNA(數字生活網絡聯盟)規範的DMP(數字媒體播放器)。
(根據本實施例的信息處理裝置的配置) 圖18是示出根據本實施例的信息處理裝置1800的配置的框圖。如圖18所示,根據本實施例的信息處理裝置1800主要包括參數調節部分1801、信號處理部分1803和存儲部分1805。在根據本實施例的信息處理裝置1800中,音頻信號和代表回放速度變量因子的第一參數R被輸入,並且其回放速度變量因子受第一參數R控制的音頻信號被作為輸出信號輸出。
順便提及,在以下描述中,描述其中音頻信號從信息處理裝置1800的外部被輸入的情況。然而,本實施例並不局限於這樣的情況,並且音頻信號可以被存儲在信息處理裝置1800中。
參數調節部分1801例如被配置為CPU(中央處理單元)、ROM(只讀存儲器)、RAM(隨機存取存儲器)等,並且根據從外部輸入的第一參數R來調節第二參數Rs和第三參數Rp。隨後將詳細描述根據第一參數R來設定第二參數Rs和第三參數Rp的方法。參數調節部分1801將根據第一參數R而確定的第二參數Rs和第三參數Rp發送到隨後將描述的信號處理部分1803。
信號處理部分1803例如被配置為CPU、ROM、RAM等,並且基於所輸入的音頻信號和第一參數R以及從參數調節部分1801發送來的第二參數Rs和第三參數Rp,來調節音頻信號的語速和聲音音高。此外,信號處理部分1803將被調節了語速和聲音音高的音頻信號作為輸出音頻信號輸出。信息處理裝置1800通過未示出的DA轉換器將這樣的輸出音頻信號轉換為模擬信號,並且將該模擬信號從諸如揚聲器之類的輸出設備輸出。
存儲部分1805例如被配置為RAM、存儲設備等,並且存儲在根據第一參數R來確定第二參數Rs和第三參數Rp時所使用的各種資料庫、將由信息處理裝置1800執行的各種程序等。此外,除這些數據外,存儲部分1805可以視需要存儲當信息處理裝置1800執行處理、處理的中間進程等時需要存儲的參數。參數調節部分1801、信號處理部分1803等可以在存儲部分1805中自由地執行讀取或寫入數據。
(第一參數與第二參數以及與第三參數的關係) 隨後,通過參考圖19A和圖19B,來詳細描述根據本實施例的參數調節部分1801。圖19A是示出第一參數R和第二參數Rs之間關係的坐標圖,並且圖19B是示出第一參數R和第三參數Rp之間關係的坐標圖。
在如圖19A和圖19B所示的示例中,當第一參數R是1到4時,也就是,當以1到4倍的速度進行回放時,僅執行語速轉換(區間1901和區間1903),並且當第一參數R大於4時,也就是,當以大於4倍的速度進行回放時,隨同對語速進行轉換一起來升高聲音音高(區間1902和區間1904)。通過執行這樣的處理,當以1到4倍的速度進行回放時,說話人的語速根據回放速度逐漸加快,並且當以大於4倍的速度進行回放時,在說話人語速加快的同時逐漸升高聲音音高。
順便提及,在圖19A中,以虛線示出區間1902,因為第二參數Rs的值根據改變聲音音高的方法而改變。當將如圖12到14所示的方法用作改變聲音音高的方法時,樣本數隨著聲音音高的升高而減少,從而導致區間1902的虛線。然而,當將其中樣本數不減少的方法或者其中減少量較小的方法用作改變聲音音高的方法時,將與如圖19所示的虛線不同地設定區間1902。
在圖19B的區間1903中,當第一參數R是1到4時,第三參數Rp是1並且恆定。然而,在該區間中的第三參數Rp不一定是恆定的。此外,在區間1904中第三參數Rp的上坡度並不局限於如圖所示的示例,並且它可以是任意的,只要第三參數Rp具有大於0的上坡度。此外,在圖19A和圖19B中,雖然第二參數Rs和第三參數Rp以連續的方式(模擬地)改變,但是第二參數Rs和第三參數Rp也可以以離散的方式(數字地)改變。
(參數調節部分1801) 在根據本實施例的信息處理裝置1800中,如圖19A和圖19B所示的第一參數R與第二參數Rs以及與第三參數Rp的關係的資料庫例如被存儲在存儲部分1805中,並且參數調節部分1801通過參考這樣的資料庫,根據第一參數R來確定第二參數Rs和第三參數Rp。
參數調節部分1801在如下所述的四個條件下,通過參考如圖19A和圖19B所示的的資料庫,根據第一參數R來確定第二參數Rs和第三參數Rp。
條件1當所輸入的第一參數R存在於區間1901中時,將第二參數Rs確定為與第一參數R成比例(換言之,確定第二參數Rs以使得第二參數Rs等於第一參數R)。
條件2當所輸入的第一參數R存在於區間1903中時,將第三參數Rp恆定地設定為1。
條件3當所輸入的第一參數R存在於區間1904中時,第三參數Rp隨第一參數R的增大而增大。
條件4第一參數R=第二參數Rs×樣本數的增長率Rd。
在此,區間1901和區間1903對應於第一參數R的第一範圍,並且區間1902和區間1904對應於第一參數R的第二範圍。
此外,當在改變聲音音高的方法中樣本數的增長率是Rd時,參數調節部分1801的第一範圍和第二範圍二者具有如上述條件4所指示的特性。在此,例如,當樣本數是2倍時,增長率是2,並且當樣本數被減少到一半時,增長率是1/2。
(根據本實施例的控制回放速度變量因子的方法) 圖20是示出根據本實施例的信息處理裝置1800的處理流程的流程圖。首先,信息處理裝置1800判斷是否存在輸入音頻信號(步驟S2001),並且當不存在輸入音頻信號時,處理終止。此外,當輸入音頻信號存在時,信息處理裝置1800的參數調節部分1801根據所輸入的第一參數R來調節第二參數Rs和第三參數Rp(步驟S2002)。以滿足上述條件1到4的方式來執行調節。隨後,信息處理裝置1800的信號處理部分1803根據經調節的第二參數Rs和第三參數Rp來調節輸入音頻信號的語速和聲音音高(步驟S2003)。隨後,信息處理裝置1800輸出語速和聲音音高經過調節的音頻信號(步驟S2004)。然後,返回到步驟S2001,上述處理被重複。
通過重複這樣的處理,根據本實施例的信息處理裝置1800被使得能夠控制音頻信號的回放速度變量因子。
如參考圖18到圖20所描述的,根據本實施例的控制回放速度變量因子的方法,能夠在第一參數R的第一範圍內僅調節語速,並且在第一參數R的第二範圍內隨同語速一起來調節聲音音高。因此,在第一參數R的第一範圍內解決了第一問題,並且在第一參數R的第二範圍內解決了第二問題。
(信號處理部分1803) 隨後,通過參考圖21,來詳細描述根據本實施例的信號處理部分1803的示例。圖21是示出根據本實施例的信號處理部分1803的功能的框圖。
如圖21所示,例如,根據本實施例的信號處理部分1803主要包括擬聲聲音(onomatopoeic sound)切換判斷部分2101、語速轉換部分2103、音高調節部分2105和音頻信號輸出控制部分2107。
擬聲聲音切換判斷部分2101例如被配置為CPU、ROM、RAM等,並且基於所發送的第一參數R,判斷是對輸入音頻信號執行諸如語速和聲音音高轉換之類的信號處理,還是將輸入音頻信號切換到擬聲聲音而不執行信號處理。具體地,擬聲聲音切換判斷部分2101將第一參數R的等級與預定閾值進行比較,並且當第一參數R大於預定閾值(例如,以大於20倍的速度回放)時,判斷將音頻信號切換到預定擬聲聲音而不執行語速和聲音音高的轉換。擬聲聲音切換判斷部分2101將判斷結果發送到隨後將描述的語速轉換部分2103和音頻信號輸出控制部分2107。
語速轉換部分2103例如被配置為CPU、ROM、RAM等。輸入音頻信號和由參數調節部分1801確定的第二參數Rs被輸入到語速轉換部分2103,並且語速轉換部分2103基於第二參數Rs來轉換輸入音頻信號的語速。例如,利用如圖1到圖7所示的算法來執行語速轉換。語速轉換部分2103將語速經過調節的音頻信號發送到隨後將描述的音高調節部分2105。
此外,當被擬聲聲音切換判斷部分2101通知「將音頻信號切換到擬聲聲音」的判斷結果時,語速轉換部分2103不必執行轉換語速的處理。
音高調節部分2105例如被配置為CPU、ROM、RAM等,並且基於從語速轉換部分2103發送來的、語速經過調節的音頻信號以及從參數調節部分1801發送來的第三參數Rp,來調節音頻信號的聲音音高。音高轉換的任意方法,例如,如圖12到圖14C所示的方法,可以用於音高調節。當完成了聲音音高調節時,音高調節部分2105將語速和聲音音高經過調節的音頻信號輸出到隨後將描述的音頻信號輸出控制部分2107。
順便提及,當如圖12到圖14C所示的方法被音高調節部分2105使用時,該方法中用於改變聲音音高的樣本數的增長率Rd與聲音音高成比例,並且樣本數的增長率Rd變得等於聲音音高的上升率。也就是,Rd=第三參數Rp的關係成立。
音頻信號輸出控制部分2107例如被配置為CPU、ROM、RAM等,並且當輸出所輸入的音頻信號或者從音高調節部分2105發送來的音頻信號時控制輸出。當被擬聲聲音切換判斷部分2101通知「將音頻信號切換到擬聲聲音」的判斷結果時,音頻信號輸出控制部分2107將所輸入的音頻信號切換到例如被存儲在存儲部分1805中的預定擬聲聲音並輸出信號。此外,當被擬聲聲音切換判斷部分2101通知「不將音頻信號切換到擬聲聲音」的判斷結果時,音頻信號輸出控制部分2107輸出從音高調節部分2105發送的音頻信號。
此外,音頻信號輸出控制部分2107可以調節待輸出的音頻信號的音頻音量。通過調節指定音頻信號的信號波形的絕對值來執行對音頻信號的音頻音量的調節。當回放速度變量因子超過1時,音頻信號輸出控制部分2107可以調小音頻信號的音頻音量。此外,音頻信號輸出控制部分2107可以獨立於回放速度來控制音頻音量。
圖22A和圖22B是示出由包括如圖21所示的信號處理部分1803的信息處理裝置1800的參數調節部分1801所執行的參數調節方法示例的說明性示圖。圖22A是示出第一參數R和第二參數Rs之間關係的坐標圖,並且圖22B是示出第一參數R和第三參數Rp之間關係的坐標圖。
如圖22A所示,橫軸代表第一參數R並且縱軸代表第二參數Rs的坐標圖被配置為具有第二參數Rs的不同上升率(換言之,坐標圖的坡度(gradient))的至少兩個區域。類似地,如圖22B所示,橫軸代表第一參數R並且縱軸代表第三參數Rp的坐標圖被配置為具有第三參數Rp的不同上升率的至少兩個區域。
當信號處理部分1803的音高調節部分2105通過如圖12到圖14C所示的方法來調節音高時,參數調節部分1801在下述的四個條件下,通過參考在存儲部分1805中存儲的、如圖22A和圖22B所示的資料庫,根據第一參數R來確定第二參數Rs和第三參數Rp。
條件1當所輸入的第一參數R存在於區間2201中時,將第二參數Rs確定為與第一參數R成比例(換言之,確定第二參數Rs以使得第二參數Rs等於第一參數R)。
條件2當所輸入的第一參數R存在於區間2203中時,將第三參數Rp恆定地設定為1。
條件3當所輸入的第一參數R存在於區間2204中時,第三參數Rp隨第一參數R的增大而增大。
條件4』第一參數R=第二參數Rs×第三參數Rp在第一範圍和第二範圍內均成立。
在此,區間2201和區間2203對應於第一參數R的第一範圍,並且區間2202和區間2204對應於第一參數R的第二範圍。
在如圖22A和圖22B所示的示例中,當第一參數R是1到4時,即當以1到4倍的速度回放時,僅執行語速轉換,並且當第一參數R大於4時,即當以大於4倍的速度進行回放時,隨同對語速進行轉換一起來升高聲音音高。通過執行這樣的處理,當以1到4倍的速度進行回放時,說話人的語速根據回放速度逐漸加快,並且當以大於4倍的速度進行回放時,在說話人語速加快的同時逐漸升高聲音音高。
至此,已經描述了根據本實施例的信息處理裝置1800的功能示例。上述結構元件的每個可以被配置為通用組件或電路,或者可以被配置為專用於每個結構元件的功能的硬體。此外,CPU等可以執行所有的功能。因此,能夠根據實現本實施例的各種技術水平來適當改變待使用的配置。
(根據本實施例的信號處理方法) 隨後,通過參考圖23,來詳細描述根據本實施例的信號處理方法。圖23是示出根據本實施例的信號處理方法的流程圖。
首先,信息處理裝置1800判斷是否存在輸入音頻信號(步驟S2301),並且如果沒有輸入音頻信號那麼終止處理。此外,當輸入音頻信號存在時,信號處理部分1803的擬聲聲音切換判斷部分2101判斷所輸入的第一參數R是否大於預定閾值(步驟S2302)。當第一參數R小於預定閾值時,參數調節部分1801根據所輸入的第一參數R來調節第二參數Rs和第三參數Rp(步驟S2303),並且將參數發送到信號處理部分1803。信號處理部分1803的語速轉換部分2103基於所發送的第二參數Rs來調節輸入音頻信號的語速(步驟S2304),並且將語速經過調節的音頻信號輸出到音高調節部分2105。音高調節部分2105基於所發送的第三參數Rp來調節從語速轉換部分2103發送的音頻信號的聲音音高(步驟S2305)。語速和聲音音高經過調節的音頻信號被發送到音頻信號輸出控制部分2107,並且音頻信號輸出控制部分2107輸出語速和聲音音高經過調節的音頻信號(步驟S2306)。然後,返回到步驟S2301,上述處理被重複。
另一方面,當擬聲聲音切換判斷部分2101判斷第一參數R大於預定閾值時,音頻信號輸出控制部分2107輸出被存儲在存儲部分1805等中的預定擬聲聲音,並且將所述擬聲聲音作為音頻信號輸出(步驟S2307)。然後,返回到步驟S2301,上述處理被重複。
通過重複這樣的處理,根據本實施例的信息處理裝置1800被使得能夠以在聽覺上可以識別轉換後的回放速度的方式來控制音頻信號的回放速度變量因子。
隨後,通過關注在待處理的音頻信號中所包括的樣本數,來詳細描述由根據本實施例的信息處理裝置1800所執行的信號處理示例。圖24A到圖24D是以樣本為單位示出由根據本實施例的信息處理裝置1800所執行的信號處理示例的說明性示圖。
在如圖24A到圖24D所示的示例中,當第一參數R是2.5時,第二參數Rs被調節為2.0並且第三參數Rp被調節到1.25。假設在如圖24A所示的原始信號中,作為在將語速轉換的處理開始點P0作為開始點的情況下檢測到類似波形長度的結果,區間2401和區間2402被選作交叉淡入淡出區間。區間2401的信號和區間2402的信號的交叉淡入淡出信號被獲得,並且被置於區間2402中。隨後,區間2402的信號被複製到區間2403的、如圖24B所示的信號,並且語速轉換的處理開始位置從位置P0移至位置P1。通過將在圖24A中示出的原始信號轉換到在圖24B中示出的信號,語速變為2倍速度(樣本數變為1/2倍),並且聲音音高不變。隨後,在圖24B中示出的信號的採樣頻率被變為4/5倍以獲得在圖24C中示出的信號。當採樣頻率變為4/5倍時,樣本數也變為4/5倍。通過用在圖24A中示出的原始信號的採樣頻率來替換在圖24C中示出的信號的採樣頻率,在圖24D中示出的信號被獲得。在圖24D中示出的信號樣本數是0.4=(1/2)x(4/5)倍的在圖24A中示出的原始信號的樣本數,並且聲音音高是5/4倍。換言之,回放速度是2.5=2x(5/4)倍的速度並且聲音音高是1.25倍。
圖25A到圖25D是以樣本為單位示出由根據本實施例的信息處理裝置所執行的信號處理的另一示例的說明性示圖。在如圖25A到圖25D所示的示例中,當第一參數R是4.0時,第二參數Rs被調節為2.0並且第三參數Rp被調節到2.0。假設在如圖25A所示的原始信號中,作為在將語速轉換的處理開始點P0作為開始點的情況下檢測到類似波形長度的結果,區間2501和區間2502被選作交叉淡入淡出區間。區間2501的信號和區間2502的信號的交叉淡入淡出信號被獲得,並且被置於區間2502中。隨後,區間2502的信號被複製到區間2503的、如圖25B所示的信號,並且語速轉換的處理開始位置從位置P0移至位置P1。通過將在圖25A中示出的原始信號轉換到在圖25B中示出的信號,語速變為2倍速度(樣本數變為1/2倍),並且聲音音高不變。隨後,在圖25B中示出的信號的採樣頻率被變為1/2倍以獲得在圖25C中示出的信號。當採樣頻率變為1/2倍時,樣本數也變為1/2倍。通過用在圖25A中示出的原始信號的採樣頻率來替換在圖25C中示出的信號的採樣頻率,在圖25D中示出的信號被獲得。在圖25D中示出的信號樣本數是0.25=(1/2)×(1/2)倍的在圖25A中示出的原始信號的樣本數,並且聲音音高是2倍。換言之,回放速度是4.0=2×2倍的速度並且聲音音高是2倍。
圖26A和圖26B是示出由參數調節部分1801所執行的參數調節方法的其他示例的坐標圖。圖26A是示出第一參數R和第二參數Rs之間關係的坐標圖,並且圖26B是示出第一參數R和第三參數Rp之間關係的坐標圖。
如圖26A所示,橫軸代表第一參數R並且縱軸代表第二參數Rs的坐標圖被配置為具有第二參數Rs的不同上升率(換言之,坐標圖的坡度)的至少兩個區域。類似地,如圖26B所示,橫軸代表第一參數R並且縱軸代表第三參數Rp的坐標圖被配置為具有第三參數Rp的不同上升率的至少兩個區域。
在這種情況下,參數調節部分1801在下述的五個條件下,通過參考在存儲部分1805中存儲的、如圖26A和圖26B所示的資料庫,根據第一參數R來確定第二參數Rs和第三參數Rp。
條件1當所輸入的第一參數R存在於區間2601中時,將第二參數Rs確定為與第一參數R成比例(換言之,確定第二參數Rs以使得第二參數Rs等於第一參數R)。
條件2當所輸入的第一參數R存在於區間2603中時,將第三參數Rp恆定地設定為1。
條件3當所輸入的第一參數R存在於區間2604中時,第三參數Rp隨第一參數R的增大而增大。
條件4』第一參數R=第二參數Rs×第三參數Rp在第一範圍和第二範圍內均成立。
條件5當所輸入的第一參數R存在於區間2602中時,第二參數Rs隨第一參數R的增大而增大(換言之,示出第二參數Rs變化的曲線的導數大於0)。
在此,區間2601和區間2603對應於第一參數R的第一範圍,並且區間2602和區間2604對應於第一參數R的第二範圍。
在如圖26A和圖26B所示的示例中,當第一參數R是1到4時,即當以1到4倍的速度回放時,僅執行語速轉換,並且當第一參數R大於4時,即當以大於4倍的速度進行回放時,隨同對語速進行轉換一起來升高聲音音高。通過執行這樣的處理,當以1到4倍的速度進行回放時,說話人的語速根據回放速度逐漸加快,並且當以大於4倍的速度進行回放時,在說話人語速加快的同時逐漸升高聲音音高。
在如圖26A和圖26B所示的示例中,與如圖22A和圖22B所示的示例不同的,第二參數Rs隨著第一參數R的增大而增大。換言之,示出第二參數Rs變化的曲線的導數大於0。在圖22A的區間2202中,儘管第一參數R增大,但是第二參數Rs恆定。換言之,第二參數Rs的導數為0。在這樣的情況下,儘管回放速度加快但是語速轉換率不變,並且關於所回放的聲音可能會感受到不適。另一方面,在圖26A中的區間2602中,因為第二參數Rs隨第一參數R的增大而增大(因為導數大於0),所以可以防止儘管語速加快但是語速轉換率不變的情況,並且由所回放的聲音所導致的不適可以被防止。
圖27A和圖27B是示出由參數調節部分1801所執行的參數調節方法的其他示例的坐標圖。圖27A是示出第一參數R和第二參數Rs之間關係的坐標圖,並且圖27B是示出第一參數R和第三參數Rp之間關係的坐標圖。
如圖27A所示,橫軸代表第一參數R並且縱軸代表第二參數Rs的坐標圖被配置為具有第二參數Rs的不同上升率(換言之,坐標圖的坡度)的至少兩個區域。類似地,如圖27B所示,橫軸代表第一參數R並且縱軸代表第三參數Rp的坐標圖被配置為具有第三參數Rp的不同上升率的至少兩個區域。
在這種情況下,參數調節部分1801在下述的五個條件下,通過參考在存儲部分1805中存儲的、如圖27A和圖27B所示的資料庫,根據第一參數R來確定第二參數Rs和第三參數Rp。
條件1當所輸入的第一參數R存在於區間2701中時,將第二參數Rs確定為與第一參數R成比例(換言之,確定第二參數Rs以使得第二參數Rs等於第一參數R)。
條件2當所輸入的第一參數R存在於區間2703中時,將第三參數Rp恆定地設定為1。
條件3當所輸入的第一參數R存在於區間2704中時,第三參數Rp隨第一參數R的增大而增大。
條件4』第一參數R=第二參數Rs×第三參數Rp在第一範圍和第二範圍內均成立。
條件6區間2703和區間2704被平滑地連接(換言之,示出第三參數Rp變化的曲線在區間2703和區間2704的連接點處可微分)。
在此,區間2701和區間2703對應於第一參數R的第一範圍,並且區間2702和區間2704對應於第一參數R的第二範圍。
在如圖27A和圖27B所示的示例中,當第一參數R是1到4時,即當以1到4倍的速度回放時,僅執行語速轉換,並且當第一參數R大於4時,即當以大於4倍的速度進行回放時,隨同對語速進行轉換一起來升高聲音音高。通過執行這樣的處理,當以1到4倍的速度進行回放時,說話人的語速根據回放速度逐漸加快,並且當以大於4倍的速度進行回放時,在說話人語速加快的同時逐漸升高聲音音高。
在如圖27A和圖27B所示的示例中,與如圖22A和圖22B所示的示例不同的,在第三參數Rp中,區間2703和區間2704被平滑地連接。換言之,示出第三參數Rp變化的曲線在區間2703和區間2704的連接點處可微分。在如圖22A和圖22B所示的區間2203和區間2204的連接點不可微分的情況下,當第一參數R逐漸增大時,第三參數Rp的單位增大量(微分值)在連接點處激增,並且關於所回放的聲音可能會感到不適。另一方面,在如圖27B中區間2703和區間2704所示的曲線平滑連接的情況下,當第一參數R逐漸增大時,可以防止聲音音高在區間2703和區間2704的連接點處開始激增,並且關於所回放聲音的不適可以被防止。
圖28A和圖28B是示出由參數調節部分1801所執行的參數調節方法的其他示例的坐標圖。圖28A是示出第一參數R和第二參數Rs之間關係的坐標圖,並且圖28B是示出第一參數R和第三參數Rp之間關係的坐標圖。
如圖28A所示,橫軸代表第一參數R並且縱軸代表第二參數Rs的坐標圖被配置為具有第二參數Rs的不同上升率(換言之,坐標圖的坡度)的至少兩個區域。類似地,如圖28B所示,橫軸代表第一參數R並且縱軸代表第三參數Rp的坐標圖被配置為具有第三參數Rp的不同上升率的至少兩個區域。
在這種情況下,參數調節部分1801在下述的六個條件下,通過參考在存儲部分1805中存儲的、如圖28A和圖28B所示的資料庫,根據第一參數R來確定第二參數Rs和第三參數Rp。
條件1當所輸入的第一參數R存在於區間2801中時,將第二參數Rs確定為與第一參數R成比例(換言之,確定第二參數Rs以使得第二參數Rs等於第一參數R)。
條件2當所輸入的第一參數R存在於區間2803中時,將第三參數Rp恆定地設定為1。
條件3當所輸入的第一參數R存在於區間2804中時,第三參數Rp隨第一參數R的增大而增大。
條件4』第一參數R=第二參數Rs×第三參數Rp在第一範圍和第二範圍內均成立。
條件5當所輸入的第一參數R存在於區間2802中時,第二參數Rs隨第一參數R的增大而增大(換言之,示出第二參數Rs變化的曲線的導數大於0)。
條件6區間2803和區間2804被平滑地連接(換言之,示出第三參數Rp變化的曲線在區間2803和區間2804的連接點處可微分)。
在此,區間2801和區間2803對應於第一參數R的第一範圍,並且區間2802和區間2804對應於第一參數R的第二範圍。
在如圖28A和圖28B所示的示例中,當第一參數R是1到4時,即當以1到4倍的速度回放時,僅執行語速轉換,並且當第一參數R大於4時,即當以大於4倍的速度進行回放時,隨同對語速進行轉換一起來升高聲音音高。通過執行這樣的處理,當以1到4倍的速度進行回放時,說話人的語速根據回放速度逐漸加快,並且當以大於4倍的速度進行回放時,在說話人語速加快的同時逐漸升高聲音音高。
在如圖28A和圖28B所示的示例中,與如圖27A和圖27B所示的示例類似地,在第三參數Rp中,區間2803和區間2804被平滑地連接。換言之,示出第三參數Rp變化的曲線在區間2803和區間2804的連接點處可微分。另一方面,在如圖28A和圖28B所示的示例中,與如圖27A和圖27B所示的示例不同的,第二參數Rs隨第一參數R的增大而增大。換言之,示出第二參數Rs變化的曲線的導數大於0。在圖27A的區間2702中,儘管第一參數R增大,但是存在第二參數Rs減小的部分。換言之,存在示出第二參數Rs變化的曲線的導數為負的部分。在這樣的情況下,儘管回放速度加快但是語速轉換率減小,並且關於所回放的聲音可能感到不適。另一方面,在圖28A的區間2802中,因為第二參數Rs隨著第一參數R的增大而增大(因為導數大於0),所以可以防止儘管語速加快但是語速轉換率減小的情況,並且關於所回放的聲音的不適可以被防止。
如上所述,通過當轉換所輸入音頻信號的回放速度變量因子時,在調節聲音音高之前轉換語速,可以在語速轉換中更精確地執行對輸入音頻信號的類似波形長度的檢測,並且能夠將輸出音頻信號的聲音質量維持在其最佳狀態。
(信號處理部分1803的修改示例) 隨後,通過參考圖29,來詳細描述根據本實施例的信號處理部分1803的修改示例。圖29是示出根據本實施例的信號處理部分1803的修改示例的框圖。
如圖29所示,例如,根據該修改示例的信號處理部分1803主要包括擬聲聲音切換判斷部分2101、音高調節部分2901、語速轉換部分2903和音頻信號輸出控制部分2107。
除了擬聲聲音切換判斷部分2101將判斷結果輸出到音高調節部分2901和音頻信號輸出控制部分2107外,擬聲聲音切換判斷部分2101具有與根據本發明第一實施例的擬聲聲音切換判斷部分相同的配置和功能,因此,省略其詳細描述。
音高調節部分2901例如被配置為CPU、ROM、RAM等,並且基於所發送的輸入音頻信號以及從參數調節部分1801發送來的第三參數Rp,來調節音頻信號的聲音音高。音高轉換的任意方法,例如,如圖12到圖14C所示的方法,可以用於音高調節。當完成了聲音音高調節時,音高調節部分2901將聲音音高經過調節的音頻信號輸出到隨後將描述的語速轉換部分2903。
順便提及,當如圖12到圖14C所示的方法被音高調節部分2901使用時,該方法中用於改變聲音音高的樣本數的增長率Rd與聲音音高成比例,並且樣本數的增長率Rd變得等於聲音音高的上升率。也就是,Rd=第三參數Rp的關係成立。
此外,當被擬聲聲音切換判斷部分2101通知「將音頻信號切換到擬聲聲音」的判斷結果時,音高調節部分2901不必執行轉換聲音音高的處理。
語速轉換部分2903例如被配置為CPU、ROM、RAM等。輸入音頻信號和由參數調節部分1801確定的第二參數Rs被輸入到語速轉換部分2903,並且語速轉換部分2903基於第二參數Rs來轉換輸入音頻信號的語速。例如,利用如圖1到圖7所示的算法來執行語速轉換。語速轉換部分2903將語速經過調節的音頻信號發送到隨後將描述的音頻信號輸出控制部分2107。
音頻信號輸出控制部分2107例如被配置為CPU、ROM、RAM等,並且當輸出所輸入的音頻信號或者從音高調節部分2105發送來的音頻信號時控制輸出。當被擬聲聲音切換判斷部分2101通知「將音頻信號切換到擬聲聲音」的判斷結果時,音頻信號輸出控制部分2107將所輸入的音頻信號切換到例如被存儲在存儲部分1805中的預定擬聲聲音並輸出信號。此外,當被擬聲聲音切換判斷部分2101通知「不將音頻信號切換到擬聲聲音」的判斷結果時,音頻信號輸出控制部分2107輸出從語速轉換部分2903發送的音頻信號。
此外,音頻信號輸出控制部分2107可以調節待輸出的音頻信號的音頻音量。通過調節指定音頻信號的信號波形的絕對值來執行對音頻信號的音頻音量的調節。當回放速度變量因子超過1時,音頻信號輸出控制部分2107可以調小音頻信號的音頻音量。此外,音頻信號輸出控制部分2107可以獨立於回放速度來控制音頻音量。
至此,已經描述了根據修改示例的信號處理部分1803的功能示例。上述結構元件的每個可以被配置為通用組件或電路,或者可以被配置為專用於每個結構元件的功能的硬體。此外,CPU等可以執行所有的功能。因此,能夠根據實現本實施例的各種技術水平來適當改變待使用的配置。
(根據修改示例的信號處理方法) 隨後,通過參考圖30,來詳細描述根據修改示例的信號處理方法。圖30是示出根據修改示例的信號處理方法的流程圖。
首先,信息處理裝置1800判斷是否存在輸入音頻信號(步驟S3001),並且當沒有輸入音頻信號時終止處理。此外,當輸入音頻信號存在時,信號處理部分1803的擬聲聲音切換判斷部分2101判斷所輸入的第一參數R是否大於預定閾值(步驟S3002)。當第一參數R小於預定閾值時,參數調節部分1801根據所輸入的第一參數R來調節第二參數Rs和第三參數Rp(步驟S3003),並且將參數發送到信號處理部分1803。信號處理部分1803的音高調節部分2901基於所發送的第三參數Rp來調節所發送的輸入音頻信號的聲音音高(步驟S3004),並且將聲音音高經過調節的音頻信號輸出到語速轉換部分2903。語速轉換部分2903基於所發送的第二參數Rs來調節聲音音高經過調節的音頻信號的語速(步驟S3005)。語速和聲音音高經過調節的音頻信號被發送到音頻信號輸出控制部分2107,並且音頻信號輸出控制部分2107輸出語速和聲音音高經過調節的音頻信號(步驟S3006)。然後,返回到步驟S3001,上述處理被重複。
另一方面,當擬聲聲音切換判斷部分2101判斷第一參數R大於預定閾值時,音頻信號輸出控制部分2107將被存儲在存儲部分1805等中的預定擬聲聲音作為音頻信號輸出(步驟S3007)。然後,返回到步驟S3001,上述處理被重複。
通過重複這樣的處理,根據修改示例的信息處理裝置1800被使得能夠以在聽覺上可以識別轉換後的回放速度的方式來控制音頻信號的回放速度變量因子。
如上所述,通過當轉換所輸入的音頻信號的回放速度變量因子時,在轉換語速之前調節聲音音高,能夠減少語速待轉換的輸入音頻信號的樣本數,並且能夠減少待處理的資源,因此能夠實現處理的加速。順便提及,當轉換聲音音高經過調節的音頻信號的語速時,可以根據音高調節的程度來適當改變執行語速轉換的頻率範圍。
(轉換採樣率的其他方法) 圖31是示出通過不同於如圖12和圖13所示的轉換採樣率方法的方法來轉換採樣率的方法的說明性示圖。通常,在如圖12和圖13所示的方法中,處理量很大,因此例如在諸如可攜式回放裝置之類的不期望高處理性能的回放裝置中很難實現它們。在這樣的情況下,如圖31所示的轉換採樣率的方法證明是有用的。圖31是示出這樣的情況的說明性示圖,其中當採樣點n0、n1、n2、n3、...存在於轉換前的信號中時,新的採樣點m0、m1、m2、...通過線性插值被獲得。例如,關於m1的採樣值,線性插值通過計算比值p1∶1-p1來獲得在採樣點n1和採樣點n2之間的採樣點m1的位置,並且根據該比值,根據n1的採樣值和n2的採樣值來獲得m1的採樣值。
如此,在本實施例中,調節聲音音高的方法並不限於如圖12和圖13所示的那些方法,並且可以使用任意的方法,例如在圖31中示出的方法,以及滿足根據本實施例的信息處理裝置的條件的那些方法。
(回放速度變量因子的漸變) 隨後,通過參考圖32,來描述連續改變代表回放速度變量因子的第一參數R的情況。圖32是示意性地示出回放速度變量因子隨時間的變化的說明性示圖。
與代表回放速度變量因子的第一參數R被設定為R1並且輸出音頻信號的信息處理裝置1800相對地,當在時間點t1輸入用於將第一參數R變到R2的信號時,例如,如圖32所示,根據本實施例的信息處理裝置1800並不立即數字地切換第一參數R,而是可以控制第二參數和第三參數從而使得第一參數逐漸從R1切換到R2。
在這樣的情況下,參數調節部分1801使第一參數R連續地從R1變到R2,並且針對漸變中的每個參數R來設定第二參數Rs和第三參數Rp。通過執行這樣的處理,即使在改變音頻信號的語速和聲音音高期間,音頻信號的收聽者也可以聽到音頻信號而不會感覺到不適。
如上所述,通過根據本實施例的控制回放速度變量因子的方法,當以近似正常的速度進行回放時,回放速度改變然而聲音音高不變,並且容易理解說話人的語音內容或者容易識別說話人。此外,在高速回放/低速回放的情況下,當回放速度改變時,因此可以在聽覺上感覺到此時的回放速度,並且可操作性可以得到改進。
(第二實施例) 隨後,通過參考圖33到圖46,來詳細描述根據本發明第二實施例的信息處理裝置3300。
當所謂的內容回放裝置回放內容時,裝置從內容回放裝置的諸如硬碟驅動器、DVD驅動器和藍光碟機動器之類的記錄介質回放裝置獲得音頻信號。但是,這樣的記錄介質回放裝置的數據讀取速度存在上限。換言之,每單位時間可以從記錄介質中讀取的數據量存在上限。因此,即使能夠獲得足夠以10倍速度回放內容的數據量,也不一定能夠獲得足夠以20倍速度回放內容的數據量。還存在其他類似情況。例如,近年來,內容數據通常以MPEG等進行編碼,並且當回放經編碼的內容時,首先,它必須被解碼。因此,即使諸如硬碟驅動器、DVD驅動器和藍光碟機動器之類的記錄介質回放裝置的數據讀取速度足夠快,如果解碼設備的計算能力不夠,那麼解碼處理也不能繼續。當連接諸如硬碟驅動器、DVD驅動器和藍光碟機動器之類的記錄介質回放裝置,以及CPU或存儲器的總線帶寬不夠時,也會出現類似情況。
因此,構成內容回放裝置的每個結構元件都有其處理能力限制,並且當以變速回放時,整個裝置的處理能力限制由處理能力限制最低的結構元件來決定。存在這樣的問題,即存在由於該處理能力限制而無法實現期望回放速度的情況。在下文中,這個問題被稱作第三問題。
因此,本發明的發明人就上述問題進行了認真研究,並且實現了一種變速回放方法,該方法通過在第一範圍內的變速回放使能夠容易領會語音內容或者指定說話人,此外,通過在第二範圍內的變速回放使能夠在聽覺上感受到回放速度,並且此外,實現回放速度的更高上限。換言之,根據本實施例的變速回放方法是能夠同時解決第一、第二和第三問題的變速回放方法。
(根據本實施例的信息處理裝置的配置) 首先,通過參考圖33,來詳細描述根據本實施例的信息處理裝置3300的配置。圖33是示出根據本實施例的信息處理裝置3300的功能的框圖。
如圖33所示,根據本實施例的信息處理裝置3300例如主要包括參數調節部分3301、內容管理部分3303、內容存儲部分3305、信號處理部分3307和存儲部分3309。
參數調節部分3301例如被配置為CPU、ROM、RAM等,並且根據從外部輸入的第一參數R來調節第二參數Rs、第三參數Rp和第四參數Rt。隨後將詳細描述根據第一參數R來設定第二參數Rs、第三參數Rp和第四參數Rt的方法。參數調節部分3301將根據第一參數R確定的第四參數Rt發送到隨後將描述的內容管理部分3303,並且將第二參數Rs和第三參數Rp發送到隨後將描述的信號處理部分3307。
內容管理部分3303例如被配置為CPU、ROM、RAM等,並且管理包括可以被根據本實施例的信息處理裝置3300所回放的音頻信號的內容。在隨後將描述的內容存儲部分3305中,內容管理部分3303例如與內容標題、內容ID和屬性信息等相關聯地來記錄包括音頻信號的內容。內容管理部分3303根據對從信息處理裝置3300外部輸入的內容的回放指令,從內容存儲部分3305中獲得內容,並且將所述內容輸出到隨後將描述的信號處理部分3307。當將內容輸出到信號處理部分3307時,基於從參數調節部分3301發送的第四參數Rt來確定待發送的數據量。此外,當從內容存儲部分3305讀取的內容數據是經編碼的數據時,內容管理部分3303通過未示出的解碼器對所述內容數據進行解碼,並將所述內容數據輸出到信號處理部分3307。
此外,內容管理部分3303可以經由諸如網際網路和家用網絡之類的網絡1702來獲得包括待回放的音頻信號的內容。內容管理部分3303可以將經由網絡1702而獲得的內容記錄在內容存儲部分3305中。
內容存儲部分3305例如被配置為諸如硬碟驅動器、DVD驅動器和藍光碟機動器之類的記錄介質,並且與內容的標題、ID、屬性信息等相關聯地存儲包括音頻信號的內容。此外,包括構成內容存儲部分3305的各種記錄介質的讀取速度上限值的控制信息等可以作為資料庫被存儲在內容存儲部分3305中。
信號處理部分3307例如被配置為CPU、ROM、RAM等,並且基於從內容管理部分3303發送的音頻信號、第一參數R以及從參數調節部分3301發送的第二參數Rs和第三參數Rp,來調節音頻信號的語速和聲音音高。此外,信號處理部分3307將語速和聲音音高經過調節的音頻信號作為輸出音頻信號輸出。信息處理裝置3300通過未示出的DA轉換器將這樣的輸出音頻信號轉換為模擬信號,並且將所述模擬信號從諸如揚聲器之類的輸出設備輸出。
存儲部分3309例如被配置為RAM、存儲設備等,並且存儲在根據第一參數來確定第二參數Rs、第三參數Rp和第四參數Rt時所使用的各種資料庫,將由信息處理裝置3300執行的各種程序等。此外,除了這些數據外,存儲部分3309還可以根據需要存儲當信息處理裝置3300執行處理、處理的中間進程等時需要被存儲的各種參數。參數調節部分3301、內容管理部分3303、信號處理部分3307等可以在存儲部分3309中自由地執行對數據的讀取或寫入。
(第一參數和第四參數之間的關係) 隨後,通過參考圖34A和圖34B,來詳細描述根據本實施例的通過參數調節部分3301來調節第四參數的方法。圖34A是示出第一參數R和第四參數Rt之間關係的坐標圖,並且圖34B是示出第一參數R和將被輸入到信號處理部分3307的音頻信號數據量之間關係的坐標圖。
如圖34A所示,其中橫軸代表第一參數R並且縱軸代表第四參數Rt的坐標圖被配置為具有第四參數Rt的不同上升率(也就是說,坐標圖的坡度)的兩個區域。
參數調節部分3301在下述情況下調節第四參數Rt。在此,將在內容管理部分3303從內容存儲部分3305讀取內容數據並將所述內容數據發送到信號處理部分3307時的數據讀取速度的上限簡寫為Sm。順便提及,在以下描述中,數據讀取速度是這樣的速度,其包括內容管理部分3303從內容存儲部分3305讀取預定內容數據的數據讀取速度和當將從內容管理部分3303讀取的內容數據發送到信號處理部分3307時所需要的速度。
條件A當所輸入的第一參數R存在於區間3405中時,第四參數Rt恆定地為1.0。
條件B當所輸入的第一參數R存在於區間3406中時,上限速度Sm=第一參數R×第四參數Rt成立。
上限速度Sm是根據內容管理部分3303和內容存儲部分3305的處理能力而確定的恆定值,因此,在區間3406中,隨著第一參數R的值變大,第四參數Rt變小。
圖34B示出每單位時間輸入到信號處理部分3307的音頻信號量與數據讀取速度上限Sm的比值。在區間3407,數據量比值與第一參數R成比例。但是,在區間3408,數據量比值恆定地為1.0。這是因為數據讀取速度根據第四參數Rt被調節,所以數據讀取速度沒有超過其上限Sm。因此,可以說第四參數Rt是在從內容存儲部分3305讀取內容數據以及將所述內容數據發送到信號處理部分3307時數據的間隔剔除率。
(根據第四參數對數據讀取速度的調節) 例如,通過如圖35A到圖37C所示的方法來執行根據第四參數對數據讀取速度的調節。圖35A到圖37C是示出根據本實施例的調節數據讀取速度的方法示例的說明性示圖。
在如圖35A和圖35B所示的示例中,諸如區間3501、區間3502和區間3503之類的原始信號的片段從在圖35A中示出的、被記錄在記錄介質中的原始信號中被選出。在圖35B中示出的信號代表所讀取的信號,並且區間3504、區間3505和區間3506分別對應於在圖35A中示出的原始信號的區間3501、區間3502和區間3503。從內容存儲部分3305中讀取並被輸出到信號處理部分3307的信號是由相連接的、在圖35B中示出的信號的區間3504、區間3505和區間3506構成的信號。在此,當連接每個區間時,每個區間的信號可以被淡入或淡出以進行平滑連接。此外,每個區間可以被略微拉長以通過交叉淡入淡出來進行連接。在圖35B中示出的信號被信號處理部分3307處理以在變速回放時形成回放聲音。
在如圖35A和圖35B所示的示例中,關於在圖35A中示出的原始信號,讀取區間長度和跳過區間長度彼此相等(也就是,區間3501的長度和介於區間3501和區間3502之間的水平區段長度彼此相等),因此,第四參數Rt等於1/2。另一方面,圖36A和圖36B示出這樣的示例,其中第四參數Rt的值不同於如圖35A和圖35B所示的示例。在如圖36A和圖36B所示的示例中,關於在圖36A中示出的原始信號,讀取區間長度與跳過區間長度的比值是3∶4,因此第四參數Rt等於3/7。
圖37A到圖37C示出類似於如圖35A到圖36B所示的示例,但區別在於,記錄在記錄介質中的內容數據經過編碼。在許多情況下,雖然隨編解碼器的不同,名稱可能有變化,但是通常以一致的單位來管理經編碼的數據。例如,就MPEG而言,以諸如包或數據包之類的單位P來管理經編碼的數據。
在如圖37A到圖37C所示的示例中,諸如區間3701、區間3702和區間3703之類的流數據片段從在圖37A中示出的、記錄在記錄介質中的流數據(經編碼數據)中被讀取。在圖37B中示出的、所讀取的流數據的區間3704、區間3705和區間3706分別對應於在圖37A中示出的流數據的區間3701、區間3702和區間3703。從如圖37B所示的流數據中讀取的區間3704、區間3705和區間3706分別被解碼器解碼,從而變為在圖37C中示出的音頻信號的區間3707、區間3708和區間3709。在此,當連接每個區間時,每個區間的信號可以被淡入或淡出以進行平滑連接。此外,每個區間可以被略微拉長以通過交叉淡入淡出來進行連接。在圖37C中示出的音頻信號被信號處理部分3307處理以在變速回放時形成回放聲音。
在如圖37A到圖37C所示的示例中,關於在圖37A中示出的流數據,讀取區間長度和跳過區間長度彼此相等,因此,第四參數Rt等於1/2。然而,在經編碼信號的情況下,每個管理單位P在進行編碼前可能在音頻數據中具有交疊區間。在這種情況下,可能必須根據交疊區間來讀取在圖37A中示出的流數據中的額外讀取區間。此外,根據編解碼器,管理信息被添加到每個管理單位,並且管理信息必須被讀取該以讀取下一個管理單位。在這種情況下,即使在跳過區間,也至少必須讀取管理信息。因此,當處理流數據時,雖然必須添加取決於編解碼器的處理,但是基本處理與在圖35A到圖36B中示出的處理是相同的。
在以下描述中,對應於其中第四參數Rt是1.0的區間的第一參數R的範圍(例如圖34A中的區間3405)被稱作第三範圍,並且對應於其中第四參數Rt受上限速度Sm影響的區間的第一參數R的範圍(例如圖34A中的區間3406)被稱作第四範圍。
(第一參數與第二參數以及與第三參數的關係) 圖38A和圖38B詳細描述根據本實施例的參數調節部分3301的參數調節方法示例。圖38A是示出第一參數R和第二參數Rs之間關係的坐標圖,並且圖38B是示出第一參數R和第三參數Rp之間關係的坐標圖。
在根據本實施例的信息處理裝置3300中,如圖38A和圖38B所示的、示出第一參數R與第二參數Rs以及與第三參數Rp關係的資料庫,和如圖34A中所示的、示出第一參數R和第四參數Rt之間關係的資料庫例如被存儲在存儲部分3309中,並且參數調節部分3301通過參考這些資料庫,根據第一參數R來確定第二參數Rs、第三參數Rp和第四參數Rt。
在此,參數調節部分3301在下述的四個條件下,通過參考在存儲部分3309中存儲的、如圖38A和圖38B所示的資料庫,根據第一參數R來確定第二參數Rs和第三參數Rp。
條件1當所輸入的第一參數R存在於區間3801中時,將第二參數Rs確定為與第一參數R成比例(換言之,確定第二參數Rs以使得第二參數Rs等於第一參數R)。
條件2當所輸入的第一參數R存在於區間3803中時,將第三參數Rp恆定地設定為1。
條件3當所輸入的第一參數R存在於區間3804中時,第三參數Rp隨第一參數R的增大而增大。
條件4第一參數R×第四參數Rt=第二參數Rs×樣本數的增長率Rd。
在此,在圖38A的區間3809中,因為受上述條件B的影響所以第二參數Rs減小。順便提及,從圖38A和圖38B中顯然可見,Rt影響第二參數Rs,但是不影響第三參數Rp。換言之,當被發送到信號處理部分3307的音頻信號的數據量減小時,數據量的減小影響語速轉換的程度,然而不影響對聲音音高的調節。
此外,區間3801和區間3803對應於第一參數R的第一範圍,並且區間3802,區間3809和區間3804對應於第一參數R的第二範圍。此外,區間3801和區間3802對應於第一參數R的第三範圍,並且區間3809對應於第一參數R的第四範圍。
在如圖38A和圖38B所示的示例中,當第一參數R是1到4時,即當以1到4倍的速度回放時,僅執行語速轉換,並且當第一參數R大於4時,即當以大於4倍的速度進行回放時,隨同對語速進行轉換一起來升高聲音音高。通過執行這樣的處理,當以1到4倍的速度進行回放時,說話人的語速根據回放速度逐漸加快,並且當以大於4倍的速度進行回放時,在說話人語速加快的同時逐漸升高聲音音高。
此外,當第一參數R是1到20時,即當以1到20倍的速度回放時,信號被連續讀取,並且當第一參數R大於20時,即當以大於20倍的速度回放時,信號被斷續讀取。通過執行這樣的處理,可以實現超過20倍速度的回放速度,20倍的速度被認為是連續讀取信號情況下的回放上限。
順便提及,在圖38A中,周期3802和周期3809以虛線被示出,因為第二參數Rs的值隨改變聲音音高的方法而改變。當將如圖12到圖14所示的方法用作改變聲音音高的方法時,樣本數隨聲音音高的升高而減少,因此,用虛線示出區間3802和區間3809的線條。然而,當將樣本數不減少的方法或者減少量很小的方法用作改變聲音音高的方法時,將不同於如圖38A所示的虛線來設定區間3802和區間3809。
此外,當方法中用於改變聲音音高的樣本數的增長率是Rd時,參數調節部分3301具有如上述條件4所指示的特性。在此,例如,當樣本數是2倍時,增長率是2,並且當樣本數被減少到一半時,增長率是1/2。
(根據本實施例的控制回放速度變量因子的方法) 圖39是示出根據本實施例的信息處理裝置3300的處理流程的流程圖。首先,信息處理裝置3300判斷是否存在輸入音頻信號(步驟S3901),並且當不存在輸入音頻信號時,處理終止。此外,當輸入音頻信號存在時,信息處理裝置3300的參數調節部分3301根據所輸入的第一參數R來調節第二參數Rs、第三參數Rp和第四參數Rt(步驟S3902)。以滿足上述條件1到4以及條件A和B的方式來執行調節。隨後,信息處理裝置3300的信號處理部分3307根據經調節的第二參數Rs和第三參數Rp來調節從內容管理部分3303發送來的音頻信號的語速和聲音音高(步驟S3903)。隨後,信息處理裝置3300輸出語速和聲音音高經過調節的音頻信號(步驟S3304)。然後,返回到步驟S3901,上述處理被重複。
通過重複這樣的處理,根據本實施例的信息處理裝置3300被使得能夠控制音頻信號的回放速度變量因子。
如參考圖33到圖39所描述的,根據本實施例的控制回放速度變量因子的方法,能夠在第一參數R的第一範圍內僅調節語速,並且在第一參數R的第二範圍內隨同語速一起來調節聲音音高。因此,在第一參數R的第一範圍內解決了第一問題,並且在第一參數R的第二範圍內解決了第二問題。此外,在第一參數R的第三範圍內,信號可以被連續讀取,並且在第一參數R的第四範圍內,信號可以被斷續讀取。因此,第三問題可以在第四範圍內被補救,並且第四範圍可以擴展進而回放速度的上限可以提高。
(信號處理部分3307) 隨後,通過參考圖40,來詳細描述根據本實施例的信號處理部分3307的示例。圖40是示出根據本實施例的信號處理部分3307的功能的框圖。
如圖40所示,例如,根據本實施例的信號處理部分3307主要包括擬聲聲音切換判斷部分4001、語速轉換部分4003、音高調節部分4005和音頻信號輸出控制部分4007。
根據本實施例的擬聲聲音切換判斷部分4001、語速轉換部分4003、音高調節部分4005和音頻信號輸出控制部分4007分別與根據本發明第一實施例的擬聲聲音切換判斷部分2101、語速轉換部分2103、音高調節部分2105和音頻信號輸出控制部分2107具有幾乎相同的配置,並且實現類似的效果,因此,省略其詳細描述。
圖41A和圖41B是示出由具有如圖40所示的信號處理部分3307的信息處理裝置3300的參數調節部分3301所執行的參數調節方法示例的說明性示圖。
參數調節部分3301包括上述的條件A和條件B二者。圖41A是示出第一參數R和第二參數Rs之間關係的坐標圖,並且圖41B是示出第一參數R和第三參數Rp之間關係的坐標圖。
如圖41A所示,橫軸代表第一參數R並且縱軸代表第二參數Rs的坐標圖被配置為具有第二參數Rs的不同上升率(換言之,坐標圖的坡度)的多於三個的區域。類似地,如圖41B所示,橫軸代表第一參數R並且縱軸代表第三參數Rp的坐標圖被配置為具有第三參數Rp的不同上升率的至少兩個區域。
當信號處理部分3307的音高調節部分4005通過如圖12到圖14C所示的方法來調節音高時,參數調節部分3301在下述的四個條件下,通過參考在存儲部分3309中存儲的、如圖41A和圖41B所示的資料庫,根據第一參數R來確定第二參數Rs和第三參數Rp。
條件1當所輸入的第一參數R存在於區間4101中時,將第二參數Rs確定為與第一參數R成比例(換言之,確定第二參數Rs以使得第二參數Rs等於第一參數R)。
條件2當所輸入的第一參數R存在於區間4103中時,將第三參數Rp恆定地設定為1。
條件3當所輸入的第一參數R存在於區間4104中時,第三參數Rp隨第一參數R的增大而增大。
條件4』第一參數R×第四參數Rt=第二參數Rs×第三參數Rp在第一範圍和第二範圍(第三範圍和第四範圍)內成立。
在此,在區間4109中,因為受上述條件B的影響所以第二參數Rs減小。順便提及,如從圖41A和圖41B中顯然可見的,第四參數Rt影響第二參數Rs,但是不影響第三參數Rp。換言之,當被發送到信號處理部分3307的音頻信號的數據量減小時,數據量的減小影響語速轉換的程度,但是不影響對聲音音高的調節。
此外,區間4101和區間4103對應於第一參數R的第一範圍,並且區間4102、區間4109和區間4104對應於第一參數R的第二範圍。此外,區間4101和區間4102對應於第一參數R的第三範圍,並且區間4109對應於第一參數R的第四範圍。
在如圖41A和圖41B所示的示例中,當第一參數R是1到4時,即當以1到4倍的速度回放時,僅執行語速轉換,並且當第一參數R大於4時,即當以大於4倍的速度進行回放時,隨同對語速進行轉換一起來升高聲音音高。通過執行這樣的處理,當以1到4倍的速度進行回放時,說話人的語速根據回放速度逐漸加快,並且當以大於4倍的速度進行回放時,在說話人語速加快的同時逐漸升高聲音音高。
此外,當第一參數R是1到20時,即當以1到20倍的速度回放時,信號被連續讀取,並且當第一參數R大於20時,即當以大於20倍的速度回放時,信號被斷續讀取。通過執行這樣的處理,可以實現超過20倍速度的回放速度,20倍的速度被認為是當沒有執行間隔(thinned)回放時的回放上限。
至此,已經描述了根據本實施例的信息處理裝置3300的功能示例。上述結構元件的每個可以被配置為通用組件或電路,或者可以被配置為專用於每個結構元件的功能的硬體。此外,CPU等可以執行所有的功能。因此,能夠根據實現本實施例的各種技術水平來適當改變待使用的配置。
(根據本實施例的信號處理方法) 隨後,通過參考圖42,來詳細描述根據本實施例的信號處理方法。圖42是示出根據本實施例的信號處理方法的流程圖。
首先,信息處理裝置3300的信號處理部分3307判斷是否存在從內容管理部分3303發送的音頻信號(步驟S4201),並且如果沒有從內容管理部分3303發送的音頻信號那麼終止處理。此外,當從內容管理部分3303發送的音頻信號存在時,信號處理部分3307的擬聲聲音切換判斷部分4001判斷所輸入的第一參數R是否大於預定閾值(步驟S4202)。當第一參數R小於預定閾值時,參數調節部分3301根據所輸入的第一參數R來調節第二參數Rs、第三參數Rp和第四參數Rt(步驟S4203),並且將參數發送到信號處理部分3307。信號處理部分3307的語速轉換部分4003基於所發送的第二參數Rs來調節輸入音頻信號的語速(步驟S4204),並且將語速經過調節的音頻信號輸出到音高調節部分4005。音高調節部分4005基於所發送的第三參數Rp來調節從語速轉換部分4003發送的音頻信號的聲音音高(步驟S4205)。語速和聲音音高經過調節的音頻信號被發送到音頻信號輸出控制部分4007,並且音頻信號輸出控制部分4007輸出語速和聲音音高經過調節的音頻信號(步驟S4206)。然後,返回到步驟S4201,上述處理被重複。
另一方面,當擬聲聲音切換判斷部分4001判斷第一參數R大於預定閾值時,音頻信號輸出控制部分4007將被存儲在存儲部分3309等中的預定擬聲聲音作為音頻信號輸出(步驟S4207)。然後,返回到步驟S4201,上述處理被重複。
通過重複這樣的處理,根據本實施例的信息處理裝置3300被使得能夠以在聽覺上可以識別轉換後的回放速度的方式來控制音頻信號的回放速度變量因子。
(第二實施例的第一修改示例) 隨後,通過參考圖43,來詳細描述根據本發明第二實施例的第一修改示例的信息處理裝置4300的配置。圖43是示出根據本修改實施例的信息處理裝置4300的功能的框圖。
如圖43所示的修改示例是其中內容管理部分4303設定第四參數Rt的示例。例如,當根據本修改示例的信息處理裝置4300被用作視頻記錄/回放裝置時,存在這樣的情況,其中對內容的回放和對另一節目的視頻記錄同時被執行。在這樣的情況下,視頻記錄/回放裝置必須同時執行回放和記錄,並且與僅執行回放的情況相比,可以分配給回放處理的處理量減少。因此,因為回放處理的處理量可能隨情況的不同而改變,所以應該根據能夠備用於回放處理的處理量來確定間隔率(thinning rate)。根據本修改示例的信息處理裝置4300通過包括如下所述的內容管理部分4303來實現這樣的處理。
如圖43所示,根據本修改示例的信息處理裝置4300例如主要包括參數調節部分4301、內容管理部分4303、內容存儲部分4305、信號處理部分4307和存儲部分4309。
在此,內容存儲部分4305、信號處理部分4307和存儲部分4309分別與根據本發明第二實施例的內容存儲部分3305、信號處理部分3307和存儲部分3309具有幾乎相同的配置,並且實現類似的效果,因此省略其詳細描述。
參數調節部分4301例如被配置為CPU、ROM、RAM等,並且根據從外部輸入的第一參數R和從隨後將描述的內容管理部分4303發送的第四參數Rt,來調節第二參數Rs和第三參數Rp。如在本發明第二實施例中所描述的,通過參考在存儲部分4309中所存儲的、示出第一參數R與第二參數Rs以及與第三參數Rp的關係的資料庫,來確定第二參數Rs和第三參數Rp的設定以滿足如在第二實施例中所描述的條件。參數調節部分4301將所確定的第二參數Rs和第三參數Rp發送到信號處理部分4307。
內容管理部分4303例如被配置為CPU、ROM、RAM等,並且管理包括可以被根據本實施例的信息處理裝置4300所回放的音頻信號的內容。在內容存儲部分4305中,內容管理部分4303例如與內容標題、內容ID和屬性信息等相關聯地來記錄包括音頻信號的內容。內容管理部分4303根據對從信息處理裝置4300外部輸入的內容的回放指令,從內容存儲部分4305中獲得內容,並且將所述內容輸出到信號處理部分4307。當將內容輸出到信號處理部分4307時,內容管理部分4303根據可用於內容輸出的資源量來確定對應於數據間隔率的第四參數Rt,並且根據第四參數Rt來確定待發送的數據量。此外,內容管理部分4303將所確定的第四參數Rt發送到參數調節部分4301。順便提及,當從內容存儲部分4305讀取的內容數據是經編碼的數據時,內容管理部分4303通過未示出的解碼器對數據進行解碼,並將所述數據輸出到信號處理部分4307。
此外,內容管理部分4303可以經由諸如網際網路和家用網絡之類的網絡1702來獲得包括待回放的音頻信號的內容。內容管理部分4303可以將經由網絡1702而獲得的內容記錄在內容存儲部分4305中。
內容存儲部分4305例如被配置為諸如硬碟驅動器、DVD驅動器和藍光碟機動器之類的記錄介質,並且與內容的標題、ID、屬性信息等相關聯地存儲包括音頻信號的內容。此外,包括構成內容存儲部分4305的各種記錄介質的讀取速度上限值的控制信息等可以作為資料庫被存儲在內容存儲部分4305中。
至此,已經描述了根據本修改示例的信息處理裝置4300的功能示例。上述結構元件的每個可以被配置為通用組件或電路,或者可以被配置為專用於每個結構元件的功能的硬體。此外,CPU等可以執行所有的功能。因此,能夠根據實現本修改示例的各種技術水平來適當改變待使用的配置。
(根據本修改示例的信號處理方法) 隨後,通過參考圖44,來詳細描述根據本修改示例的信號處理方法。圖44是示出根據本修改示例的信號處理方法的流程圖。
首先,信息處理裝置4300的信號處理部分4307判斷是否存在從內容管理部分4303發送的音頻信號(步驟S4401),並且當沒有從內容管理部分4303發送的音頻信號終止處理。此外,當從內容管理部分4303發送的音頻信號存在時,信號處理部分4307的擬聲聲音切換判斷部分判斷所輸入的第一參數R是否大於預定閾值(步驟S4402)。當第一參數R小於預定閾值時,參數調節部分4301根據所輸入的第一參數R和從內容管理部分4303發送的第四參數Rt來調節第二參數Rs和第三參數Rp(步驟S4403),並且將參數發送到信號處理部分4307。信號處理部分4307基於所發送的第二參數Rs和第三參數Rp來調節輸入音頻信號的語速和聲音音高(步驟S4404)。語速和聲音音高經過調節的音頻信號被發送到音頻信號輸出控制部分,並且音頻信號輸出控制部分輸出語速和聲音音高經過調節的音頻信號(步驟S4405)。然後,返回到步驟S4401,上述處理被重複。
另一方面,當擬聲聲音切換判斷部分判斷第一參數R大於預定閾值時,音頻信號輸出控制部分將被存儲在存儲部分4309等中的預定擬聲聲音作為音頻信號輸出(步驟S4406)。然後,返回到步驟S4401,上述處理被重複。
通過重複這樣的處理,根據本修改示例的信息處理裝置4300被使得能夠以在聽覺上可以識別轉換後的回放速度的方式來控制音頻信號的回放速度變量因子。
(信號處理部分3307、4307的修改示例) 隨後,通過參考圖45,來描述根據本實施例的以及根據本修改示例的信號處理部分3307、4307的修改示例。圖45是示出信號處理部分3307、4307的修改示例的框圖。
如圖45所示,根據本修改示例的信號處理部分主要包括擬聲聲音切換判斷部分4001、音高調節部分4501、語速轉換部分4503和音頻信號輸出控制部分4007。
根據本修改示例的擬聲聲音切換判斷部分4001、音高調節部分4501、語速轉換部分4503和音頻信號輸出控制部分4007分別與根據本發明第一實施例的第一修改示例的擬聲聲音切換判斷部分2101、音高調節部分2901、語速轉換部分2903和音頻信號輸出控制部分2107具有幾乎相同的配置,並且實現類似的效果,因此,省略其詳細描述。
(根據本修改示例的信號處理方法) 隨後,通過參考圖46,來詳細描述根據本修改示例的信號處理方法。圖46是示出根據本修改示例的信號處理方法的流程圖。
首先,信息處理裝置4300判斷是否存在輸入音頻信號(步驟S4601),並且當沒有輸入音頻信號時終止處理。此外,當輸入音頻信號存在時,信號處理部分4307的擬聲聲音切換判斷部分4001判斷所輸入的第一參數R是否大於預定閾值(步驟S4602)。當第一參數R小於預定閾值時,參數調節部分4301根據所輸入的第一參數R和從內容管理部分4303發送的第四參數Rt來調節第二參數Rs和第三參數Rp(步驟S4603),並且將參數發送到信號處理部分4307。信號處理部分4307的音高調節部分4501基於所發送的第三參數Rp來調節所發送的輸入音頻信號的聲音音高(步驟S4604),並且將聲音音高經過調節的音頻信號輸出到語速轉換部分4503。語速轉換部分4503基於所發送的第二參數Rs來調節聲音音高經過調節的音頻信號的語速(步驟S4605)。語速和聲音音高經過調節的音頻信號被發送到音頻信號輸出控制部分4007,並且音頻信號輸出控制部分4007輸出語速和聲音音高經過調節的音頻信號(步驟S4606)。然後,返回到步驟S4601,上述處理被重複。
另一方面,當擬聲聲音切換判斷部分4001判斷第一參數R大於預定閾值時,音頻信號輸出控制部分4007將被存儲在存儲部分3309等中的預定擬聲聲音作為音頻信號輸出(步驟S4607)。然後,返回到步驟S4601,上述處理被重複。
通過重複這樣的處理,根據本修改示例的信息處理裝置4300被使得能夠以在聽覺上可以識別轉換後的回放速度的方式來控制音頻信號的回放速度變量因子。
如上所述,通過根據第二實施例和根據本發明的每個修改示例的信息處理裝置,能夠確定音頻信號的語速轉換率和聲音音高轉換率,同時通過在發送音頻信號時進行間隔剔除來實現構成音頻數據的樣本數的減少。通過使用這樣的裝置,當以近似正常速度進行回放時,回放速度改變然而聲音音高不變,因而很容易理解說話人的語音內容或者很容易指定說話人。同時,在高速/低速回放的情況下,當轉換回放速度時還改變聲音音高,因此可以從聽覺上感受到此時的回放速度,並且此外,通過調節例如連續讀取和斷續讀取,在高速回放時的回放速度上限可以顯著提高。因此,通過根據本實施例的信息處理裝置,可操作性能夠得到改進。
(信息處理裝置的硬體配置) 隨後,通過參考圖47,來詳細描述根據本發明每個實施例的信息處理裝置的硬體配置。圖47是示出根據本發明每個實施例的信息處理裝置的硬體配置的框圖。
信息處理裝置1800、3300和4300主要包括CPU 4701、ROM 4703、RAM 4705、主機總線4707、電橋(bridge)4709、外部總線4711、接口4713、輸入設備4715、輸出設備4717、存儲設備4719、驅動器4721、連接埠4723和通信設備4725。
CPU 4701用作算術處理設備和控制設備,並且根據在ROM 4703、RAM 4705、存儲設備4719或可移動記錄介質4727中存儲的各種程序,來控制信息處理裝置1800、3300和4300的整個操作或部分操作。RAM4705臨時存儲將在CPU 4701的執行期間所使用的程序、在執行期間根據需要而變化的參數等。這些組件通過主機總線4707來彼此連接,通過諸如CPU總線之類的內部總線來配置主機總線4707。
主機總線4707經由電橋4709連接到諸如PCI(外圍組件互連/接口)總線之類的外部總線4711。
輸入設備4715例如是將由使用者來操作的諸如滑鼠、鍵盤、觸摸面板、按鈕、開關和控制杆之類的操作裝置。此外,輸入設備4715可以是利用紅外線或其他無線電波的遙控裝置(所謂的遙控器),或者它可以是諸如與信息處理裝置1800、3300和4300的操作相關聯的蜂窩式電話、PDA等之類的外部連接裝置4729。此外,輸入設備4715基於由使用者例如利用上述操作裝置而輸入的信息來生成輸入信號。信息處理裝置1800、3300和4300的使用者可以將各種數據輸入到信息處理裝置1800、3300和4300,或者可以通過在輸入設備4715上進行操作來指示處理操作。
通過能夠在視覺上或者在聽覺上將所獲得的信息通知給使用者的設備來配置輸出設備4717,例如諸如CRT顯示器、液晶顯示器、等離子顯示器、EL顯示器和燈之類的顯示設備,諸如揚聲器和頭戴式耳機之類的音頻輸出設備,列印設備,蜂窩式電話,或者傳真。4717例如輸出通過由信息處理裝置1800、3300和4300所執行的各種處理而獲得的結果。具體地,顯示設備將通過由信息處理裝置1800、3300和4300所執行的各種處理而獲得的結果顯示為文本或圖像。另一方面,音頻輸出設備將所回放的音頻數據的音頻信號、聲響數據等轉換為模擬信號並且將所述模擬信號輸出。
存儲設備4719是作為信息處理裝置1800、3300和4300的存儲部分而配置的用於存儲數據的設備,並且例如被配置為諸如HDD(硬碟驅動器)之類的磁存儲設備、半導體存儲設備、光存儲設備和磁光存儲設備。存儲設備4719存儲將由CPU 4701執行的程序以及各種數據,從外部獲得的聲響信號數據和圖像信號數據等。
驅動器4721是與記錄介質結合使用的讀取器/寫入器,並且被嵌入信息處理裝置1800、3300和4300中或者被配置為外圍驅動器。驅動器4721讀取在裝載於其中的諸如磁碟、光碟、磁光碟或半導體存儲器之類的可移動記錄介質4727中所記錄的信息,並且將所述信息輸出到RAM 4705。此外,驅動器4721可以將記錄寫入裝載於其中的諸如磁碟、光碟、磁光碟或半導體存儲器之類的可移動記錄介質4727中。可移動記錄介質4727是DVD介質、HD-DVD介質、藍光介質、緊湊式快閃記憶體(CF)(註冊商標)、存儲棒、SD(安全數字)存儲卡等。此外,可移動記錄介質4727例如可以是其中嵌入了非接觸型IC晶片的IC卡(集成電路卡)或者電子設備。
連接埠4723是這樣的埠,例如USB(通用串行總線)埠、諸如i.Link之類的IEEE 1394埠、SCSI(小型計算機系統接口)埠、RS-232C埠、光音頻終端和用於直接將設備連接到信息處理裝置1800、3300和4300的HDMI(高清多媒體接口)埠。通過將外部連接裝置4729連接到連接埠4723,信息處理裝置1800、3300和4300直接從外部連接裝置4729獲得聲響信號數據或圖像信號數據,或者為外部連接裝置4729提供聲響信號數據或圖像信號數據。
通信設備4725例如是被配置為連接到網絡1702的通信設備等的通信接口。通信設備4725例如是用於有線或無線LAN(區域網)的通信卡,藍牙或WUSB(無線USB),用於光通信的路由器,用於ADSL(不對稱數字用戶線)的路由器,或者用於各種通信的數據機。通信設備4725例如可以向/從網際網路和其他通信設備發送/接收聲響信號等。此外,將被連接到通信設備4725的網絡1702被配置為以有線或無線的方式連接的網絡等,並且它可以是網際網路、家用LAN、紅外通信、無線電波通信、衛星通信等。
通過如上所述的配置,信息處理裝置1800、3300和4300可以從各種信息資源獲得與聲響信號等有關的信息,並且可以將與聲響信號等有關的信息發送到與連接埠4723或網絡1702相連接的外部連接裝置4729、內容伺服器1703和客戶端裝置1704,並且此外,信息處理裝置1800、3300和4300可以從外部連接裝置4729、內容伺服器1703和客戶端裝置1704接收與聲響信號有關的信息,並且獲得外部連接裝置4729、內容伺服器1703和客戶端裝置1704中的與聲響信號有關的信息。此外,信息處理裝置1800、3300和4300可以通過使用可移動記錄介質4727來取出與聲響信號等有關的信息。
至此,已經描述了可以實現根據本發明每個實施例的信息處理裝置1800、3300和4300的功能的硬體配置示例。上述結構元件的每個可以被配置為通用組件,或者可以被配置為專用於每個結構元件的功能的硬體。因此,能夠根據實現本實施例的各種技術水平來適當改變待使用的配置。
本領域中的技術人員應理解,根據設計需求和其他因素,可以想到各種修改、組合、子組合和變更,只要它們落入隨附權利要求書或其等價物的範圍內。
例如,在上述的每個實施例中,對這樣的情況進行了說明,其中在第一範圍內,第一參數R是1到4。然而,第一範圍並不局限於此,並且第一參數可以具有不同的值。例如,在慢節奏的語音和音樂中,第一參數R的第一範圍可以是1到6左右。相反,在快節奏的語音和音樂的情況下,其可以是1到2左右。
此外,在如上所述的第二實施例中,對這樣的情況進行了說明,其中在第三範圍內,第一參數R是1到20。然而,第三範圍並不局限於此,並且它可以具有不同的值。
此外,在上述的每個實施例中,PICOLA被用作語速轉換的算法。然而,本發明的語速轉換算法並不局限於此,並且可以使用任意算法而無論時間軸和頻率軸如何,只要語速轉換可以被執行。
順便提及,在上述的每個實施例中,對回放速度比正常速度更快的變速回放示例進行了說明,然而相同的事情可以被視為以小於正常速度的速度進行回放的情況。也就是,例如,0.5到1.0倍的速度對應於第一範圍,並且0.0到0.5倍的速度對應於第二範圍。在0.5到1.0倍速度的範圍內僅轉換語速,並且在0.0到0.5倍速度的範圍內,在轉換語速的同時隨著回放速度的減緩來降低聲音音高,這是可能的。
本發明包含與2007年9月19日遞交到日本專利局的日本專利申請JP2007-241681相關的主題,該日本專利申請的全部內容通過引用被結合於此。
權利要求
1.一種信息處理裝置,包括
參數調節部分,其根據指示所輸入的回放速度變量因子的第一參數來設定第二參數和第三參數;以及
信號處理部分,其基於所述第二參數和所述第三參數,調節音頻信號的回放速度和聲音音高中的至少一個,其中
所述信號處理部分在所輸入的回放速度變量因子小於預定閾值時調節所述音頻信號的所述回放速度,並且在所輸入的回放速度變量因子在所述預定閾值以上時調節所述音頻信號的所述回放速度和所述聲音音高。
2.如權利要求1所述的信息處理裝置,其中
所述信號處理部分包括
回放速度轉換部分,其轉換所述音頻信號的所述回放速度;以及
音高調節部分,其調節所述音頻信號的所述聲音音高,其中
所述回放速度轉換部分基於所述第二參數來轉換所述音頻信號的所述回放速度,並且
所述音高調節部分基於所述第三參數來調節所述音頻信號的所述聲音音高。
3.如權利要求1所述的信息處理裝置,其中
所述第一參數約等於所述第二參數和所述第三參數的乘積。
4.如權利要求1所述的信息處理裝置,其中
所述信號處理部分還包括
音頻信號輸出控制部分,其控制將從所述信號處理部分輸出的、已被執行了預定信號處理的音頻信號的輸出,其中
當回放速度和聲音音高均經過調節的音頻信號被從所述信號處理部分輸出時,所述音頻信號輸出控制部分降低所述回放速度和聲音音高均經過調節的音頻信號的音頻音量。
5.如權利要求4所述的信息處理裝置,其中
所述信號處理部分還包括
擬聲聲音切換判斷部分,其根據所述第一參數,判斷是調節所述音頻信號的所述回放速度和所述聲音音高中的至少一個,還是將所述音頻信號切換到指示正在執行高速回放的預定擬聲聲音,其中
當所述第一參數在所述預定閾值以上時,所述擬聲聲音切換判斷部分判斷將所述音頻信號切換到所述預定擬聲聲音;並且
當所述擬聲聲音切換判斷部分判斷將所述音頻信號切換到所述預定擬聲聲音時,所述音頻信號輸出控制部分在將所述音頻信號切換到所述預定擬聲聲音之後輸出所述音頻信號。
6.如權利要求1所述的信息處理裝置,還包括
內容管理部分,其管理包括所述音頻信號的內容,其中
所述參數調節部分根據所輸入的所述第一參數來確定第四參數,所述第四參數對將從所述內容管理部分輸出到所述信號處理部分的所述音頻信號的數據量進行調節。
7.如權利要求6所述的信息處理裝置,其中
當所述第一參數在預定閾值以上時,所述參數調節部分減小所述第四參數以減小將從所述內容管理部分輸出到所述信號處理部分的所述內容的數據量。
8.如權利要求6所述的信息處理裝置,其中
所述第一參數和所述第四參數的乘積約等於所述第二參數和所述第三參數的乘積。
9.如權利要求1所述的信息處理裝置,還包括
內容管理部分,其管理包括所述音頻信號的內容,其中
所述參數調節部分基於對將從所述內容管理部分輸出到所述信號處理部分的所述音頻數據的數據量進行調節的第四參數和所輸入的所述第一參數,來確定所述第二參數和所述第三參數。
10.如權利要求9所述的信息處理裝置,其中
當所述第一參數在預定閾值以上時,所述內容管理部分減小所述第四參數以減小將從所述內容管理部分輸出到所述信號處理部分的所述內容的數據量。
11.如權利要求9所述的信息處理裝置,其中
所述第一參數和所述第四參數的乘積約等於所述第二參數和所述第三參數的乘積。
12.如權利要求1所述的信息處理裝置,還包括
存儲資料庫的存儲部分,在所述資料庫中,所輸入的所述第一參數與所述第二參數和所述第三參數相互相關,其中
所述參數調節部分通過參考存儲在所述存儲部分中的所述資料庫來確定所述第二參數和所述第三參數。
13.如權利要求12所述的信息處理裝置,其中
當所述第一參數在預定閾值以上時,所述參數調節部分根據所述第一參數與所述預定閾值之差來增大所述第二參數。
14.如權利要求12所述的信息處理裝置,其中
所述資料庫被存儲為指示所述第二參數和所述第三參數隨所述第一參數的變化的曲線,並且
指示所述第三參數的變化的所述曲線在所述預定閾值之前和之後具有平滑的形狀。
15.如權利要求6所述的信息處理裝置,還包括
存儲資料庫的存儲部分,在所述資料庫中,所輸入的所述第一參數與所述第二參數、所述第三參數和所述第四參數相互相關,其中
所述參數調節部分通過參考存儲在所述存儲部分中的所述資料庫來確定所述第二參數、所述第三參數和所述第四參數。
16.如權利要求1所述的信息處理裝置,其中
當所述第一參數在預定閾值以上時,所述參數調節部分根據所述第一參數與所述預定閾值之差來增大所述第二參數。
17.一種信息處理方法,包括
參數調節步驟,其根據指示所輸入的回放速度變量因子的第一參數來設定第二參數和第三參數;以及
信號處理步驟,其基於所述第二參數和所述第三參數,調節音頻信號的回放速度和聲音音高中的至少一個,其中
所述信號處理步驟在所輸入的回放速度變量因子小於預定閾值時,基於所述第二參數來調節所述音頻信號的所述回放速度,並且在所輸入的回放速度變量因子在所述預定閾值以上時,基於所述第二參數和所述第三參數來調節所述音頻信號的所述回放速度和所述聲音音高。
18.如權利要求17所述的信息處理方法,其中
在所述參數調節步驟中,確定所述第二參數和所述第三參數以使得所述第一參數可以約等於所述第二參數和所述第三參數的乘積。
19.如權利要求17所述的信息處理方法,其中
在所述信號處理步驟中,對所述音頻信號的信號波形的振幅進行控制以使得當所述音頻信號的所述回放速度和所述聲音音高均被調節時,所述音頻信號的音頻音量可以較小。
20.如權利要求17所述的信息處理方法,其中
在所述信號處理步驟中,當所述第一參數在所述預定閾值以上時,所述音頻信號被切換到指示正在執行高速回放的預定擬聲聲音。
21.如權利要求17所述的信息處理方法,其中
在所述參數調節步驟中,還根據所述第一參數確定了第四參數,所述第四參數對在所述信號處理步驟中被處理的所述音頻信號的數據量進行調節。
22.如權利要求21所述的信息處理方法,其中
在所述參數調節步驟中,確定所述第二參數、所述第三參數和所述第四參數以使得所述第一參數和所述第四參數的乘積可以約等於所述第二參數和所述第三參數的乘積。
23.如權利要求21所述的信息處理方法,其中
在所述參數調節步驟中,當所述第一參數在預定閾值以上時,所述第四參數被減小以減小所述音頻信號的數據量。
24.如權利要求17所述的信息處理方法,其中
在所述參數調節步驟中,根據對將在所述信號處理步驟中被處理的所述音頻信號的數據量進行調節的第四參數和所述第一參數來確定所述第二參數和所述第三參數。
25.如權利要求24所述的信息處理方法,其中
在所述參數調節步驟中,確定所述第二參數和所述第三參數以使得所述第一參數和所述第四參數的乘積可以約等於所述第二參數和所述第三參數的乘積。
26.一種在計算機中實現的程序
參數調節功能,其根據指示所輸入的回放速度變量因子的第一參數來設定第二參數和第三參數;以及
信號處理功能,其基於所述第二參數和所述第三參數來調節音頻信號的回放速度和聲音音高中的至少一個。
全文摘要
本發明提供了一種信息處理裝置、信息處理方法和程序。根據本發明,提供了參數調節部分,其根據指示所輸入的回放速度變量因子的第一參數來設定第二參數和第三參數,以及信號處理部分,其基於第二參數和第三參數來調節音頻信號的回放速度和聲音音高中的至少一個,其中信號處理部分在所輸入的回放速度變量因子小於預定閾值時調節音頻信號的回放速度,並且在所輸入的回放速度變量因子大於預定閾值時調節音頻信號的回放速度和聲音音高。
文檔編號G11B20/00GK101393745SQ20081017473
公開日2009年3月25日 申請日期2008年9月19日 優先權日2007年9月19日
發明者中村理, 安部素嗣 申請人:索尼株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀