新四季網

信息處理設備和方法以及程序的製作方法

2023-12-05 04:20:11 1

專利名稱:信息處理設備和方法以及程序的製作方法
技術領域:
本發明涉及一種信息處理設備和方法以及程序。更具體地,本發明涉 及一種適合於在編碼音頻數據的回放中使用的信息處理設備和方法以及 程序.
背景技術:
當使用現有通用編碼方案(壓縮方案),例如自適應變換聲學編碼
(ATRAC)或運動圖像專家組音頻層-3 (MP3)對樂曲的音頻數據進行編 碼時,高頻分量可能損失。當回放樂曲時,缺少高頻分量可能導致受抑制 的聲音,而且聲音的豐富度可能減少。
當對樂曲的音頻lt據進行編碼時,如圖1所示,首先,編碼器中的頻 率轉換單元11將具有時間波形的音頻數據轉換為樂曲的各個頻率分量, 即,指示各個頻率的功率的頻率信息。然後,量化單元12將頻率信息量化 為量化信息。此外,編碼單元13對量化信息進行編碼,並且輸出所得到的 碼串作為編碼音頻數據。具有時間波形的音頻數據指的是指示處於不同時 間的音頻的幅度(增益)的數據。
在回放樂曲期間,由解碼器對通過上述方式編碼的音頻數據進行解碼 和回放。具體地,解碼單元14將音頻數據解碼為量化信息,解量化單元 15將量化信息解量化為頻率信息。然後,時間轉換單元16將頻率信息轉 換為具有時間波形的音頻數據。所得到的音頻數據被輸出作為解碼音頻數 據。
當對音頻數據進行編碼時,為了數據壓縮, 一般剪切(移除)頻率信 息中所包括的樂曲的高頻分量。由於高頻聲音較少為人耳所感知,因此數 據移除的影響較小。
然而,如果從音頻數據移除了高頻分量,則從頻率轉換單元ll輸出的 頻率信息與從解量化單元15輸出的頻率信息是不同的。例如,如圖2所示, 通過編碼來剪切樂曲的高範圍分量(高頻分量)。在圖2中,垂直軸表示樂曲的音頻幅度或頻率功率,而水平軸表示時 間或頻率。
當對圖2的上部分所示的具有時間波形的音頻的音頻數據進行頻率轉 換時,獲得圖2的左中部分所示的頻率信息.該頻率信息包含範圍從低範 圍分量到高範圍分量的不同頻率的分量。如果在對音頻數據進行編碼期間 移除頻率信息中的高範圍分量,則如圖2的右中部分所示,在解碼期間所 獲得的頻率信息不包含高範圍分量。換句話說,圖2的右中部分所示的頻 率信息僅包含低範圍分量。
因此,當對通過解量化單元15所執行的解量化而獲得的頻率信息進 行時間轉換時,如圖2的下部分所示,獲得其時間波形比在編碼之前的原 始音頻的時間波形更圓滑的音頻的音頻翁:據。以此方式,因為已經移除了 原始音頻數據中所包含的高範圍分量(高頻分量),所以基於通過解碼而 獲得的音頻數據的音頻的時間波形是圓滑的。
當使用通過上述方式已經從其中移除高範圍分量的音頻數據來回放 樂曲時,即使原始樂曲具有豐富的聲音,回放樂曲也可能聽起來受抑制. 回放的樂曲聽起來受抑制的級別取決於被移除的高範圍分量的量。
據說,人類聽覺頻率範圍的上限處於大約20kHz的量級。如果音頻數 據中包含達到大約15kHz的頻率分量,則當回放時,多lfcA並沒有感覺到 聲音受抑制。雖然年齡和個體之間存在差別,但一般來說,如果音頻數據 僅包含頻率大約為llkHz或更小的分量,則當回放音頻時,多數成年人可 以體驗到聲音受抑制的感覺。
使用以下示例來更好地描述這種情況人們對於使用包含達到大約 15kHz的頻率分量的信號的調頻(FM)廣播服務基本上沒有聲音受抑制 的感覺,而當收聽使用僅包含達到大約8kHz的頻率分量的信號的調幅 (AM)廣播服務時,多數人具有聲音受抑制的感覺。
一種被稱為波段擴展的技術已經可用(見例如日^審專利申請公開 號No. 2007-328268),該技術可以在回放音頻期間通過生成在編碼期間損 失的音頻數據的高範圍分量並且將高範圍分量添加到音頻數據來改進進 行回放時的聲音的豐富度。
例如,在採用波段擴展技術的音樂回放裝置中,如圖3所示,通過使 用波段擴展單元41而使得從解碼器提供的音頻數據受到波段擴展處理。具 體地,波段擴展單元41使用從時間轉換單元16提供的解碼音頻數據,並且生成音頻數據的高範圍分量。然後,波段擴展單元41將所生成的高範圍
分量添加到音頻數據,以產生最終音頻數據,並且輸出產生的音頻IS:據. 在圖3中,對於與圖1所示的部分對應的部分分配相同的標號,並且省略 其描述。
例如,如果從解碼器中的時間轉換單元16提供給波段擴展單元41的 音頻數據不包含高範圍分量,則如圖4的上部分所示,基於該音頻數據的 音頻是時間波形圓滑、並且隨時間而稍微改變的音頻。在圖4中,垂直軸 表示音頻幅度或頻率功率,而水平軸表示時間或頻率。
當將具有圖4的上部分所示的時間波形的音頻的音頻數據提供給波段 擴展單元41時,波段擴展單元41對所提供的音頻數據執行頻率分析,以 生成高範圍分量。具體地,如圖4的左中部分所示,波段擴展單元41複製 音頻數據的低範圍分量SL',並且生成待添加到音頻數據的高範圍分量 SH'。此外,如圖4的右中部分所示,波段擴展單元41調整所生成的高範 圍分量SH'的形狀,以產生最終高範圍分量XSH'。
波段擴展單元41將通過上述方式生成的高範圍分量XSH,添加到從時 間轉換單元16提供的音頻數據。因此,如圖4的下部分所示,獲得具有隨 時間而較大地改變的時間波形的音頻的音頻數據,即具有高範圍分量的音 頻數據。因此,可以改進待回放的音頻的質量。
以下三種波段擴展方法可以被看作用於執行其中波段擴展單元41生 成音頻的高範圍分量並且將高範圍分量添加到音頻數據的波段擴展處理 的具體方法用於沿著頻率軸旨波段擴展的方法、用於沿著時間軸執行 波段擴展的方法、以及用於既沿著時間軸又沿著頻率軸執行波段擴展的方 法。
在上述三種波段擴展方法之中的用於沿著頻率軸執行波段擴展的方 法中,如圖5A所示,將音頻數據轉換為頻率信息,並且使用通過轉換而 獲得的頻率信息來生成高範圍分量。然後,將生成的高範圍分量添加到頻 率信息,並JUit所得到的頻率信息進行時間轉換,以獲得具有時間波形的 波段擴展音頻數據。
具體地,頻率轉換單元71對解碼音頻數據進行頻率轉換,以將音頻 數據轉換為頻率信息。副本生成單元72使用頻率信息,並且生成待添加到 音頻的高範圍分量。形狀調整單元73 ^務改高範圍分量以改變各個頻率分量 的功率,並且調整高範圍分量的形狀.此外,高範圍附加單元74將形狀調整後的高範圍分量附加到頻率信 息,並且將所得到的頻率信息提供給時間轉換單元75。然後,時間轉換單 元75執行時間轉換,以將附加了高範圍分量的頻率信息,即添加了高範圍 分量的頻率信息,轉換為指示處於不同時間的音頻的幅度的音頻數據,並 且輸出該音頻數據。用於沿著頻率軸、或在頻域中執行波段擴展的方法在 下文中被稱為"使用基於頻率的波段擴展方案的波段擴展"。
在用於沿著時間軸執行波段擴展的方法中,如圖5B所示,對使用劃 分濾波器單元81從所提供的音頻數據提取的低範圍分量進行修改,以生成 高範圍分量。然後,使用組合濾波器單元84來組合所提供的音頻數據和生 成的高範圍分量的音頻數據。由此,獲得波段擴展音頻數據。
具體地,劃分濾波器單元81使用劃分濾波器將解碼音頻數據劃分為 多個頻帶,並且從音頻數據提取音頻的低範圍分量和高範圍分量。注意, 解碼音頻基本上不包含高範圍分量。因此,由於在後續階段中高範圍分量 是不可使用的,所以劃分濾波器基本上不從音頻數據提取高範圍分量,在 圖5B中由叉("x")來表示該情況.
副本生成單元82使用劃分濾波器單元81所提取的低範圍分量的音頻 數據,並且生成待添加到音頻的高範圍分量的音頻數據。形狀調整單元83 修改所生成的高範圍分量的音頻數據,並且調整高範圍分量的形狀。然後, 組合濾波器單元84使用組合濾波器來對劃分濾波器單元81所提取出的低 範圍分量的音頻數據的頻帶和形狀調整後的高範圍分量的音頻數據的頻 帶進行組合,並且輸出所得到的音頻數據作為波段擴展音頻數據。用於沿 著時間軸、或在時域中執行波段擴展的方法在下文中被稱為"使用基於時 間的波段擴展方案的波段擴展"。
在既沿著時間軸又沿著頻率軸執行波段擴展的方法中,如圖5C所示, 使用劃分濾波器單元91從音頻數據提取低範圍分量,並且將低範圍分量轉 換為頻率信息。使用通過轉換所獲得的頻率信息來生成高範圍分量。然後, 使用時間轉換將所生成的高範圍分量和低範圍分量轉換為音頻數據,並且 組合所得到的兩份音頻數據。因此,獲得具有時間波形的波段擴展音頻數 據。
具體地,劃分濾波器單元91使用劃分濾波器將解碼音頻數據劃分為 多個頻帶,並且從音頻數據提取音頻的低範圍分量。頻率轉換單元92執行 頻率轉換,以將所提取的低範圍分量的音頻數據轉換為頻率信息。副本生 成單元93使用頻率信息,並且生成待添加到音頻的高範圍分量。形狀調整單元94調整所生成的高範圍分量的形狀。
時間轉換單元95執行時間轉換,以將形狀調整後的高範圍分量轉換 為指示處於不同時間的音頻的幅度的音頻數據。時間轉換單元96執行時間 轉換,以將從頻率轉換單元92提供的頻率信息轉換為音頻數據。組合濾波 器單元97使用組合濾波器對從時間轉換單元95提供的音頻數據的頻帶和 從時間轉換單元96提供的音頻數據的頻帶進行組合,並且將所得到的音頻 數據輸出作為波段擴展音頻數據。既沿著時間軸又沿著頻率軸、或既在時 域又在頻域中執行波段擴展的方法在下文中被稱為"使用基於時間/頻率的 波段擴展方案的波段擴展"。

發明內容
在具有波段擴展功能的相關技術的音樂回放裝置中,音頻數據受到使 用預定波段擴展方案的波段擴展,並且音頻被回放。然而,取決於要受到 波段擴展的音頻數據,聲音質量的改進不一定是可實現的。
波段擴展4支術是這樣一種技術基於音頻數據估計音頻中損失的高範 圍分量(高頻分量),以偽方式生成估計的高範圍分量,並且將所生成的 高範圍分量添加到原始音頻。由於該技術的特性,所以不一定能獲得音頻 中原始包含的高範圍分量。反而,作為波段擴展的結果,可能將不想要的 噪聲添加到音頻。
因此,在相關技術的波段擴展方法中,取決於基於音頻數據的音頻的 特徵,可能獲得或者可能無法獲得改進音頻的質量的效果。因此,難以與 音頻數據的特徵無關地可靠地改進音頻的質量。
因此,期望更可靠地改進音頻的質量。
^L據本發明實施例, 一種信息處理設備,包括波段擴展裝置,用於 執行波段擴展處理,以生成特定頻帶中的分量,並且將所述分量添加到音 頻數據;以及控制裝置,用於控制波段擴展裝置使用在多種不同波段擴展 方法之中確定的波段擴展方法來執行波段擴展處理,波段擴展方法是針對 使用音頻數據的特徵所確定的音樂類而預先定義的。
波段擴展裝置可以執行波段擴展處理,以基於通過對已編碼的音頻數 據進行解碼所獲得的音頻數據來生成特定頻帶中的分量,並且將分量添加 到音頻lt據。多種不同波段擴展方法可以至少包括用於沿著時間軸執行波段擴展 處理的波段擴展方法、用於沿著頻率軸執行波段擴展處理的波段擴展方 法、以及用於沿著時間軸和頻率軸執行波段擴展處理的波段擴展方法。
音頻數據可以是用於回放樂曲的數據,並且信息處理設備可以還包
括分類裝置,用於基於樂曲的音頻數據將樂曲分類為多種音樂類之一, 多種音樂類是4吏用樂曲的特徵預先確定的.
波段擴展裝置可以包括生成裝置,用於4吏用音頻數據生成特定頻帶 中的分量,以及調整裝置,用於增加或者減少特定頻帶中的各個頻率分量。 控制裝置可以控制調整裝置使用在用於調整特定頻帶中的分量的多種調 整方法之中確定的調整方法增加或者減少各個頻率分量,調整方法^:才艮據 分類裝置獲得的分類結果而預先確定的。
控制裝置可以控制生成裝置使用在用於生成特定頻帶中的分量的多 種生成方法之中確定的生成方法來生成特定頻帶中的分量,生成方法《_根 據分類結果而預先確定的。
信息處理i更備可以還包括記錄裝置,用於為多種音樂類中的每一個, 記錄指示在多種方法組合之中預先被分配最高評價的方法組合的信息,多 種方法組合包括多種波段擴展方法、多種生成方法、以及多種調整方法。 可以使用分類結果和記錄的信息來選擇波段擴展方法、生成方法和調整方 法,並且控制裝置可以控制波段擴M置使用所選擇的波段擴展方法、生 成方法和調整方法來執行波段擴展處理。
可以通過統計地處理客觀評價結果和主觀評價結果來獲得評價,客觀 評價結果是通過對4吏用波段擴展處理所獲得的音頻數據進行分析而獲得 的。
^L據本發明實施例, 一種用於信息處理設備的信息處理方法,包括以 下步驟執行波段擴展處理,以生成特定頻帶中的分量,並且將分量添加 到音頻數據;以及執行控制以使用在多種不同波段擴展方法之中確定的波 段擴展方法來執行波段擴展處理,波段擴展方法是針對使用音頻數據的特 徵所確定的音樂類而預先定義的。才艮據本發明實施例, 一種用於使得信息 處理設備的計算機執行處理的程序包括上述步驟。
根據本發明實施例,可以由波段擴展裝置使用在多種不同波段擴展方 法之中確定的波段擴展方法來執行波段擴展處理。可以對於使用音頻數據 的特徵確定的音樂類預先定義波段擴展方法。在本發明實施例中,可以對音頻數據執行波段擴展。更具體地,在本 發明實施例中,可以更可靠地改進音頻的質量。


圖l是示出相關技術的編碼器和解碼器的結構的示圖2是描^目關技術中在編碼期間發生的缺少高範圍分量的示圖3是描勤目關技術的波段擴展的示圖4是描i^目關技術的波段擴展的示圖5A至圖5C是示出用於執行波段擴展的相關技術的波段擴展單元的 結構的示圖6是示出對于波段擴展方法、高範圍分量生成方法和形狀調整方法 的組合而給出的評價的示圖7是示出根據本發明實施例的音頻回放裝置的示例結構的框圖8是示出校正單元的示例結構的示圖9是描述回放處理的流程圖10是描述對受到了在基於頻率的波段擴展方案的基礎上的波段擴 展處理的樂曲進行回放處理的流程圖11是描述對受到了在基於時間的波段擴展方案的基礎上的波段擴 展處理的樂曲進行回放處理的流程圖12是描述對受到了在基於時間/頻率的波段擴展方案的基礎上的波 段擴展處理的樂曲進行回放處理的流程圖13是示出校正單元的另一示例結構的示圖14是描述回放處理的流程圖15是示出計算機的示例結構的示圖。
具體實施例方式
下文中將參照附圖描述本發明實施例。
根據本發明實施例的音頻回放裝置被配置為根據音頻的特徵對要受到波段擴展的音頻進行分類,根據分類結果選擇期望的波段擴展方案,並 且使用所選擇的波段擴展方案對音頻數據執行波段擴展處理.
例如,如果要受到波段擴展的音頻是樂曲,則通過以下操作來執行音
頻的分類預先準備多種音樂類,並且根據音頻的特徵將要受到波段擴展 的音頻分類為多個所準備的音樂類之一,所述多種音樂類中的每一種是具 有特定特徵的樂曲所屬的組。
音頻回放裝置可以被配置為不僅根據音頻的分類結果來改變波段擴 展方案,而且還根據分類結果來改變用於生成待添加到音頻數據的高範圍 分量的方法(在下文中被稱為"高範圍分量生成方法")和調整高範圍分 量的形狀的方法(在下文中被稱為"高範圍分量形狀調整方法"或"形狀 調整方法")。術語"高範圍分量形狀調整方法"指的是充當高範圍分量的 頻率分量的量值按其增加或者減少的規則,即改變頻率分量的方法。
高範圍分量生成方法的示例包括以下方法其中基於音頻數據的音頻 的特定頻帶中的分量沿著頻率軸折回(foldback),然後被移位(平移)以 產生高範圍分量的方法(下文中被稱為"折回方案")、其中音頻的特定頻 帶中的分量按原樣沿著頻率軸被移位以產生高範圍分量的方法(下文中被 稱為"平移(translating)方案")。
具體地,例如,假設^吏用折回方案或平移方案獲得包括頻率為0kHz 至20kHz的頻率分量的音頻信號。將頻率分量相等地劃分為兩個部分被 稱為"低範圍分量"的0kHz至10kHz的頻率分量、以及被稱為"高範圍 分量"的10kHz至20kHz的頻率分量。在以下描述中,頻率為0kHz至 10kHz的分量(下文中稱為"低範圍分量")用於生成頻率為10kHz至20kHz 的分量作為高範圍分量。
在此情況下,在折回方案中,作為音頻的低範圍分量的0kHz至10kHz 的各個頻率分量被用作待生成的高範圍分量中的20kHz至10kHz的各個 頻率分量。具體地,低範圍分量是沿著頻率軸而軸對稱地折回的,使得具
有低範圍分量中的低頻的分量的量值變為等於具有高範圍分量中的高頻 的分量的量值。
此外,在平移方案中,作為音頻的低範圍分量的0kHz至10kHz的各 個頻率分量被用作待生成的高範圍分量中的10kHz至20kHz的各個頻率 分量。具體地,低範圍分量被沿著頻率軸直接平移到高頻範圍,以產生高 範圍分量,使得具有低範圍分量中的低頻的分量的量值變為等於具有高範圍分量中的低頻的分量的量值。
取決於例如音頻的頻率範圍內的哪個頻帶將要用於生成高範圍分量 而使用不同的高範圍分量生成方法。
此外,高範圍分量形狀調整方法的示例包括以下方法其中才艮據基於 音頻數據的音頻的頻率信息中的梯度,即根據音頻的鐠形狀,將高範圍分 量外插到音頻的方法(下文中稱為"外插方案")、以及其中根據音頻的低 範圍分量的特徵,將高範圍分量修改為預定形狀並且將其插入音頻的方法 (下文中稱為"學習方案")。
在外插方案中,調整高範圍分量的形狀,從而滿足要受到波段擴展的 音頻的各個頻率與頻率的功率之間的關係,即功率梯度輪廓(profile)關 於頻率信息中的頻率的形狀。具體地,例如,當音頻的頻率的功率,即頻 率分量的量值(量)隨著頻率增加而減少時,調整待添加的高範圍分量的 形狀,^吏得功率可以隨著頻率增加而減小。
在學習方案中,通過使用音頻中所包括的低頻範圍的功率,例如從 0kHz至10kHz的頻帶中的頻率的功率,也就是音頻的鐠形狀,執行統計 處理來預先學習音頻中原始包含的高範圍分量。也就是說,使用具有低頻 範圍的不同鐠形狀的某些音頻模型來確定高範圍分量的平均鐠形狀。
在使用學習方案進行形狀調整期間,使用模式匹配來選擇具有最接近 於要受到波段擴展的音頻的譜形狀的譜形狀的音頻模型。此外,其形狀待 調整的高範圍分量受到形狀調整,使得其形狀待調整的高範圍分量的譜形 狀,即充當高範圍分量的各個頻率的功率的相對量值,與對於所選擇的模 型而預先定義的高範圍分量的預定譜形^M目一致。
以下,為了筒化描述,假設要受到波段擴展的音頻數據是用於回放樂 曲的音頻數據。
音頻回放裝置被配置成使得根據基於音頻數據的樂曲(音頻)的音樂 類來選擇對於改進聲音質量最有效的波段擴展方法、高範圍分量生成方法 和形狀調整方法,並JU吏用所選擇的方法對樂曲執行波段擴展。在此情況 下,例如,如圖6所示,對於每一音樂類預先評價上述方法的各種組合。
在圖6中,對於樂曲(音頻)的音樂類a、 p和y中的每一個給出針對 波段擴展方法、高範圍分量生成方法和形狀調整方法的組合的評價值。這 裡,採用四個級別的評價用於評價所述組合,這四個級別的評價從評價的 最高級別按照降序由以下符號來指示雙圓團、圓團(圓形)、三角以及此外,"框架"列包含波段擴展方法,字符"頻率"、"時間"和"時 間+頻率"分別表示基於頻率的波段擴展方案、基於時間的波段擴展方案 和基於時間/頻率的波段擴展方案。此外,"副本,,列包含高範圍分量生成 方法,字符"折回"和"平移"分別表示折回方案和平移方案。此外,"形 狀"列包含高範圍分量形狀調整方法,字符"外插"和"學習"分別表示 外插方案和學習方案。
例如,對於屬於音樂類a的樂曲的音頻數據,4吏用基於時間的波段擴 展方案、折回方案和學習方案的組合的波段擴展對於改進聲音質量是最有 效的。類似地,例如,對於屬於音樂類p的樂曲的音頻數據,使用基於頻 率的波段擴展方案、折回方案和學習方案的組合的波段擴jmt於改進聲音 質量是最有效的。
當對針對每一音樂類的上述方法的組合進行評價時,例如,首先,使
用某種方法將要受到波段擴展的每個樂曲分類為多種預定音樂類之一。然 後,對於每一音樂類選擇波段擴展方法、高範圍分量生成方法和形狀調整 方法的多種組合,並且使用所述組合對屬於每一音樂類的樂曲執行波段擴 展。由此,對各種方法的組合進行評價。
例如,對通過使用分析器或計算器對音頻數據執行分析以客觀地(定 量地)評價各種方法的組合所獲得的評價結果以及通過由實際收聽波段擴
理,、以確定各種方法的組合的最終評價值。
因此,在圖6所示的示例中,對於改進聲音質量最有效的各種方法的 最合適的組合,即波段擴展方法、高範圍分量生成方法和形狀調整方法的 組合,根據音樂類的不同而不同。因為波段擴展方法、高範圍分量生成方 法和形狀調整方法中的每種方法(方案)具有不同的優點和缺點,所以被 分類為各個音樂類的波段擴展樂曲的評^h取決于波段擴展方法、高範圍分 量生成方法和形狀調整方法的組合而不同。
例如,在基於頻率的波段擴展方案中,4吏用頻率轉換,有可能詳細地 研究每一樂曲中包含哪些頻率分量,並且優點在於,提供了高範圍分量的 高預測精確度。換句話說,基於頻率的波段擴展方案具有高頻率解析度。
然而,基於頻率的波段擴展方案具有缺點。具體地,在基於頻率的波 段擴展方案中,並非直接4吏用具有時間波形的音頻,而是通過將音頻數據轉換為頻率信息來生成高範圍分量。因此,所生成的高範圍分量沒有關於 時間的信息。甚至當將充當高範圍分量的頻率信息被轉換為具有時間波形 的音頻數據時,例如,以獲得的高範圍分量回放音頻的時間波形可能與原 始樂曲的高範圍分量的時間波形不匹配。也就是_說,可能不正確地再現高 範圍分量的音頻的幅度的時間改變。換句話說,基於頻率的波段擴展方案 具有高範圍分量的低時間解析度。
與之對照,在基於時間的波段擴展方案中,通過直接使用具有時間波 形的音頻數據來生成高範圍分量。由此,可以生成其時間改變與樂曲的低 範圍分量中的時間改變相匹配的高範圍分量,並且有利的是,時間解析度 較高。然而,基於時間的波段擴展方案不允許詳細研究每一樂曲中包含哪 些頻率分量,並且提供了高範圍分量的低預測精確度。換句話說,頻率分 辨率較低。
同時,基於時間/頻率的波段擴展方案可以同時實現基於頻率的波段擴 展方案和基於時間的波段擴展方案二者的優點。然而,反之,基於時間/ 頻率的波段擴展方案可能同時遭遇這兩種方案的缺點。換句話說,基於時 間/頻率的波段擴展方案在某種程度上具有高頻率解析度和時間解析度。頻 率解析度和時間解析度的級別取決於要受到波段擴展的樂曲。
音頻回放裝置預先記錄波段擴展匹配資料庫,該波段擴展匹配資料庫 包括按上述方式預先確定的音樂類和信息。所述信息指示針對每個音樂類 對於改進聲音質量最有效的波段擴展方法、高範圍分量生成方法和形狀調 整方法的組合。音頻回放裝置基於記錄的波段擴展匹配資料庫對音頻數據 執行波段擴展。
接下來,將描述音頻回放裝置根據樂曲的分類結果選擇期望的波段擴 展方案並且使用所選擇的波段擴展方案執行波段擴展的示例。
圖7是示出根據本發明實施例的音頻回放裝置的示例結構的框圖,音 頻回放裝置131包括捕獲單元141、解碼器142、校正單元143和輸出單元 144。
捕獲單元141從音頻回放裝置131中放置的光碟,例如緻密盤(CD ), 或連接到音頻回放裝置131的設備捕獲樂曲的音頻數據,並且記錄所捕獲 的音頻數據。音頻數據可以^K吏用例如ATRAC或MP3的編碼方法進行 編碼的數據。此外,捕獲單元141將記錄的音頻數據提供給解碼器142。
解碼器142從捕獲單元141接收待回放的樂曲的音頻數據,並且對其進行解碼。解碼器142包括解碼單元151、解量化單元152和時間轉換單 元153。
解碼單元151對從捕獲單元141接收到的音頻數據進行解碼,以將形 成音頻數據的碼串轉換為量化信息,並且將量化信息提供給解量化單元 152。解量化單元152將從解碼單元151提供的量化信息解量化為頻率信息, 並且將頻率信息提供給時間轉換單元153。時間轉換單元153對從解量化 單元152提供的頻率信息執行時間轉換,以將頻率信息轉換為指示處於不 同時間的樂曲的幅度的音頻凝:據。然後,時間轉換單元153將通過時間轉 換所獲得的音頻數據提供給校正單元143作為解碼音頻數據。
校正單元143對從時間轉換單元153提供的音頻數據執行波段擴展, 並且將波段擴展音頻數據提供給輸出單元144。輸出單元144包括例如揚 聲器,並且基於從校正單元143提供的音頻數據來回放樂曲。
圖7所示的校正單元143具有例如圖8所示的結構。具體地,校正單 元143包括分類單元181、切換控制單元182、切換單元183、節點184至 187、基於頻率的波段擴展單元188、基於時間的波段擴展單元189和基於 時間/頻率的波段擴展單元190。從時間轉換單元153提供的音頻數據被提 供給分類單元181和切換單元183。
分類單元181基於從時間轉換單元153提供的音頻數據對基於音頻數 據的樂曲執行分類。例如,分類單元181執行12級別聲音分析,以從音頻 數據提取指示樂曲的特徵的音樂特徵值。然後,分類單元181使用提取出 的音樂特徵值以及音樂分類資料庫保存單元211中保存的音樂分類資料庫 來對樂曲進行分類。音樂分類資料庫保存單元211被提供在分類單元181 中。
例如,音樂分類資料庫保存單元211記錄音樂分類資料庫,音樂分類 資料庫包括多條分類信息以及與該多條分類信息相關聯的音樂特徵值。多 條分類信息指示表示樂曲類型(類別)(例如搖滾樂、流行音樂、古典樂、 爵士樂以及聲樂)的音樂類。音樂分類資料庫中所包括的音樂特徵值是從屬 於關聯音樂類的樂曲所^^L出的平均音樂特徵值。
分類單元181參照音樂分類資料庫保存單元211中記錄的音樂分類數 據庫,並且將與和從音頻數據提取出的音樂特徵值最接近的音樂特徵值相 關聯的分類信息提供,換控制單元182。
樂曲的分類可以不一定是基於類別的。可替換地,樂曲的分類可以是基於樂曲的情緒,例如快樂和憂傷,或樂曲的節拍,例如快速和慢速.任 何種類的指示樂曲的特徵的信息可以用於樂曲的分類。
切換控制單元182基於從分類單元181提供的分類信息選擇波段擴展 方案,並且控制切換單元183的操作,從而使用所選擇的波段擴展方案執 行波段擴展。
切換控制單元182包括波段擴展匹配資料庫保存單元212,並且波段 擴展匹配資料庫恭萍單元212記錄波段擴展匹配資料庫'波段擴展匹配數 據庫包括指示音樂類的分類信息以及指示與分類信息相關聯的波段擴展 方法、高範圍分量生成方法和形狀調整方法的組合的信息。切換控制單元 182參照波段擴展匹配資料庫來選擇與從分類單元181提供的分類信息相 關聯的波段擴展方案。
切換單元183包括例如切換器.切換單元183在切換控制單元182的 控制下切換來自時間轉換單元153的音頻數據的輸出。具體地,切換單元 183連接到節點184至187之一,以將音頻數據輸出到基於頻率的波段擴 展單元188、基於時間的波段擴展單元189、基於時間/頻率的波段擴展單 元l卯或輸出單元144。
基於頻率的波段擴展單元188使用基於頻率的波段擴展方案對從切換 單元183經由節點184提供的音頻數據執行波段擴展。基於頻率的波段擴 展單元188包括頻率轉換單元213、波段擴展單元214和時間轉換單元215。
頻率轉換單元213對從切換單元183提供的音頻數據執行頻率轉換, 以產生頻率信息,並且將頻率信息提供給波段擴展單元214。
波段擴展單元214使用從頻率轉換單元213提供的頻率信息生成波段 擴展頻率信息。波段擴展單元214包括副本生成單元231、形狀調整單元 232和高範圍附加單元233 。
副本生成單元231 4吏用預定高範圍分量生成方法、採用從頻率轉換單 元213提供的頻率信息生成待添加到樂曲的偽高範圍分量,更具體地,高 頻分量的頻率信息,並且將所生成的高範圍分量和從頻率轉換單元213提 供的頻率信息提供給形狀調整單元232。
形狀調整單元232使用預定形狀調整方法修改從副本生成單元231提 供的高範圍分量以調整高範圍分量的形狀,並且將形狀調整後的高範圍分 量以及關於從副本生成單元231提供的樂曲的頻率信息提供給高範圍附加 單元233。在從形狀調整單元232接收到頻率信息和高範圍分量時,高範圍附加單元233將高範圍分量添加到頻率信息,並且將所得到的頻率信息 提供給時間轉換單元215。時間轉換單元215批ft時間轉換,以將從高範 圍附加單元233提供的頻率信息轉換為音頻數據,並且將所得到的音頻數 據提供給輸出單元144。
此外,基於時間的波段擴展單元189使用基於時間的波段擴展方案對 從切換單元183經由節點185提供的音頻數據執行波段擴展。基於時間的 波段擴展單元189包括劃分濾波器單元216、波段擴展單元217和組合濾 波器單元218。
劃分濾波器單元216使用劃分濾波器將從切換單元183提供的音頻數 據劃分為多個頻帶,並且從音頻數據提取樂曲的低範圍分量,例如樂曲的 0kHz至10kHz分量的音頻數據。劃分濾波器單元216將提取出的音頻數 據提供給波段擴展單元217和組合濾波器單元218。
波段擴展單元217使用從劃分濾波器單元216提供的音頻數據生成待 添加到樂曲的偽高範圍分量。波段擴展單元217包括副本生成單元234和 形狀調整單元235。
副本生成單元234使用預定高範圍分量生成方法、採用從劃分濾波器 單元216提供的音頻數據生成樂曲的偽高範圍分量,更具體地,高範圍分 量的音頻數據,並且將所生成的高範圍分量提供給形狀調整單元235.形 狀調整單元235使用預定形狀調整方法修改從副本生成單元234提供的高 範圍分量以調整高範圍分量的形狀,並且將形狀調整後的高範圍分量提供 給組合濾波器單元218。
組合濾波器單元218使用組合濾波器對從劃分濾波器單元216提供的 音頻數據的頻帶和從形狀調整單元235提供的高範圍分量的音頻數據的頻 帶進行組合,並且將所得到的音頻數據^^給輸出單元144。
此外,基於時間/頻率的波段擴展單元l卯使用基於時間/頻率的波段 擴展方案對從切換單元183經由節點186提供的音頻數據執行波段擴展。 基於時間/頻率的波段擴展單元190包括劃分濾波器單元219、頻率轉換單 元220、波段擴展單元221、時間轉換單元222和223以及組合濾波器單元 224。
劃分濾波器單元219使用劃分濾波器將從切換單元183提供的音頻數 據劃分為多個頻帶以從音頻數據提取樂曲的低範圍分量的音頻數據,並且 將提取出的音頻數據提供給頻率轉換單元220。頻率轉換單元220對從劃分濾波器單元219提供的低範圍分量的音頻數據執行頻率轉換以產生頻率 信息,並且將該頻率信息提供給波段擴展單元221和時間轉換單元223。
波段擴展單元221使用從頻率轉換單元220提供的頻率信息生成待添 加到樂曲的高範圍分量。波段擴展單元221包括副本生成單元236和形狀 調整單元237。
副本生成單元236使用預定高範圍分量生成方法、採用從頻率轉換單 元220提供的頻率信息生成待添加到樂曲的偽高範圍分量,更具體地,高 頻分量的頻率信息,並且將所生成的高範圍分量^#給形狀調整單元237。 形狀調整單元237使用預定形狀調整方法修改從副本生成單元236提供的 高範圍分量以調整高範圍分量的形狀,並且將形狀調整後的高範圍分量提 供給時間轉換單元222。
時間轉換單元222執行時間轉換以將從形狀調整單元237提供的頻率 信息轉換為音頻數據,並且將音頻數據提供給組合濾波器單元224。此夕卜,
轉換為音頻數據,並且將音頻數據提供給組合濾波器單元224。組合濾波 器單元224使用組合濾波器對從時間轉換單元222提供的音頻數據的頻帶 與從時間轉換單元223提供的音頻數據的頻帶進行組合,並且將所得到的 音頻數據提供給輸出單元144。
當打開音頻回放裝置131的電源並且由用戶指定待回放的樂曲時,音 頻回放裝置131執行捕獲音頻數據並且回放音頻數據的回放處理,以用於 回放由用戶指定的樂曲。
現將參照圖9所示的流程圖描述由音頻回放裝置131執行的回放處理.
在步驟Sll中,捕獲單元141根據由用戶執行的操作來捕獲待回放的 某些樂曲的音頻數據,並將所述音頻lt據記錄在捕獲單元141中。例如, 捕獲單元141從音頻回放裝置131中放置的光碟、音頻回放裝置131中提 供的硬碟、連接到音頻回放裝置131的設備等捕獲音頻數據。也可以在音 頻回放裝置131中提供的非易失性存儲器,例如硬碟中記錄由捕獲單元141 捕獲的音頻數據。
在步驟S12,解碼器142從捕獲單元141獲得由用戶指定的樂曲的音 頻數據,並且對該音頻數據進行解碼。
具體地,解碼單元151從捕獲單元141獲得音頻數據,並且將該音頻數據解碼為量化信息。然後,解碼單元151將量化信息提供給解量化單元 152。解量化單元152將從解碼單元151提供的量化信息解量化為頻率信息, 並且將頻率信息提供給時間轉換單元153。時間轉換單元153執行時間轉 換,以將從解量化單元152提供的、指示樂曲的各個頻率的功率的頻率信 息轉換為指示處於不同時間的樂曲的幅度的音頻數據。將該音頻數據作為
解碼音頻數據從時間轉換單元153提供給分類單元181和切換單元183。
在步驟S13,校正單元143確定是否將JNMt波段擴展。例如,當使 用者執行用於命令音頻回放裝置131執行波段擴展的操作時,確定將# 行波段擴展.
當關閉音頻回放裝置131的電源時,音頻回放裝置131可以在其中記 錄指示用戶是否已經命令音頻回放裝置131執行波段擴展的信息.因此, 下一次打開音頻回i^置131的電源時,音頻回放裝置131可以基於記錄 的信息立即確定是否JW行波段擴展。
如果在步驟S13中確定將不執行波段擴展,則校正單元143命令切換 控制單元182將音頻數據輸出到節點187。然後,切換控制單元182根據 校正單元143的命令來控制切換單元183的操作,使得切換單元183連接 到節點187。然後,切換單元183將音頻數據的輸出切換到節點187。此後, 處理進入到步驟S14。
在步驟S14,輸出單元144回放樂曲。具體地,切換單元183經由節 點187將從時間轉換單元153提供的音頻數據提供給輸出單元144。輸出 單元144基於從切換單元183提供的音頻數據回放樂曲。因此,對還沒有 受到波段擴展的樂曲進行回放。當在步驟S14中回放樂曲時,處理iiX到 步驟S22。
另一方面,如果在步驟S13中確定^C行波段擴展,則在步驟S15中, 分類單元181基於從時間轉換單元153提供的樂曲的音頻數據對樂曲進行 分類,並且將分類結果提供給切換控制單元182。
例如,在分類單元181被配置為通過執行12級別聲音分析來對樂曲 進行分類的情況下,分類單元181將一個樂曲的音頻數據劃分為多個八度 音階信號,對八度音階信號中的每一個執行濾波處理,並且對於每個八度 音階提取12個音程信號。然後,分類單元181使用從音頻數據獲得的12 個音程信號確定音樂特徵值。音樂特徵值表示樂曲的特徵,例如節拍結構 以及和和弦進行(chord progression )。分類單元181進一步參照音樂分類資料庫保存單元211中的音樂分類 資料庫來找尋與和從音頻數據提取出的音樂特徵值最接近(最相似)的音
樂特徵值相關聯的分類信息,並且將找到的分類信息作為樂曲的分類結果 提供給切換控制單元182。該分類信息指示樂曲所分類為的音樂類。
以此方式,使用一個樂曲的整個音頻數據來對該樂曲進行分類。這樣 提供了比在僅使用 一部分音頻數據來對與該部分對應的音樂片段進行分 類的情況下更可靠的分類。
代替對樂曲進行分類,分類單元181可以從經由通信網絡,例如互聯 網連接到音頻回放裝置131的設備獲得分類信息,或者可以通過解碼器142 和捕獲單元141 M置在音頻回放裝置131中的光碟獲得分類信息。例如, 在支持CD-文本標準的光碟中,在光碟的導入區中記錄了分類信息.
可替換地,當捕獲單元141捕獲樂曲的音頻數據時,可以對樂曲進行 分類,並且可以記錄分類結果。通過預先記錄樂曲的分類結果,可以更快 地啟動樂曲的回放。
在步驟S16中,切換單元183在切換控制單元182的控制下切換從時 間轉換單元153提供的音頻數據的輸出。
具體地,切換控制單元182參照波段擴展匹配資料庫保存單元212中 的波段擴展匹配資料庫來選擇與從分類單元181提供的分類信息相關聯的 波段擴展方法。然後,切換控制單元182根據所選擇的波段擴展方法控制 切換單元183,使得可以將音頻數據提供給節點184至186之一。例如, 當選擇基於頻率的波段擴展方案作為波段擴展方法時,切換控制單元182 控制切換單元183連接到節點184, 4吏得可以4吏用基於頻率的波段擴展方 案執行波段擴展。
在步驟S17中,切換控制單元182確定是否J^f吏用基於頻率的波段擴 展方案來執行波段擴展。例如,當切換單元183連接到節點184並且音頻 數據從切換單元183被提供^^基於頻率的波段擴展單元188時,確定將要 使用基於頻率的波段擴展方案來執行波段擴展。
如果在步驟S17中確定將要使用基於頻率的波段擴展方案來執行波段 擴展,則在步驟S18中,音頻回放裝置131執行對受到了在基於頻率的波 段擴展方案的基礎上的波段擴展處理的樂曲進行回放的處理。在對受到了 在基於頻率的波段擴展方案的基礎上的波段擴展處理的樂曲進行回放的 處理中,使用基於頻率的波段擴展方案對樂曲執行波段擴展,並且回放樂曲。也就是說,執行頻域中的波段擴展.以下將詳細描述對受到了在基於 頻率的波段擴展方案的基礎上的波段擴展處理的樂曲進行回放的處理。
在執行對受到了在基於頻率的波段擴展方案的基礎上的波段擴展處
理的樂曲進行回放的處理之後,處理ii^到步驟S22。
另一方面,如果在步驟S17中確定將不使用基於頻率的波段擴展方案 執行波段擴展,則在步驟S19中,切換控制單元182確定是否將要使用基 於時間的波段擴展方案來執行波段擴展。例如,當切換單元183連接到節 點185並且音頻數據從切換單元183被^1供給基於時間的波段擴展單元 189時,確定將要使用基於時間的波段擴展方案來執行波段擴展。
如果在步驟S19中確定將要使用基於時間的波段擴展方案來執行波段 擴展,則在步驟S20中,音頻回放裝置131執行對受到了在基於時間的波 段擴展方案的基礎上的波段擴展處理的樂曲進行回放的處理。在對受到了 在基於時間的波段擴展方案的基礎上的波段擴展處理的樂曲進行回放的 處理中,使用基於時間的波段擴展方案對樂曲執行波段擴展,並且回放樂 曲。也就是說,執行時域中的波段擴展。以下將詳細描述對受到了在基於 時間的波段擴展方案的基礎上的波段擴展處理的樂曲進行回放的處理,
在執行對受到了在基於時間的波段擴展方案的基礎上的波段擴展處 理的樂曲進行回放的處理之後,處理進入到步驟S22。
如果在步驟S19中確定將不使用基於時間的波段擴展方案來執行波段 擴展,則在步驟S21中,音頻回放裝置131執行對受到了在基於時間/頻率 的波段擴展方案的基礎上的波段擴展處理的樂曲進行回放的處理。在對受 到了在基於時間/頻率的波段擴展方案的基礎上的波段擴展處理的樂曲進 行回放的處理中,使用基於時間/頻率的波段擴展方案對樂曲執行波段擴 展,並且回放樂曲。也就是說,執行時域和頻域二者之中的波段擴展。以 下將詳細描述對受到了在基於時間/頻率的波段擴展方案的基礎上的波段
擴展處理的樂曲進行回放的處理。
在執行對受到了在基於時間/頻率的波段擴展方案的基礎上的波段擴 展處理的樂曲進行回放的處理之後,處理ii^到步驟S22。
當在步驟S14、 S18、 S20或S21中回放一個樂曲時,然後在步驟S22 中,音頻回放裝置131確定是否將要終止樂曲的回放。例如,當已經完成 了由用戶指定的所有樂曲的回放時,確定將要終止回放。
如果在步驟S22中確定將不終止回放,則處理返回到步驟S12,並且重複上述處理,以回放下一樂曲。
另一方面,如果在步驟S22確定將要終止回放,則音頻回放裝置131 的各個部分終止處於進行中的處理。然後,回放處理結束。
以此方式,音頻回放裝置131對樂曲進行分類,並且根據分類結果改 變波段擴展方法。然後,音頻回放裝置131使用同一波段擴展方法對一個 樂曲的音頻萄:據執行波段擴展'
以此方式,根據樂曲的分類結果改變波段擴展方法。因此,可以使用 最適合於樂曲的音樂類的波段擴展方法來執行波段擴展.換句a,可以 使用針對待回放的樂曲對於改進聲音質量最有效的波段擴展方法來對音 頻數據執行波段擴展。這可以比相關技術更可靠地改進樂曲(音頻)的質 量。
接下來,將參照圖10的流程圖描述對受到了在基於頻率的波段擴展 方案的基礎上的波段擴展處理的樂曲進行回放的處理,該處理與圖9所示 的步驟S18的處理相對應。
在步驟S51中,頻率轉換單元213對從切換單元183提供的音頻數據 執行頻率轉換以產生頻率信息,並且將頻率信息提供給副本生成單元 231。頻率轉換單元213執行頻率轉換,例如正交變換,如離"lt傅立葉變 換或修正離散餘弦變換。相應地,可以獲得指示樂曲中所包含的各個頻率 分量的量值,即各個頻率的功率的頻率信息。
在步驟S52中,副本生成單元231使用預定高範圍分量生成方法,例 如折回方案,採用從頻率轉換單元213提供的頻率信息生成待添加到樂曲 的偽高範圍分量,例如,如10kHz至20kHz範圍的特定頻帶中的分量。 更具體地,高範圍分量(高頻分量)是指示特定頻帶中的各個頻率的功率 的頻率信息,即關於特定頻率的音頻的頻率信息,該頻率信息^:使用關於 樂曲的頻率信息中所包括的某些或所有頻帶中的分量而生成的。
在生成高範圍分量之後,副本生成單元231將所生成的高範圍分量和 從頻率轉換單元213提供的頻率信息提供給形狀調整單元232。
在步驟S53中,形狀調整單元232^(吏用預定形狀調整方法,例如外插 方案,調整從副本生成單元231提供的高範圍分量的形狀。具體地,形狀 調整單元232增加或者減少高範圍分量的各個頻率的功率,以調整高範圍 分量的形狀。然後,形狀調整單元232將形狀調整後的高範圍分量和從副 本生成單元231提供的關於樂曲的頻率信息提供給高範圍附加單元233。在步驟S54中,在從形狀調整單元232接收到頻率信息和高範圍分量 時,高範圍附加單元233將高範圍分量附加到頻率信息,並且將所得到的 頻率信息提供給時間轉換單元215。具體地,將頻率信息中所不包括的、 高頻範圍中的頻率的功率添加到包括低頻範圍中的頻率的功率的、關於樂 曲的頻率信息,並且生成指示從低頻範圍到高頻範圍的範圍中的各個頻率 的功率的頻率信息。
在步驟S55中,時間轉換單元215執行時間轉換以將從高範圍附加單 元233提供的頻率信息轉換為音頻數據,並且將所獲得的音頻數據4C供給 輸出單元144。時間轉換單元215執行時間轉換,例如離散傅立葉逆變換 或修正離散餘弦逆變換,以將頻率信息轉換為具有時間波形的音頻lt據, 即指示處於不同時間的樂曲的幅度的音頻泰:據。
在步驟S56中,輸出單元144基於從時間轉換單元215提供的音頻數 據回放樂曲。當通過上述方式回放受到了使用基於頻率的波段擴展方案的 波段擴展的樂曲時,對受到了在基於頻率的波段擴展方案的基礎上的波段 擴展處理的樂曲進行回放的處理結束。然後,處理進入到圖9所示的步驟 S22。
從而,音頻回放裝置131對頻域中的樂曲(音頻數據)執行波段擴展, 並且回放所得到的樂曲。按上述方式在頻域中進行波段擴展允許對樂曲中 原始地包含的高範圍分量的更高精確度的估計,並且允許樂曲的質量更可 靠的改進。
接下來,將參照圖11的流程圖描述對受到了在基於時間的波段擴展方 案的基礎上的波段擴展處理的樂曲進行回放的處理,該處理與圖9所示的 步驟S20的處理相對應。
在步驟S91中,劃分濾波器單元216使用劃分濾波器將從切換單元183 提供的音頻數據劃分為多個頻帶,並且從音頻數據提取樂曲的低範圍分 量。劃分濾波器單元216將包括提取出的低範圍分量的音頻數據提供給副 本生成單元234和組合濾波器單元218。
在步驟S92中,副本生成單元234^吏用預定高範圍分量生成方法,例 如折回方案,採用從劃分濾波器單元216提供的音頻數據生成待添加到樂 曲的高範圍分量,並且將高範圍分量提供給形狀調整單元235。
具體地,例如,副本生成單元234對具有時間波形的音頻數據執行頻 率調製,以生成包括特定頻帶中的分量的音頻的音頻數據作為高範圍分量。作為頻率調製的具體示例,如圖4所示,由劃分濾波器所獲得的低範 圍分量可以簡單地用作本該由相同劃分濾波器所獲得的高範圍分量。也可 以根據期望而選擇其它各種方法。在此,由副本生成單元234生成的高範 圍分量可以是指示待添加到樂曲的音頻的處於不同時間的幅度的音頻數 據。
甚至當使用同一高範圍分量生成方法生成高範圍分量時,例如,副本 生成單元231使用頻率信息生成高範圍分量(關於高頻分量的頻率信息), 而副本生成單元234使用音頻數據生成高範圍分量(高頻分量的音頻數 據)。也就是說,待處理的數據類型取決于波段擴展方案而不同.
在步驟S93中,形狀調整單元235使用預定形狀調整方法,如學習方 案,調整從副本生成單元234提供的高範圍分量的形狀,並且將形狀調整 後的高範圍分量提供給組合濾波器單元218。具體地,形狀調整單元235 適當地改變充當所提供的高範圍分量的音頻數據的音頻的處於不同時間 的幅度,以調整高範圍分量的形狀。更具體地,例如,通過執行具有預定 形狀(頻率特性)的濾波器,例如有限衝激響應(FIR)濾波器或無限衝 激響應(IIR)濾波器的濾波器係數與高範圍分量的時間信號之間的巻積來 調整高範圍分量的形狀(頻率特性)。
在步驟S94中,組合濾波器單元218使用組合濾波器對從劃分濾波器 單元216提供的音頻數據的頻帶和從形狀調整單元235提供作為高範圍分 量的音頻數據的頻帶進行組合,並且將所得到的音頻數據提供給輸出單元 144。也就是說,組合濾波器單元218將高範圍分量的音頻數據添加到低範 圍分量的音頻數據,以生成包含從低頻到高頻範圍中的各個頻率分量的樂 曲的音頻lt據。
在步驟S95中,輸出單元144基於從組合濾波器單元218提供的音頻 數據回放樂曲。當按上述方式對受到了使用基於時間的波段擴展方案的波 段擴展的樂曲進行回放時,對受到了在基於時間的波段擴展方案的基礎上 的波段擴展處理的樂曲進行回放的處理結束。然後,處理進入到圖9所示 的步驟S22。
從而,音頻回放裝置131對時域中的樂曲(音頻數據)執行波段擴展, 並且回放所得到的樂曲。按上述方式在時域中進行波段擴展允許生成其時 間改變與原始低範圍分量的時間改變相匹配的高範圍分量,並且允許樂曲 的質量更可靠的改進。此外,將參照圖12的流程圖描述對受到了在基於時間/頻率的波段擴 展方案的基礎上的波段擴展處理的樂曲進行回放的處理,該處理與圖9所 示的步驟S21的處理相對應。
在步驟S121中,劃分濾波器單元219使用劃分濾波器將從切換單元 183提供的音頻數據劃分為多個頻帶,並J^音頻數據提取樂曲的低範圍 分量。劃分濾波器單元219將包括提取出的低範圍分量的音頻數據提供給 頻率轉換單元220。
在步驟S122中,頻率轉換單元220對從劃分濾波器單元219提供的 音頻數據執行頻率轉換以產生頻率信息,並且將該頻率信息提供給副本生 成單元236和時間轉換單元223。頻率轉換單元220執行頻率轉換,例如 正交變換,如離散傅立葉變換或修正離散餘弦變換。因而,可以獲得指示 樂曲中所包括的各個頻率的功率的頻率信息。
在步驟S123中,副本生成單元236使用預定高範圍分量生成方法, 例如折回方案,採用從頻率轉換單元220提供的頻率信息生成樂曲的高範 圍分量,例如,如10kHz至20kHz範圍的特定頻帶中的分量。更具體地, 高範圍分量(高頻分量)是指示特定頻帶中的各個頻率的功率的頻率信息, 該頻率信息是^^用關於樂曲的頻率信息中所包括的某些或所有頻帶中的 分量而生成的。
在步驟S124中,形狀調整單元237使用預定形狀調整方法,如外插 方案,調整從副本生成單元236提供的高範圍分量的形狀,並且將形狀調 整後的高範圍分量提供給時間轉換單元222.具體地,形狀調整單元237 增加或者減少高範圍分量的各個頻率的功率,以調整高範圍分量的形狀。
在步驟S125中,時間轉換單元222和223分別對從形狀調整單元237 提供的高範圍分量和從頻率轉換單元220提供的頻率信息執行時間轉換以 產生音頻數據,並且將音頻數據提供給組合濾波器單元224。時間轉換單 元222和223執行時間轉換,例如離散傅立葉逆變換或修正離散餘弦逆變 換,以將頻率信息轉換為具有時間波形的音頻數據,即指示處於不同時間 的音頻的幅度的音頻lt據。
在步驟S126中,組合濾波器單元224使用組合濾波器對從時間轉換 單元222提供作為高範圍分量的音頻數據的頻帶與從時間轉換單元223提 供的音頻數據的頻帶進行組合,並且將所得到的音頻數據提供給輸出單元 144。因此,可以獲得包含從低頻到高頻範圍中的各個分量的樂曲的音頻數據。
在步驟S127中,輸出單元144基於M合濾波器單元224提供的音 頻數據回放樂曲。當按上述方式對受到了使用基於時間/頻率的波段擴展方 案的波段擴展的樂曲進行回放時,對受到了在基於時間/頻率的波段擴展方 案的基礎上的波^L擴展處理的樂曲進行回放的處理結束。然後,處理l 到圖9所示的步驟S22。
因而,音頻回放裝置131既在時域中又在頻域中對樂曲的音頻數據執 行波段擴展處理,以回放波段擴展樂曲。按上述方式既在時域中又在頻域 中進行波段擴展允許生成具有基於時間的波段擴展方案和基於頻率的波 段擴展方案二者的特徵的高範圍分量,並且允許樂曲的質量的改進。
此外,在執行波段劃分之後,音頻數據被轉換為頻率信息。因此,可 以僅將處理所必須的低範圍分量確定為頻率轉換的目標。這樣可以減少頻 率轉換中涉及的處理量,並且可以提供更高效並且快速的高範圍分量的生 成。此外,使用基於時間/頻率的波段擴展方案的波段擴展可以減少頻率轉 換中涉及的處理量,因此確保可以通過更小的硬體配置來生成高範圍分 量。
切換控制單元182可以參照波段擴展匹配資料庫以基於分類信息來確 定高範圍分量生成方法,並且可以使得副本生成單元231、 234或236使用 確定的高範圍分量生成方法來生成高範圍分量。可替換地,可以根據從用 戶給定的指令來改變高範圍分量生成方法。
類似地,切換控制單元182可以參照波段擴展匹配資料庫以基於分類 信息來確定形狀調整方法,並且可以佳:得形狀調整單元232、 235或237 使用確定的形狀調整方法來調整形狀。可替換地,可以根據從用戶給定的 指令來改變形狀調整方法。
此外,可以根據從用戶給定的指令切換來自切換單元183的音頻數據 的輸出。也就是說,可以根據從用戶給定的指令改變切換單元183連接到 節點184至186中的哪一個。
在以上描述中,通過示例的方式,根據樂曲的分類結果僅改變波段擴 展方法。除了波段擴展方法之外,也可以根據樂曲的音樂類改變高範圍分 量生成方法和形狀調整方法。
在此情況下,校正單元143可以具有例如圖13所示的結構。在圖13 中,對於與圖8所示的部分相對應部分分配相同的附圖標記,並且在不需要的情況下省略其描述。
在圖13所示的校正單元143中,節點184、 185和186分別連接到頻 率轉換單元213、劃分濾波器單元216和劃分濾波器單元219,劃分濾波器 單元219連接到頻率轉換單元220。
此外,頻率轉換單元213、劃分濾波器單元216和頻率轉換單元220 經由切換單元271連接到節點272至277。
切換單元271被提供有切換器321至323。切換器321適用於將從頻 率轉換單元213提供的頻率信息的輸出切換到節點272或273。切換器322 適用於將從劃分濾波器單元216提供的音頻lt據的輸出切換到節點274或 275。切換器323適用於將從頻率轉換單元220提供的頻率信息的輸出切換 到節點276或277。切換單元271在切換控制單元182的控制下對切換器 321至323的連接進行切換。
節點272至277分別連接到副本生成單元278至283。
副本生成單元278、 280和282分別使用從頻率轉換單元213提供的 頻率信息、從劃分濾波器單元216提供的音頻數據和從頻率轉換單元220 提供的頻率信息,採用折回方案生成待添加到樂曲的偽高範圍分量。
副本生成單元279、 281和283分別使用從頻率轉換單元213提供的 頻率信息、從劃分濾波器單元216提供的音頻數據和從頻率轉換單元220 提供的頻率信息,採用平移方案生成待添加到樂曲的偽高範圍分量。
由副本生成單元278至283所生成的高範圍分量經由切換單元284被 提供給節點285至296。切換單元284被提供有切換器324至329。
切換器324適用於將從副本生成單元278提供的高範圍分量的輸出切 換到節點285或286。切換器325適用於將從副本生成單元279提供的高 範圍分量的輸出切換到節點287或288。
切換器326適用於將從副本生成單元280提供的高範圍分量的輸出切 換到節點289或290。切換器327適用於將從副本生成單元281提供的高 範圍分量的輸出切換到節點291或292。切換器328適用於將從副本生成 單元282提供的高範圍分量的輸出切換到節點293或294。切換器329適 用於將從副本生成單元283提供的高範圍分量的輸出切換到節點295或 296。
切換單元284在切換控制單元182的控制下對切換器324至329的連接進行切換,
節點285至296分別進一步連接到形狀調整單元297至308。
形狀調整單元297、 299、 301、 303、 305和307使用外插方案分別調 整從副本生成單元278、 279、 280、 281、 282和283提供的高範圍分量的 形狀。
形狀調整單元298、 300、 302、 304、 306和308使用學習方案分別調 整從副本生成單元278、 279、 280、 281、 282和283提供的高範圍分量的 形狀。
其形狀已由形狀調整單元297至300所調整的高範圍分量^L提供給高 範圍附加單元233.其形狀已由形狀調整單元301至304所調整的高範圍 分量被提供給組合濾波器單元218。其形狀已由形狀調整單元305至308 所調整的高範圍分量被提供給時間轉換單元222 。
因此,在圖13所示的校正單元143中,切換單元183、 271和284根 據在組合中使用波段擴展方法、高範圍分量生成方法和形狀調整方法中的 哪些方法而切換數據的輸出。
在圖13所示的校正單元143中,包括頻率轉換單元213、副本生成單 元278和279、形狀調整單元297至300、高範圍附加單元233和時間轉換 單元215的部分與圖8所示的基於頻率的波段擴展單元188相對應。
類似地,在圖13所示的校正單元143中,包括劃分濾波器單元216、 副本生成單元280和281、形狀調整單元301至304和組合濾波器單元218 的部分與圖8所示的基於時間的波段擴展單元189相對應。此外,在圖13 所示的校正單元143中,包括劃分濾波器單元219、頻率轉換單元220、副 本生成單元282和283、形狀調整單元305至308、時間轉換單元222和 223和組合濾波器單元224的部分與圖8所示的基於時間/頻率的波段擴展 單元190相對應。
接下來,將參照圖14所示的流程圖描述由包括具有圖13所示結構的 校正單元143的音頻回放裝置執行的回放處理。在圖14中,步驟S151至 S155的處理與圖9所示的步驟Sll至S15的處理相似,並且省略其描述。
在步驟S155中,分類單元181對樂曲進行分類,並且將關於樂曲的 分類信息提供給切換控制單元182。然後,在步驟S156中,切換單元183 在切換控制單元182的控制下切換從時間轉換單元153提供的音頻數據的 輸出.具體地,切換控制單元182參照波段擴展匹配資料庫保存單元212中 的波段擴展匹配資料庫來選擇與從分類單元181提供的分類信息相關聯的 波段擴展方案、高範圍分量生成方法和形狀調整方法。
然後,切換控制單元182根據所選擇的波段擴展方案控制切換單元 183,使得可以將音頻數據提供給節點184至186之一。因此,當選擇基於 頻率的波段擴展方案時,經由節點184將從切換單元183提供的音頻數據 提供給頻率轉換單元213,當選^r基於時間的波段擴展方案時,經由節點 185將從切換單元183提供的音頻數據提供給劃分濾波器單元216,而當選 擇基於時間/頻率的波段擴展方案時,經由節點186將從切換單元183提供 的音頻數據提供給劃分濾波器單元219。
在步驟S157中,切換單元271在切換控制單元182的控制下切換頻 率信息或音頻數據的輸出。具體地,切換控制單元182根據在步驟S156 的處理中所選擇的波段擴展方案和高範圍分量生成方法控制切換單元271 的操作。
例如,當選擇基於頻率的波段擴展方案和折回方案時,切換控制單元 182使得切換單元271中的切換器321連接到節點272.當選#^基於頻率的 波段擴展方案和平移方案時,切換控制單元182使得切換單元271中的切 換器321連接到節點273。
當選"^基於時間的波段擴展方案和折回方案時,切換控制單元182使 得切換單元271中的切換器322連接到節點274。當選^^基於時間的波段 擴展方案和平移方案時,切換控制單元182使得切換單元271中的切換器 322連接到節點275。當選擇基於時間/頻率的波段擴展方案和折回方案時, 切換控制單元182 4吏得切換單元271中的切換器323連接到節點276。當 選擇基於時間/頻率的波段擴展方案和平移方案時,切換控制單元182使得 切換單元271中的切換器323連接到節點277。
在步驟S158中,切換單元284在切換控制單元182的控制下切換高 範圍分量的輸出。具體地,切換控制單元182根據在步驟S156的處理中 所選擇的波段擴展方案、高範圍分量生成方法和形狀調整方法控制切換單 元284的操作。
例如,在選擇基於頻率的波段擴展方案和折回方案的情況下,當選擇 外插方案時,切換控制單元182使得切換單元284中的切換器324連接到 節點285,而當選擇學習方案時,使得切換單元284中的切換器324連接到節點286。在選#^基於頻率的波段擴展方案和平移方案的情況下,當選 擇外插方案時,切換控制單元182使得切換單元284中的切換器325連接 到節點287,而當選擇學習方案時,使得切換單元284中的切換器325連 接到節點288。
類似地,在選#^基於時間的波段擴展方案和折回方案的情況下,當選 擇外插方案時,切換控制單元182使得切換單元284中的切換器326連接 到節點289,而當選擇學習方案時,使得切換單元284中的切換器326連 接到節點290。在選"^基於時間的波段擴展方案和平移方案的情況下,當 選棒外插方案時,切換控制單元182使得切換單元284中的切換器327連 接到節點291,而當選擇學習方案時,使得切換單元284中的切換器327 連接到節點292。
在選擇基於時間/頻率的波段擴展方案和折回方案的情況下,當選擇外 插方案時,切換控制單元182使得切換單元284中的切換器328連接到節 點293,而當選擇學習方案時,使得切換單元284中的切換器328連接到 節點294。在選"^基於時間/頻率的波段擴展方案和平移方案的情況下,當 選捧外插方案時,切換控制單元182使得切換單元284中的切換器329連 接到節點295,而當選擇學習方案時,使得切換單元284中的切換器329 連接到節點296。
以此方式,切換控制單元182使得切換單元183切換音頻數據的輸出, 使得可以使用指定的波段擴展方法來執行波段擴展。切換控制單元182進 一步使得切換單元271切換頻率信息或音頻數據的輸出,使得可以使用指 定的高範圍分量生成方法生成高範圍分量。此外,切換控制單元182還使 得切換單元284切換高範圍分量的輸出,使得可以4吏用指定的形狀調整方 法調整高範圍分量的形狀。
當按上述方式控制切換單元183、 271和284的操作時,然後執行步 騍S159至S164的處理。然後,回放處理結束。步驟S159至S164的處理 與圖9所示的步驟S17至S22的處理相似,並且省略其描述。
在步驟S160、 S162和S163中,分別(執行)與已經參照圖10至圖 12所描述的以下處理相似的處理對受到了在基於頻率的波段擴展方案的 基礎上的波段擴展處理的樂曲進行回放的處理、對受到了在基於時間的波 段擴展方案的基礎上的波段擴展處理的樂曲進行回放的處理、以及對受到 了在基於時間/頻率的波段擴展方案的基礎上的波段擴展處理的樂曲進行 回放的處理。注意,由已經從切換單元271向其4C供頻率信息或音頻數據的副本生成單元278至283之中的副本生成單元執行用於生成高範圍分量的處理。類似地,由已經從切換單元284向其拔:供高範圍分量的形狀調整單元297至308之中的形狀調整單元執行用於調整高範圍分量的形狀的處理。
例如,假設在步驟S156中,切換控制單元182選^^基於頻率的波段擴展方案、折回方案和外插方案。在此情況下,在步驟S160中對受到了在基於頻率的波段擴展方案的基礎上的波段擴展處理的樂曲進行回放的處理中,副本生成單元278生成高範圍分量,並且形狀調整單元297調整高範圍分量的形狀。
具體地,在與圖10所示的步驟S51的處理相對應的處理中,頻率轉換單元213將音頻數據轉換為頻率信息,並且頻率信息經由切換器321和節點272被提供給副本生成單元278。然後,在與步驟S52的處理相對應的處理中,副本生成單元278生成高範圍分量,並且高範圍分量和頻率信息經由切換器324和節點285被提供給形狀調整單元297。在與步驟S53的處理相對應的處理中,形狀調整單元297調整高範圍分量的形狀。
此後,將形狀調整後的高範圍分量和頻率信息從形狀調整單元297提供給高範圍附加單元233。在與步驟S54和S55的處理相對應的處理中,高範圍附加單元233將高範圍分量附加到頻率信息,並且時間轉換單元215將所得到的頻率信息轉換為音頻lt據。此外,在與步驟S56的處理相對應的處理中,輸出單元144回放樂曲。
可替換地,例如,假設在步驟S156中,切換控制單元182選^^基於時間的波段擴展方案、折回方案和外插方案.在此情況下,在步驟S162中對受到了在基於時間的波段擴展方案的基礎上的波段擴展處理的樂曲進行回放的處理中,副本生成單元280生成高範圍分量,並且形狀調整單元301調整高範圍分量的形狀。
具體地,從切換單元183提供的音頻數據被提供給劃分濾波器單元216,並且使用劃分濾波器單元216對該音頻數據進行波段劃分。將所得到的音頻數據提供給組合濾波器單元218,並且還經由切換器322和節點274提供給副本生成單元280。然後,副本生成單元280使用從劃分濾波器單元216提供的音頻數據、採用折回方案生成高範圍分量,並且經由切換器326和節點289將所生成的高範圍分量提供給形狀調整單元301。
形狀調整單元301使用外插方案調整從副本生成單元280提供的高範
32圍分量的形狀,並且將所得到的高範圍分量提供給組合濾波器單元218。組合濾波器單元218對從形狀調整單元301提供的高範圍分量的頻帶和從劃分濾波器單元216提供的音頻數據的頻帶進行組合,並且將所得到的音頻數據提供給輸出單元144。
可替換地,例如,假設在步驟S156中,切換控制單元182選"^基於時間/頻率的波段擴展方案、折回方案和外插方案,在此情況下,在步驟S163中對受到了在基於時間/頻率的波段擴展方案的基礎上的波段擴展處理的樂曲進行回放的處理中,副本生成單元282生成高範圍分量,並且形狀調整單元305調整高範圍分量的形狀.
具體地,從切換單元183提供的音頻數據被提供給劃分濾波器單元219,並且受到波段劃分。將所得到的音頻數據4C供給頻率轉換單元220。頻率轉換單元220將從劃分濾波器單元219提供的音頻數據轉換為頻率信息,並且將頻率信息換:供給時間轉換單元223,並且還經由切換器323和節點276提供給副本生成單元282。
然後,副本生成單元282使用從頻率轉換單元220提供的頻率信息、採用折回方案生成高範圍分量,並且經由切換器328和節點293將高範圍分量提供給形狀調整單元305。形狀調整單元305使用外插方案調整從副本生成單元282提供的高範圍分量的形狀,並且將形狀調整後的高範圍分量提供給時間轉換單元222。
此外,時間轉換單元222將從形狀調整單元305提供的高範圍分量轉換為音頻數據,並且將音頻數據提供給組合濾波器單元224。時間轉換單元223還將從頻率轉換單元220提供的頻率信息轉換為音頻數據,並且將音頻數據提供給組合濾波器單元224。然後,組合濾波器單元224對從時
數據的頻帶進行組合,並且將所得到的音頻數據提供給輸出單元144。
相應地,除了波段擴展方法之外,可以根據樂曲的分類結果將高範圍分量生成方法和形狀調整方法中的每一個改變為最有效的方法。改變後的方法用於生成高範圍分量並且調整高範圍分量的形狀,這導致了樂曲(音頻)的質量更可靠的改進。
例如,當將樂曲分類為多種類型的樂曲,即表示比如喬士樂或古典樂的類別的音樂類時,針對每一音樂類改變高範圍分量生成方法或形狀調整方法。因此,聲音質量得到改進。具體地,表示古典樂的音樂類中的樂曲,即被分類為古典樂的樂曲,具有包括大量低範圍分量但基本上不包括高範圍分量的特徵。在此情況下,例如,選擇用於使用樂曲中的中間範圍分量生成待添加到樂曲的高範圍分量的高範圍分量生成方法和用於執行形狀調整使得可以將所生成的高範圍分量的水平保持為低的形狀調整方法,並且執行波段擴展。因此,可以實現與原始樂曲的質量相似的質量.
此外,表示搖滾樂的音樂類中的樂曲通常具有頻率分量或頻鐠廣泛存在於人類可聽見範圍上的特徵。在此情況下,例如,選擇用於使用樂曲的中間範圍分量生成高範圍分量的高範圍分量生成方法和用於執行形狀調整使得可以沿著頻域中的低範圍分量和中間範圍分量的功率輪廓的分布而形成所生成的高範圍分量的功率^^廓的形狀調整方法,並且執行波段擴展。因此,可以實現與原始樂曲的質量相似的質量。
因而,由於樂曲的特徵對於每種音樂類而不同,因此對於每一音樂類記錄對於改進聲音質量最有效的波段擴展方法、高範圍分量生成方法和形狀調整方法的組合。根據音樂類使用合適的方法組合來執行波段擴展。這樣對樂曲的質量提供了更可靠的改進。
在前面的描述中,才艮據樂曲的分類結果波段擴展方法、高範圍分量生成方法和形狀調整方法是可選擇的。可替換地,可以由用戶分別地指定這些方法。
在此情況下,例如,當用戶通過^Mt音頻回放裝置131指定波段擴展方法時,對應於由用戶執行的操作的操作信號被提供給切換單元183。然
不是從切換控制單元182發送的指令,根據由操作信號指定的波段擴展方法,將音頻數據的輸出切換到節點184至186之一。
當用戶還指定高範圍分量生成方法時,切換單元271優先地響應於根
令,根據由操作信號指定的高範圍分量生成方法以及已經選擇的波段擴展方法,將輸出切換到切換器321至323之一。
當用戶進一步指定用於調整高範圍分量的形狀的方法時,切換單元
制單元182 i送的指令,根據由操作信號指^的形狀^整方法以及已經選擇的波段擴展方法和高範圍分量生成方法,將輸出切換到切換器324至329
34之一。
以此方式,通過允許用戶按照期望選擇波段擴展方法、高範圍分量生成方法和形狀調整方法,可以使用對於用戶最有效的波段擴展方法、高範圍分量生成方法和形狀調整方法的組合來執行波段擴展。
如上所述,通過統計地處理客觀評價結果和主觀評價結果,獲得對于波段擴展匹配資料庫上的每一音樂類而記錄的波段擴展方法、高範圍分量生成方法和形狀調整方法的組合。這樣不確保用於各個音樂類的方法的這樣的組合在改進聲音質量方面一定對於所有用戶最有效。
此外,用戶並不會感覺同樣的方法組合對於改進聲音質量總是最有效的。在某些情況下,用戶可能希望改變他/她的情緒並且收聽不同的聲音。
為了滿足這種要求,可以實現允許用戶單獨指定波段擴展方法、高範圍分量生成方法和形狀調整方法的靈活配置。這樣促進了每次都採用對於用戶是最適宜的、使用波段擴展方法、高範圍分量生成方法或形狀調整方法的波段擴展.這種配置也可以滿足用戶的個人情感要求,例如改變他/她的情緒,並且使用與平常不同的波段擴展方法執行波段擴展.
此外,在圖13所示的校正單元143中,對於各個波段擴展方法提供被配置為使用同 一高範圍分量生成方法生成高範圍分量的副本生成單元。可替換地,可以對於各個波段擴展方法提供被配置為使用不同方法生成高範圍分量的副本生成單元。
具體地,在校正單元143中,對於基於頻率的波段擴展方案提供分別被配置為使用折回方案和平移方案生成高範圍分量的副本生成單元278和279。此外,對於基於時間的波段擴展方案提供分別被配置為使用折回方案和平移方案生成高範圍分量的副本生成單元280和281。例如,副本生成單元280和281可以被配置為使用與折回方案和平移方案不同的方案來生成高範圍分量。
在校正單元143中,類似地,對於各個波段擴展方法和高範圍分量生成方法提供被配置為使用同一形狀調整方法執行形狀調整的形狀調整單元。可替換地,對于波段擴展方法和高範圍分量生成方法的各個組合可以提供被配置為使用不同形狀調整方法執行形狀調整的形狀調整單元。
此外,圖13所示的校正單元143包括多個形狀調整單元,其被配置為使用同一方法執行形狀調整;和多個副本生成單元,其被配置為使用同一方法生成高範圍分量。可替換地,可以共享某些 狀調整單元和某些副本生成單元。
具體地,例如,切換器325被配置為連接到形狀調整單元299或形狀調整單元300。可替換地,切換器325可以連接到形狀調整單元297或形狀調整單元298,形狀調整單元297或形狀調整單元298使用與形狀調整單元299或形狀調整單元300相同的方法執行形狀調整。在此情況下,校正單元143中的形狀調整單元299和形狀調整單元300不再是必須的,並且可以減小校正單元143的大小。
在這種配置中,高範圍分量並非同時從切換器324和325輸出。因此,多種類型的高範圍分量並非同時輸入到一個形狀調整單元。共享某些形狀調整單元或副本生成單元使得能夠有效構建校正單元143的整個結構。還可以實現校正單元143的大小的減少。
可以通過硬體和軟體來執行上述一系列處理。當由軟體執行這一系列處理時,將構成軟體的程序從網絡或程序記錄^h質安裝到合併到專用硬體的計算機或者能夠通過在其中安裝各種程序而實現各種功能的設備,例如通用個人計算機。
圖15是示出根據程序執行上述一系列處理的計算機的示例硬體配置的框圖。
在計算機中,中央處理單元(CPU) 501、只讀存儲器(ROM) 502和隨M取存儲器(RAM) 503經由總線504彼此連接。
輸V輸出接口 505也連接到總線504。輸V輸出接口 505連接到包括鍵盤、滑鼠和麥克風的輸入單元506、包括顯示器和揚聲器的輸出單元507、包括硬碟和非易失性存儲器的記錄單元508、包括網絡接口的通信單元509、以及用於驅動可移動^h質511,例如磁碟、光碟、磁光碟或半導#^儲器的驅動器510。
在具有上述配置的計算機中,CPU 501經由輸A/輸出接口 505和總線504將記錄在例如記錄單元508中的程序加載到RAM 503,並且執^t^序。相應地,執行上述一系列處理。
可以將由計算機(CPU 501)執行的程序記錄在可移動介質511上,可移動介質511是封裝介質,例如磁碟(包括軟盤)、光碟(例如緻密盤-只讀存儲器(CD-ROM)或數字多功能盤(DVD))、磁光碟、或半導體存儲器),或者可以通過有線或無線傳輸介質,例如區域網、網際網路或數字衛星廣播來^1供所述程序'可以通過將可移動卸介質511放置在驅動器510中而通過輸"輸出接口 505來將程序安裝到記錄單元508上。可替換地,程序可以由通信單元509經由有線或無線傳輸介質來接收,並且被安裝到記錄單元508上。此外,也可以在ROM 502或記錄單元508中預先安裝程序。
由計算機執行的程序可以是用於允許才艮據在此所描述的次序按時間順序方式執行處理的程序,或者可以是用於允許並行地或在期望的時間、例如當調用程序時執行處理的程序。
本發明實施例不限於前述實施例,並且在不脫離本發明範圍的情況下,可以進行各種^"改。
本申請包含涉及在2008年6月13日提交到日本專利局的日本優先權專利申請JP2008-154837的公開主題,其完整內容通過引用合併於此。
本領域技術人員應該理解,根據設計需求以及其它因素可以在所附權利要求或其等同物的範圍內出現各種修改、組合、子組合和改動。
權利要求
1.一種信息處理設備,包括波段擴展裝置,用於執行波段擴展處理,以生成特定頻帶中的分量,並且將所述分量添加到音頻數據;以及控制裝置,用於控制所述波段擴展裝置使用在多種不同波段擴展方法之中確定的波段擴展方法來執行所述波段擴展處理,所述波段擴展方法是針對使用所述音頻數據的特徵所確定的音樂類而預先定義的。
2.根據權利要求1的信息處理設備,其中,所述波段擴展裝置執行波 段擴展處理,以基於通過對已編碼的音頻數據進行解碼所獲得的音頻數據 來生成所述特定頻帶中的分量,並且將所述分量添加到所述音頻數據。
3.根據權利要求2的信息處理設備,其中,所述多種不同波段擴展方 法至少包括用於沿著時間軸執行所述波段擴展處理的波段擴展方法、用 於沿著頻率軸執行所述波段擴展處理的波段擴展方法、以及用於沿著所述 時間軸和所述頻率軸執行所述波段擴展處理的波段擴展方法。
4. 根據權利要求3的信息處理設備,其中,所述音頻數據是用於回放 樂曲的lt據,其中,所述信息處理設備還包括分類裝置,用於基於所述樂曲的音 頻數據將所述樂曲分類為多種音樂類之一,所述多種音樂類是使用樂曲的 特徵預先確定的。
5. 根據權利要求4的信息處理設備,其中,所述波段擴展裝置包括生成裝置,用於使用所述音頻數據生成所述特定頻帶中的分量,以及調整裝置,用於增加或者減少所述特定頻帶中的各個頻率分量,其中,所述控制裝置控制所述調整裝置使用在用於調整所述特定頻帶 中的分量的多種調整方法之中確定的調整方法增加或者減少所述各個頻 率分量,所述調整方法是根據 述分 裝置獲得的分類結果而預先確定的。
6.根據權利要求5的信息處理設備,其中,所述控制裝置控制所述生 成裝置使用在用於生成所述特定頻帶中的分量的多種生成方法之中所確 定的生成方法來生成所述特定頻帶中的分量,所述生成方法^l^艮據所述分 類結果而預先確定的。
7.根據權利要求6的信息處理設備,還包括記錄裝置,用於為所述 多種音樂類中的每一個,記錄指示在多種方法組合之中預先被分配最高評 價的方法組合的信息,所述多種方法組合包括所述多種波段擴展方法、所 述多種生成方法、以及所述多種調整方法,其中,使用所述分類結果和記錄的所述信息來選擇所述波段擴展方 法、所述生成方法和所述調整方法,其中,所述控制裝置控制所述波段擴展裝置使用所選擇的波段擴展方 法、生成方法和調整方法來執行所述波段擴展處理。
8.根據權利要求7的信息處理設備,其中,通過統計地處理客觀評價 結果和主觀評價結果來獲得所述評價,所i^觀評價結果是通過對使用所 述波段擴展處理所獲得的音頻數據進行分析而獲得的。
9. 一種用於信息處理設備的信息處理方法,包括以下步驟執行波段擴展處理,以生成特定頻帶中的分量,並且將所述分量添加 到音頻lt據;以及執行控制以使用在多種不同波段擴展方法之中確定的波段擴展方法 來執行所述波段擴展處理,所述波段擴展方法;1針對4吏用所述音頻lt據的 特徵所確定的音樂類而預先定義的。
10. —種用於使得信息處理設備的計算機執行處理的程序,所述處理 包括以下步驟執行波段擴展處理,以生成特定頻帶中的分量,並且將所述分量添加到音頻lt據;以及執行控制以使用在多種不同波段擴展方法之中確定的波段擴展方法 來執行所述波段擴展處理,所述波段擴展方法;1針對4吏用所述音頻lt據的 特徵所確定的音樂類而預先定義的。
11.一種信息處理設備,包括波段擴展單元,被配置為執行波段擴展處理,以生成特定頻帶中的分 量,並且將所述分量添加到音頻lt據;以及控制單元,被配置為控制所述波段擴展單元使用在多種不同波段擴 展方法之中確定的波段擴展方法來執行所述波段擴展處理,所述波段擴展 方法是對於使用所述音頻數據的特徵所確定的音樂類而預先定義的。
全文摘要
本發明公開了信息處理設備和方法以及程序。該信息處理設備包括波段擴展單元,被配置為執行波段擴展處理,以生成特定頻帶中的分量,並且將該分量添加到音頻數據;以及控制單元,被配置為控制波段擴展單元使用在多種不同波段擴展方法之中確定的波段擴展方法來執行波段擴展處理,波段擴展方法是針對使用音頻數據的特徵所確定的音樂類而預先定義的。
文檔編號G10L21/04GK101604528SQ20091014582
公開日2009年12月16日 申請日期2009年6月15日 優先權日2008年6月13日
發明者井上晃, 劍持千智, 鈴木志朗, 高橋秀介 申請人:索尼株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀