新四季網

音樂搜索設備及方法、程序以及記錄介質的製作方法

2023-07-05 09:55:01

專利名稱:音樂搜索設備及方法、程序以及記錄介質的製作方法
技術領域:
本技術涉及音樂搜索設備及方法、程序以及記錄介質,並且尤其涉及能夠從輸入信號中設別出音樂的音樂搜索設備及方法、程序以及記錄介質。
背景技術:
過去,為了識別作為輸入信號而輸入的音樂,進行將輸入信號的特徵量與作為要被識別的音樂的候選的參考信號的特徵量進行匹配的處理。然而,例如,當諸如戲劇的電視節目的音頻源被用作輸入信號時,包括諸如對話、聲音(環境噪聲)、白噪聲、粉紅噪聲以及音效的非音樂信號分量的噪聲分量(在下文中簡稱為「噪聲 」)經常與諸如背景音樂(BGM)的音樂信號分量混合,並且由這種噪聲導致的輸入信號的特徵量的變化影響匹配處理結果。就這一點而言,已經提出了如下技術該技術使用屏蔽模式來屏蔽輸入信號的特徵量中具有低可靠性的分量,從而只使用具有高可靠性的分量來進行匹配處理。特別地,針對特徵矩陣預先準備多種屏蔽模式,其中特徵矩陣代表被變換為時頻域中的信號的輸入信號的特徵量,而屏蔽模式用於屏蔽與預定的時頻域相對應的矩陣分量。使用所有屏蔽模式進行輸入信號的特徵量與資料庫中多個參考信號的特徵量之間的匹配處理。被計算出最高相似度的那個參考信號的音樂被識別為輸入信號的音樂(例如,參見日本專利申請公開(JP-A) 2009-276776)。

發明內容
然而,難以評估輸入信號上疊加有噪聲的時間和頻率,並且難以預先準備適合於輸入信號的屏蔽模式。因此,在JP-A 2009-276776中公開的技術中,難以進行適當的匹配處理,因而很難以高準確度從音樂與噪聲混合的輸入信號中識別出音樂。同時,還存在這樣一種技術該技術產生屏蔽模式,使得輸入信號中平均功率高的時間段中的分量被視為疊加有音樂以外的噪聲的分量,並且只使用輸入信號中平均功率低的時間段的特徵量進行匹配。根據該技術,儘管可以產生取決於輸入信號的屏蔽模式,但是該屏蔽模式中沒有考慮到頻率分量,並且該屏蔽模式不一定是適於輸入信號的屏蔽模式。此外,如圖I的左側所示,在時頻域的輸入信號中,音樂信號分量DM中包括了來自對話的噪聲Dv。在此情況下,在該技術中,只使用對話中斷的區域SI和S2中的幾個段的特徵量來進行匹配處理。因此,很難以高準確度從音樂與噪聲混合的輸入信號中識別出音樂。為了以高準確度從音樂與噪聲混合的輸入信號中識別出音樂,希望使用如圖I的右側所示的區域S3和S4中的音樂信號分量Dm的特徵量來進行匹配處理。本技術是鑑於上述問題而作出的,並且希望以高準確度從輸入信號中識別出音樂。根據本技術的一實施例,提供了一種音樂搜索設備,用於將輸入信號與僅包括音樂的參考信號進行比較並識別所述輸入信號的音樂,所述音樂搜索設備包括指數計算單元,用於基於變換到時頻域的所述輸入信號的每個區域的信號分量的強度和通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數;相似度計算單元,用於計算基於所述指數而獲得的所述輸入信號的每個區域中的特徵量與基於對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特徵量之間的相似度;以及音樂識別單元,用於基於所述相似度來識別所述輸入信號的音樂。所述指數計算單元可以包括最大點檢測單元,用於從預定時間段的所述輸入信號中檢測所述信號分量的強度為最大的最大點;以及近似處理單元,用於通過模板函數對所述最大點附近的所述信號分量的強度進行近似,並且,所述指數計算單元可以基於所述最大點附近的所述信號分量的強度與所述模板函數之間的誤差來計算所述指數。所述指數計算單元可以根據所述模板函數的曲率來調節所述指數。所述指數計算單元可以根據所述模板函數的最大點的頻率來調節所述指數。所述音樂搜索設備可以進一步包括權重分布產生單元,用於基於所述輸入信號的每個區域中的第一特徵量和所述參考信號的每個區域中的第一特徵量來產生所述輸入信號和所述參考信號的每個區域上的權重分布,並且計算所述輸入信號的每個區域中的第一特徵量與所述參考信號的每個區域中的第一特徵量之間的第一特徵量相似度。所述相似度計算單元基於所述權重分布的權重和所述第一特徵量相似度來計算所述輸入信號的每個區域中的第二特徵量與所述參考信號的每個區域中的第二特徵量之間的相似度。所述音樂搜索設備可以進一步包括第一特徵量計算單元,用於計算通過在時間方向上過濾所述指數而獲得的所述指數的時間平均量,作為所述第一特徵量;以及第二特徵量計算單元,用於計算通過在時間方向上過濾所述指數而獲得的所述指數的時間變化量,作為所述第二特徵量。
根據本技術的另一實施例,一種音樂搜索方法將輸入信號與僅包括音樂的參考信號進行比較並識別所述輸入信號的音樂,所述音樂搜索方法可以包括基於變換到時頻域的所述輸入信號的每個區域的信號分量的強度以及通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數;計算基於所述指數而獲得的所述輸入信號的每個區域中的特徵量與基於對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特徵量之間的相似度;以及基於所述相似度識別所述輸入信號的音樂。根據本技術的另一實施例,提供了一種程序或者由記錄介質記錄的程序,所述程序使計算機執行將輸入信號與僅包括音樂的參考信號進行比較並識別所述輸入信號的音樂的信號處理。所述信號處理可以包括基於變換到時頻域的所述輸入信號的每個區域的信號分量的強度以及通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數;計算基於所述指數而獲得的所述輸入信號的每個區域中的特徵量與基於對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特徵量之間的相似度;以及基於所述相似度識別所述輸入信號的音樂。根據本技術的另一實施例,基於變換到時頻域的輸入信號的每個區域的信號分量的強度和通過對該信號分量的強度進行近似而獲得的函數來計算該信號分量的音調指數。計算基於該指數而獲得的輸入信號的每個區域中的特徵量與基於對變換到該時頻域的參考信號計算出的指數而獲得的參考信號的每個區域中的特徵量之間的相似度。基於該相似度識別該輸入信號的音樂。根據本技術的上述實施例,能夠以高準確度從輸入信號中識別出音樂。


圖I是用於描述用於匹配處理的輸入信號的特徵量的圖;圖2是示出根據本技術實施例的音樂搜索設備的配置的框圖;圖3是示出指數計算單元的功能配置示例的框圖;圖4是示出第一特徵量計算單元的功能配置示例的框圖;
圖5是示出第二特徵量計算單元的功能配置示例的框圖;圖6是用於描述音樂識別處理的流程圖;圖7是用於描述輸入信號分析處理的流程圖;圖8是用於描述指數計算處理的流程圖;圖9是用於描述峰值檢測的圖;圖10是用於描述對峰值周圍的功率譜進行近似的圖;圖11是用於描述指數調節函數的圖;圖12是用於描述輸入信號的音調指數的示例的圖;圖13是用於描述第一特徵量計算處理的流程圖;圖14是用於描述第一特徵量的示例的圖;圖15是用於描述第二特徵量計算處理的流程圖;圖16是用於描述第二特徵量的示例的圖;圖17是用於描述參考信號分析處理的流程圖;圖18是用於描述匹配處理的流程圖;圖19是用於描述屏蔽模式的產生示例的圖;圖20是用於描述輸入信號的第二特徵量與參考信號的第二特徵量之間的匹配處理的圖;圖21是示出按時間序列排列的相似度的示例的圖;圖22是用於描述相似度的時間連續性的圖;以及圖23是示出計算機的硬體配置示例的框圖。
具體實施例方式下文中將參照附圖詳細描述本發明的優選實施例。注意,在本文字說明和附圖中,由相同的附圖標記來表示具有基本相同的功能和結構的結構元件,並且省略對這些結構元件的重複說明。根據本技術的實施例,提供了一種音樂搜索設備,用於將輸入信號與僅包括音樂的參考信號進行比較並識別所述輸入信號的音樂,所述音樂搜索設備包括指數計算單元,用於基於變換到時頻域的所述輸入信號的每個區域的信號分量的強度和通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數;相似度計算單元,用於計算基於所述指數而獲得的所述輸入信號的每個區域中的特徵量與基於對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特徵量之間的相似度;以及音樂識別單元,用於基於所述相似度來識別所述輸入信號的音樂。根據本技術的實施例,提供了一種音樂搜索方法,用於將輸入信號與僅包括音樂的參考信號進行比較並識別所述輸入信號的音樂,所述音樂搜索方法包括基於變換到時頻域的所述輸入信號的每個區域的信號分量的強度以及通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數;計算基於所述指數而獲得的所述輸入信號的每個區域中的特徵量與基於對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特徵量之間的相似度;以及基於所述相似度識別所述輸入信號的音樂。下文中將參照附圖描述本技術的實施例。將按照以下順序進行描述。
I.音樂搜索設備的配置2.音樂識別處理〈I.音樂搜索設備的配置>圖2示出根據本技術實施例的音樂搜索設備的配置。圖2的音樂搜索設備11通過將音樂信號分量與諸如對話或環境噪聲的噪聲分量(噪聲)相混合的輸入信號與包括未混合有噪聲的音樂信號分量的參考信號進行比較來識別輸入信號的音樂,然後輸出識別結果。音樂搜索設備11包括輸入信號分析單元31、參考信號分析單元32和匹配處理單元33。輸入信號分析單元31分析從外部裝置等輸入的輸入信號,從輸入信號中提取代表輸入信號的特徵的特徵量,並將該特徵量輸出到匹配處理單元33。輸入信號分析單元31包括剪切單元51、時頻變換單元52、指數計算單元53、第一特徵量計算單元54和第二特徵量計算單元55。剪切單元51從輸入信號中剪切出與預定時間相對應的信號,並且將剪切出的信號輸出到時頻變換單元52。時頻變換單元52將來自剪切單元51的與預定時間相對應的輸入信號變換為時頻域中的信號(譜圖,spectrogram),並且將該譜圖提供給指數計算單元53。指數計算單元53根據來自時頻變換單元52的輸入信號的譜圖,針對譜圖的每個時頻域來計算代表信號分量包括音樂的音調指數,並且將計算出的音調指數提供給第一特徵量計算單元54和第二特徵量計算單元55。在此,音調指數代表音調關於時間的穩定性,這種穩定性是由輸入信號中每個頻率的信號分量的強度(功率譜)來表示的。一般來說,由於音樂包括特定聲調(頻率)的聲音並且連續地發聲,所以音調在時間方向上是穩定的。然而,對話具有音調在時間方向上不穩定的特徵,並且,在環境噪聲中,在時間方向上連續的音調是很少見的。就這一點而言,指數計算單元53通過對與預定時間段相對應的輸入信號中音調的存在或不存在以及音調的穩定性進行量化,來計算音調指數。第一特徵量計算單元54基於來自指數計算單元53的譜圖的每個時頻域的音調指數來計算第一特徵量,並將第一特徵量提供給匹配處理單元33,該第一特徵量是代表輸入信號音樂度如何(音樂性)的特徵量。第二特徵量計算單元55基於來自指數計算單元53的譜圖的每個時頻域的音調指數來計算第二特徵量,並將第二特徵量提供給匹配處理單元33,該第二特徵量是代表輸入信號的音樂的特性的特徵量。參考信號分析單元32分析存儲在存儲單元(未示出)中的或者從外部裝置輸入的參考信號,從參考信號中提取代表參考信號的特徵的特徵量,並且將所提取的特徵量提供給匹配處理單元33。參考信號分析單元32包括時頻變換單元61、指數計算單元62、第一特徵量計算單元63和第二特徵量計算單元64。時頻變換單元61將參考信號變換為譜圖,並且將該譜圖提供給指數計算單元62。指數計算單元62根據來自時頻變換單元61的參考信號的譜圖,針對譜圖的每個時頻域來計算表示信號分量包括音樂的音調指數,並且將計算出的音調指數提供給第一特徵量計算單元63和第二特徵量計算單元64。 第一特徵量計算單元63基於來自指數計算單元62的譜圖的每個時頻域的音調指數來計算第一特徵量,並將第一特徵量提供給匹配處理單元33,該第一特徵量是代表參考信號的音樂性的特徵量。第二特徵量計算單元64基於來自指數計算單元62的譜圖的每個時頻域的音調指數來計算第二特徵量,並將第二特徵量提供給匹配處理單元33,該第二特徵量是代表參考信號的音樂的特性的特徵量。匹配處理單元33通過基於來自輸入信號分析單元31的輸入信號的第一特徵量和來自參考信號分析單元32的參考信號的第一特徵量進行來自輸入信號分析單元31的輸入信號的第二特徵量與來自參考信號分析單元32的參考信號的第二特徵量之間的匹配處理,來識別包括在輸入信號中的音樂。匹配處理單元33包括屏蔽模式產生單元71、相似度計算單元72和比較確定單元73。屏蔽模式產生單兀71基於來自輸入信號分析單兀31的輸入信號的每個時頻域的第一特徵量和來自參考信號分析單元32的參考信號的每個時頻域的第一特徵量,產生被用於輸入信號的第二特徵量與參考信號的第二特徵量之間的匹配處理的屏蔽模式,然後將所產生的屏蔽模式提供給相似度計算單元72。此外,屏蔽模式產生單元71還計算第一特徵量相似度,並將第一特徵量相似度提供給相似度計算單元72,該第一特徵量相似度是來自輸入信號分析單元31的輸入信號的每個時頻域的第一特徵量與來自參考信號分析單元32的參考信號的每個時頻域的第一特徵量之間的相似度。相似度計算單元72使用來自屏蔽模式產生單元71的屏蔽模式和第一特徵量相似度,計算來自輸入信號分析單元31的輸入信號的第二特徵量與來自參考信號分析單元32的參考信號的第二特徵量之間的相似度,並且將計算出的相似度提供給比較確定單元73。比較確定單元73基於來自相似度計算單元72的相似度,確定包括在輸入信號中的音樂是否是參考信號的音樂,並且輸出代表參考信號的音樂的屬性的音樂屬性信息作為識別結果。[指數計算單元的配置]接下來,將參照圖3描述圖2中所示的指數計算單元53的詳細配置。圖3的指數計算單元53包括時間段選擇單元81、峰值檢測單元82、近似處理單元83、音調度計算單元84和輸出單元85。時間段選擇單元81在來自時頻變換單元52的輸入信號的譜圖中選擇預定時間段的譜圖,並且將所選擇的譜圖提供給峰值檢測單元82。峰值檢測單元82在時間段選擇單元81所選擇的預定時間段(時幀)的譜圖中檢測峰值,該峰值是每個單位頻率處信號分量的強度最強的點。近似處理單元83通過預定函數來對該預定時間段的譜圖中由峰值檢測單元82檢測到的峰值周圍的信號分量的強度(功率譜)進行近似。音調度計算單元84基於由近似處理單元83近似的預定函數與由峰值檢測單元82 檢測到的峰值周圍的功率譜之間的距離(誤差),計算通過在與該預定時間段相對應的譜圖上對音調指數進行量化而獲得的音調度。輸出單元85保持由音調度計算單元84計算出的、與該預定時間段相對應的譜圖上的音調度。輸出單元85將所保持的所有時間段的譜圖上的音調度提供給第一特徵量計算單元54和第二特徵量計算單元55,作為剪切單元51所剪切出的與預定時間相對應的輸入信號的音調指數。以此方式,在時頻域中針對每個預定時間段並針對每個單位頻率來計算具有音調度(元素)的音調指數。[第一特徵量計算單元的配置]接下來,將參照圖4描述圖2中所示的第一特徵量計算單元54的詳細配置。圖4的第一特徵量計算單元54包括過濾處理單元91、再採樣處理單元92和二值化處理單元93。過濾處理單元91通過在時間方向上對來自指數計算單元53的、在輸入信號的時頻域中的每個預定時間段和每個單位頻率處具有音調度(元素)的音調指數進行過濾,來計算音調指數的時間平均量,並且將該時間平均量提供給再採樣處理單元92,作為代表輸入信號的音樂性的第一特徵量。再採樣處理單元92在時間方向上對來自過濾處理單元91的第一特徵量進行再採樣(向下採樣),並且將向下採樣的第一特徵量提供給二值化處理單元93。二值化處理單元93對來自再採樣處理單元92的向下採樣的第一特徵量進行二值化處理,並且將得到的第一特徵量提供給匹配處理單元33。[第二特徵量計算單元的配置]接下來,將參照圖5描述圖2中所示的第二特徵量計算單元55的詳細配置。圖5中所示的第二特徵量計算單元55包括過濾處理單元101、再採樣處理單元102和三值化處理單元103。過濾處理單元101通過在時間方向上對來自指數計算單元53的、在輸入信號的時頻域中的每個預定時間段和每個單位頻率處具有音調度(元素)的音調指數進行過濾,來計算音調指數的時間變化量,並且將該時間變化量提供給再採樣處理單元102,作為代表輸入信號的音樂的特性的第二特徵量。再採樣處理單元102在時間方向上對來自過濾處理單元101的第二特徵量進行再採樣(向下採樣),並且將向下採樣的第二特徵量提供給三值化處理單元103。三值化處理單元103對來自再採樣處理單元102的向下採樣的第二特徵量進行三值化處理,並且將得到的第二特徵量提供給匹配處理單元33。圖2中所示的參考信號分析單元32的指數計算單元62、第一特徵量計算單元63和第二特徵量計算單元64與輸入信號分析單元31的指數計算單元53、第一特徵量計算單元54和第二特徵量計算單元55具有相同的功能,並且將省略其詳細描述。<2.音樂識別處理〉接下來,將參考圖6的流程圖描述音樂搜索設備11的音樂識別處理。當包括要被識別的音樂的輸入信號被輸入到音樂搜索設備11時,音樂識別處理開始。輸入信號在時間上連續地輸入到音樂搜索設備11。在步驟SI I中,輸入信號分析單元31執行輸入信號分析處理以分析從外部裝置輸入的輸入信號,並且從輸入信號中提取輸入信號的特徵量。 [輸入信號分析處理的細節]在此,將參照圖7的流程圖來描述圖6的流程圖的步驟Sll中的輸入信號分析處理的細節。在步驟S31中,輸入信號分析單元31的剪切單元51從輸入信號中剪切出與預定時間(例如,15秒)相對應的信號,並且將剪切出的信號提供給時頻變換單元52。在步驟S32中,時頻變換單元52使用諸如Hann窗口的窗口函數或者使用離散傅立葉變換(DFT)等,將來自剪切單元51的與預定時間相對應的輸入信號變換為譜圖,並且將該譜圖提供給指數計算單元53。在此,窗口函數不局限於Hann函數,並且可以使用正弦窗口或哈明窗口(Hamming window)。此外,本發明不局限於DFT,並且可以使用離散餘弦變換(DCT)。此外,變換後的譜圖可以是功率譜、振幅譜和對數振幅譜中的任何一個。此外,為了增加頻率解析度,可以通過補零(zero-padding)過採樣來將頻率變換長度增加為大於窗口的長度(例如,兩倍或四倍)。在步驟S33中,指數計算單元53執行指數計算處理,因而根據來自時頻變換單元52的輸入信號的譜圖計算譜圖的每個時頻域中的輸入信號的音調指數。[指數計算處理的細節]在此,將參照圖8的流程圖描述圖7的流程圖的步驟S33中的指數計算處理的細節。在步驟S51中,指數計算單元53的時間段選擇單元81在來自時頻變換單元32的輸入信號的譜圖中選擇預定時間段(例如,在具有25秒持續時間的輸入信號的第一秒期間)的譜圖,並且將所選擇的譜圖提供給峰值檢測單元82。在步驟S52中,峰值檢測單元82針對每個時幀(時間區間)而在時間段選擇單元81所選擇的與一秒相對應的譜圖中檢測峰值,該峰值是時頻域中每個頻帶上的信號分量的功率譜(強度)為該頻帶附近最強的那個點。例如,在圖9的上部所示的變換到時頻域的輸入信號的譜圖中,在某一幀的某一頻率附近的時頻域r中檢測到圖9的下部所示的峰值p。在步驟S53中,近似處理單元83通過作為預先定義的典型函數的模板函數,對時間段選擇單元81所選擇的與一秒相對應的譜圖上由峰值檢測單元82檢測到的每個時幀的每個頻帶的峰值周圍的功率譜進行近似。在下文中,該模板函數是二次函數,但不限於二次函數。該模板函數可以是任何其它函數,如三次函數或更高次函數的高維函數或者三角函數。如上所述,在圖9的下側檢測到峰值P。然而,具有峰值的功率譜不局限於在時間方向上穩定的音調(在下文中稱為「持續音調」)。由於峰值可以是由諸如噪聲、旁瓣、幹擾或隨時間變化的音調的信號分量所引起的,所以可能無法基於峰值適當地計算出音調指數。此外,由於DFT峰值是離散的,所以峰值頻率不一定是真正的峰值頻率。根據Proc. I CMC,87 中 J. 0. Smith III 和 X. Serra 的文獻「PARSHL Apro gram foranalysis/synthesis of inharmonic sounds based on asinusoidal representation,,,可以通過二次函數來對某一時幀中峰值周圍的對數功率譜的值進行近似,而與該值是音樂還是人類語音無關。這樣,在本技術中,通過二次函數對每個時幀的每個頻帶的峰值周圍的功率譜進行近似。此外,在本技術中,在以下假定之下確定峰值是否由持續音調引起。
a)通過經由在時間方向上擴展二次函數而獲得的函數來對持續音調進行近似。b)因為由音樂導致的峰值在時間方向上是持續的,所以對頻率隨時間的變化進行零階近似(zero-order approximation)(不改變)。c)需要在一定程度上允許振幅隨時間的變化,並且例如通過二次函數來對該變化進行近似。這樣,如圖10中所示,通過經由在某一時幀中在時間方向上擴展二次函數而獲得的隧道式函數(tunnel type function)(四次函數)來對持續音調建模,並且可以由下面關於時間t和頻率《的公式(I)來代表該持續音調。這裡,表示峰值頻率。[公式I]g(t,co) = f ( co - co p) 2+ct2+dt+e ---(I)這樣,通過在所關注的峰值周圍基於假定a)至c)應用四次函數(例如通過最小二乘近似)而獲得的誤差可被用作音調(持續音調)指數。也就是說,下面的公式(2)可被用作誤差函數。[公式2]J(a, b, c, d, e) = Z (f (k, n) -g(k, n))2 ^min
「 …(2)在公式⑵中,f(k,n)表示第n幀和第k區間的DFT譜,而g(k,n)是與表示持續音調的模型的公式(I)具有相同涵義的函數,並由下面的公式(3)來表示。[公式3]
權利要求
1.一種音樂搜索設備,用於將輸入信號與僅包括音樂的參考信號進行比較並識別所述輸入信號中的音樂,所述音樂搜索設備包括 指數計算單元,用於基於變換到時頻域的所述輸入信號的每個區域的信號分量的強度和通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數; 相似度計算單元,用於計算基於所述指數而獲得的所述輸入信號的每個區域中的特徵量與基於對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特徵量之間的相似度;以及 音樂識別單元,用於基於所述相似度來識別所述輸入信號中的音樂。
2.根據權利要求I所述的音樂搜索設備,其中,所述指數計算單元包括 最大點檢測單元,用於從預定時間段的所述輸入信號中檢測所述信號分量的強度為最大的最大點;以及 近似處理單元,用於通過模板函數對所述最大點附近的所述信號分量的強度進行近似,以及 其中,所述指數計算單元基於所述最大點附近的所述信號分量的強度與所述模板函數之間的誤差來計算所述指數。
3.根據權利要求2所述的音樂搜索設備,其中,所述指數計算單元根據所述模板函數的曲率來調節所述指數。
4.根據權利要求2所述的音樂搜索設備,其中,所述指數計算單元根據所述模板函數的最大點的頻率來調節所述指數。
5.根據權利要求I所述的音樂搜索設備,進一步包括 權重分布產生單元,用於基於所述輸入信號的每個區域中的第一特徵量和所述參考信號的每個區域中的第一特徵量來產生所述輸入信號和所述參考信號的每個區域上的權重分布,並且計算所述輸入信號的每個區域中的第一特徵量與所述參考信號的每個區域中的第一特徵量之間的第一特徵量相似度, 其中,所述相似度計算單元基於所述權重分布的權重和所述第一特徵量相似度來計算所述輸入信號的每個區域中的第二特徵量與所述參考信號的每個區域中的第二特徵量之間的相似度。
6.根據權利要求5所述的音樂搜索設備,進一步包括 第一特徵量計算單元,用於計算通過在時間方向上過濾所述指數而獲得的所述指數的時間平均量,作為所述第一特徵量;以及 第二特徵量計算單元,用於計算通過在時間方向上過濾所述指數而獲得的所述指數的時間變化量,作為所述第二特徵量。
7.一種音樂搜索方法,用於將輸入信號與僅包括音樂的參考信號進行比較並識別所述輸入信號中的音樂,所述音樂搜索方法包括 基於變換到時頻域的所述輸入信號的每個區域的信號分量的強度以及通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數; 計算基於所述指數而獲得的所述輸入信號的每個區域中的特徵量與基於對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特徵量之間的相似度;以及基於所述相似度識別所述輸入信號中的音樂。
8.一種使計算機執行信號處理的程序,所述信號處理將輸入信號與僅包括音樂的參考信號進行比較並識別所述輸入信號中的音樂,所述信號處理包括 基於變換到時頻域的所述輸入信號的每個區域的信號分量的強度以及通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數; 計算基於所述指數而獲得的所述輸入信號的每個區域中的特徵量與基於對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特徵量之間的相似度;以及 基於所述相似度識別所述輸入信號中的音樂。
9.一種記錄權利要求8中所述的程序的記錄介質。
全文摘要
本發明提供了音樂搜索設備及方法、程序以及記錄介質。指數計算單元基於變換到時頻域的所述輸入信號的每個區域的信號分量的強度和通過對所述信號分量的強度進行近似而獲得的函數,計算所述信號分量的音調指數。相似度計算單元計算基於所述指數而獲得的所述輸入信號的每個區域中的特徵量與基於對變換到所述時頻域的所述參考信號計算出的指數而獲得的所述參考信號的每個區域中的特徵量之間的相似度。音樂識別單元基於所述相似度來識別所述輸入信號中的音樂。本技術可應用於從輸入信號中識別音樂的音樂搜索設備。
文檔編號G10L11/00GK102750948SQ20121010728
公開日2012年10月24日 申請日期2012年4月12日 優先權日2011年4月19日
發明者安部素嗣, 澁谷崇 申請人:索尼公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀