旋律辨識方法與其裝置的製作方法
2023-06-22 23:16:16 1
專利名稱:旋律辨識方法與其裝置的製作方法
技術領域:
本發明涉及旋律辨識領域,尤其涉及一種旋律辨識方法與其裝置。
背景技術:
傳統上,旋律辨識方法的辨識基礎為音高與該音高的總長度。目前旋律辨識技術先建立包含多首曲目的音高信息的旋律資料庫,當使用者哼唱一段旋律之後,擷取該旋律的音高信息,例如音高與音高的總長度等,然後與旋律資料庫作比對,藉以提供可能的對應曲目。一些現有的旋律辨識方法除了比對上述音高信息之外,同時也利用額外輸入的歌曲文字信息或歌詞來輔助辨識。然而,當使用者哼唱輸入不標準時,旋律與旋律資料庫的比對極容易發生誤差而使旋律辨識的成功辨識率無法提升,尤其在使用者哼唱旋律五音不全時。
發明內容
有鑑於此,本發明的實施例提供一種旋律辨識方法,其根據輸入旋律的清晰度並利用二階段的比對以更精確且更有效率地辨識旋律。該旋律辨識方法包括輸入一旋律; 取得該旋律的音高追蹤信息;取得該旋律的節拍信息;由該音高追蹤信息判斷該旋律的一清晰度;若該清晰度大於一預設門檻值,先進行一第一比對,以從一資料庫中篩選出第一批候選歌曲;再進行一第二比對,以從該等第一批候選歌曲中篩選出第二批候選歌曲;以及根據該等第二批候選歌曲決定至少一最後候選歌曲。本發明的實施例更提供一種旋律辨識裝置,包括一接收器,其接收一旋律;一處理器,其取得該旋律的音高追蹤信息與節拍信息,並通過該音高追蹤信息判斷該旋律的一清晰度;以及一比對器,其根據該清晰度進行該旋律與一資料庫的比對;其中若該清晰度大於一預設門檻值,該比對器先進行一第一比對,以從該資料庫中篩選出第一批候選歌曲; 該比對器再進行一第二比對,以從該等第一批候選歌曲中篩選出第二批候選歌曲;其中該比對器根據該等第二批候選歌曲決定至少一最後候選歌曲。本發明實施例旋律辨識方法及裝置,根據輸入旋律的清晰度並利用二階段的比對來辨識旋律,可以更精確且更有效率。
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,並不構成對本發明的限定。在附圖中圖IA所示為根據本發明一實施例的旋律辨識流程圖;圖IB所示為根據本發明另一實施例的旋律辨識流程圖;圖2所示為根據本發明一實施例的旋律辨識裝置示意圖。附圖標號
S100、S110、......S170 步驟;20 旋律辨識裝置200 接收器;210 處理器;212 清晰度模塊;214 音高追蹤模塊;216 拍點檢測模塊;220 比對器;222 音高向量比對模塊;2M 節拍比對模塊;230 資料庫;232 音高語料庫;234 節拍資料庫;240 顯示裝置;250 互動裝置。
具體實施例方式以下說明為本發明的實施例。其目的是要舉例說明本發明一般性的原則,不應視為本發明的限制,本發明的範圍當以權利要求範圍所界定者為準。目前旋律辨識多用音高與音高總長度等音高信息來辨識。然而歌曲的節拍也是重要的特徵,若兩首歌曲的音調相近但是節拍不同,則兩首歌曲很有可能是完全不相同的,因此,若能結合音高信息與節拍信息就可以更有效地辨識旋律;此外,更由於使用者哼唱旋律五音不全(輸入不標準)時,所導致的成功辨識率降低的問題,能得到有效的解決方案。圖IA所示為根據本發明一實施例的旋律辨識方法流程圖。步驟SlOO為輸入旋律, 在一實施例中,可通過使用者對著麥克風哼唱一旋律。使用者對麥克風所哼唱的旋律需要經過合適的取樣以將此旋律數位化成數字音頻(Audio Signal)文件。步驟S120,取得該旋律的音高追蹤信息,例如對上述的輸入旋律進行音高追蹤 (Pitch tracking)以取得音高追蹤信息。音高追蹤的相關技術將於後再述。步驟S122,取得該旋律的節拍信息,例如對上述的輸入旋律進行拍點檢測(Onset detection)以取得節拍信息。拍點檢測的相關技術將於後再述。步驟S130,由該音高追蹤信息判斷該旋律的一清晰度,例如,將音高追蹤信息正規化(Normalize)之後所得的值作為清晰度,清晰度的相關技術將於後再述。步驟S150,若該清晰度大於一預設門檻值,先進行一第一比對,以從一資料庫中篩選出第一批候選歌曲。第一比對可以是音高向量比對。本實施例雖以音高向量比對作為舉例說明,但第一比對並不限於音高向量比對。音高向量比對的相關技術將於後再述。步驟S160,進行一第二比對,以從該等第一批候選歌曲中篩選出第二批候選歌曲。 第二比對是指相異於第一比對的另一種比對方式。例如當第一比對是音高向量比對時,第二比對可為節拍比對,但第二比對並不限於節拍比對。節拍比對的相關技術將於後再述。步驟S170,根據該等第二批候選歌曲決定至少一最後候選歌曲。例如,輸出TOP10首候選歌曲以供使用者參考。圖IB所示為根據本發明另一實施例的旋律辨識方法流程圖。其中步驟和圖IA中步驟相同者,以相同標號進行標示。步驟SlOO為輸入旋律。步驟SllO為對輸入的旋律進行前置處理,前置處理為一般音頻處理時所需要的預處理,包括端點檢測(end-point detection)、預強調(pre-emphasis)、音框切割(frame partitioning)等。端點檢測用來判斷音頻中哪些區段是有聲段、哪些是無聲段或背景噪聲;預強調用來補償高頻部分的信號數位化後所造成的失真;音框切割為將音頻文件每間隔一固定時間切割成一個又一個的音框,相鄰音框之間可以重疊。輸入旋律前置處理完成後,步驟S120和步驟S122分別對前置處理過的輸入旋律進行音高追蹤(Pitch tracking)與拍點檢測(Onset detection),以取得輸入旋律的音高追蹤信息和節拍信息。在一些實施例中,可利用自相關函數(Auto-Correlation Function, ACF)進行音高追蹤,音框s中某個時間點t的自相關函數值計算如下
權利要求
1.一種旋律辨識方法,其特徵在於,所述旋律辨識方法包括 輸入一旋律;取得所述旋律的音高追蹤信息;取得所述旋律的節拍信息;由所述音高追蹤信息判斷所述旋律的一清晰度;若所述清晰度大於一預設門檻值,先進行一第一比對,以從一資料庫中篩選出第一批候選歌曲,再進行一第二比對,以從所述第一批候選歌曲中篩選出第二批候選歌曲;以及根據所述第二批候選歌曲決定至少一最後候選歌曲。
2.如權利要求1所述的旋律辨識方法,其特徵在於,更包括若所述清晰度小於所述預設門檻值,先進行所述第二比對,以從所述資料庫中篩選出第三批候選歌曲,再進行所述第一比對,以從所述第三批候選歌曲中篩選出第四批候選歌曲;以及根據所述第四批候選歌曲決定至少一最後候選歌曲。
3.如權利要求2所述的旋律辨識方法,其特徵在於,所述第一比對為音高向量比對,所述第二比對為節拍比對。
4.如權利要求3所述的旋律辨識方法,其特徵在於,更包括 進行所述旋律的前置處理;其中所述前置處理包括檢測所述旋律的端點、預強調處理以及切割所述旋律的音框。
5.如權利要求4所述的旋律辨識方法,其特徵在於,更包括使用白相關函數或平均差異量函數取得前置處理過的所述旋律的各個音框的所述音高追蹤信息,從所述音高追蹤信息取得各個音框的音高值,並將各個音框的所述音高值轉換為所述旋律的音高向量。
6.如權利要求4所述的旋律辨識方法,其特徵在於,更包括 使用相位偏移檢測所述旋律的拍點以取得所述旋律的所述節拍信息。
7.如權利要求4所述的旋律辨識方法,其特徵在於,更包括 使用光譜通量檢測所述旋律的拍點以取得所述旋律的所述節拍信息。
8.如權利要求5所述的旋律辨識方法,其特徵在於,所述音高向量比對使用線性伸縮將所述旋律的所述音高向量與一音高語料庫的所有音高向量數據作比對。
9.如權利要求3所述的旋律辨識方法,其特徵在於,所述節拍比對使用以動態規劃為基礎的一演算法將所述旋律的所述節拍信息與一節拍資料庫的所有節拍數據作比對,所述節拍資料庫紀錄所述資料庫中每首歌曲的節拍信息。
10.如權利要求8所述的旋律辨識方法,其特徵在於,所述音高語料庫紀錄所述資料庫中每首歌曲的音高向量。
11.如權利要求5所述的旋律辨識方法,其特徵在於,所述清晰度為所述音高追蹤信息正規化後的值,且所述清晰度越高代表所述音高值越準確。
12.如權利要求1所述的旋律辨識方法,其特徵在於,更包括 根據所述第一比對產生一第一評估分數;根據所述第二比對產生一第二評估分數;根據所述第一評估分數與所述第二評估分數產生所述至少一最後候選歌曲中每首歌曲的一評估分數;其中所述評估分數為所述第一評估分數與所述第二評估分數根據一權重比例所組成, 若所述清晰度大於所述預設門檻值則所述權重比例偏重所述第一評估分數,若所述清晰度小於所述預設門檻值則所述權重比例偏重所述第二評估分數,所述評估分數越高與所述旋律的匹配度越高。
13.一種旋律辨識裝置,其特徵在於,所述旋律辨識裝置包括一接收器,其接收一旋律;一處理器,其取得所述旋律的音高追蹤信息與節拍信息,並通過所述音高追蹤信息判斷所述旋律的一清晰度;以及一比對器,其根據所述清晰度進行所述旋律與一資料庫的比對;其中若所述清晰度大於一預設門檻值,所述比對器先進行一第一比對,以從所述資料庫中篩選出第一批候選歌曲;所述比對器再進行一第二比對,以從所述第一批候選歌曲中篩選出第二批候選歌曲;其中所述比對器根據所述第二批候選歌曲決定至少一最後候選歌曲。
14.如權利要求13所述的旋律辨識裝置,其特徵在於,若所述清晰度小於所述預設門檻值,所述比對器先進行所述第二比對,以從所述資料庫中篩選出第三批候選歌曲,再進行所述第一比對,以從所述第三批候選歌曲中篩選出第四批候選歌曲,然後根據所述第四批候選歌曲決定至少一最後候選歌曲。
15.如權利要求14所述的旋律辨識裝置,其特徵在於,所述第一比對為音高向量比對, 所述第二比對為節拍比對。
16.如權利要求13所述的旋律辨識裝置,其特徵在於,更包括一顯示裝置,其顯示所述至少一最後候選歌曲。
17.如權利要求16所述的旋律辨識裝置,其特徵在於,更包括一互動裝置,其根據所述旋律的所述節拍信息透過預定的燈光閃爍與動作做出對應所述節拍信息的互動播放。
全文摘要
本發明公開了一種旋律辨識裝置,包括一接收器,其接收一旋律;一處理器,其取得所述旋律的音高追蹤信息與節拍信息,並通過所述音高追蹤信息判斷所述旋律的一清晰度;以及一比對器,其根據所述清晰度進行所述旋律與一資料庫的比對;其中若所述清晰度大於一預設門檻值,所述比對器先進行一第一比對,以從所述資料庫中篩選出第一批候選歌曲;所述比對器再進行一第二比對,以從所述第一批候選歌曲中篩選出第二批候選歌曲;其中所述比對器根據所述第二批候選歌曲決定至少一最後候選歌曲。本發明實施例旋律辨識方法及裝置,根據輸入旋律的清晰度並利用二階段的比對來辨識旋律,可以更精確且更有效率。
文檔編號G10L15/00GK102479509SQ20111003214
公開日2012年5月30日 申請日期2011年1月28日 優先權日2010年11月29日
發明者葉子雋, 張智星, 遊信文, 王崇喆, 王文男, 許丞佑 申請人:財團法人資訊工業策進會