新四季網

旋律辨識方法與其裝置的製作方法

2023-06-22 23:16:16

專利名稱:旋律辨識方法與其裝置的製作方法
技術領域:
本發明涉及旋律辨識領域,尤其涉及一種旋律辨識方法與其裝置。
背景技術:
傳統上,旋律辨識方法的辨識基礎為音高與該音高的總長度。目前旋律辨識技術先建立包含多首曲目的音高信息的旋律資料庫,當使用者哼唱一段旋律之後,擷取該旋律的音高信息,例如音高與音高的總長度等,然後與旋律資料庫作比對,藉以提供可能的對應曲目。一些現有的旋律辨識方法除了比對上述音高信息之外,同時也利用額外輸入的歌曲文字信息或歌詞來輔助辨識。然而,當使用者哼唱輸入不標準時,旋律與旋律資料庫的比對極容易發生誤差而使旋律辨識的成功辨識率無法提升,尤其在使用者哼唱旋律五音不全時。

發明內容
有鑑於此,本發明的實施例提供一種旋律辨識方法,其根據輸入旋律的清晰度並利用二階段的比對以更精確且更有效率地辨識旋律。該旋律辨識方法包括輸入一旋律; 取得該旋律的音高追蹤信息;取得該旋律的節拍信息;由該音高追蹤信息判斷該旋律的一清晰度;若該清晰度大於一預設門檻值,先進行一第一比對,以從一資料庫中篩選出第一批候選歌曲;再進行一第二比對,以從該等第一批候選歌曲中篩選出第二批候選歌曲;以及根據該等第二批候選歌曲決定至少一最後候選歌曲。本發明的實施例更提供一種旋律辨識裝置,包括一接收器,其接收一旋律;一處理器,其取得該旋律的音高追蹤信息與節拍信息,並通過該音高追蹤信息判斷該旋律的一清晰度;以及一比對器,其根據該清晰度進行該旋律與一資料庫的比對;其中若該清晰度大於一預設門檻值,該比對器先進行一第一比對,以從該資料庫中篩選出第一批候選歌曲; 該比對器再進行一第二比對,以從該等第一批候選歌曲中篩選出第二批候選歌曲;其中該比對器根據該等第二批候選歌曲決定至少一最後候選歌曲。本發明實施例旋律辨識方法及裝置,根據輸入旋律的清晰度並利用二階段的比對來辨識旋律,可以更精確且更有效率。


此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,並不構成對本發明的限定。在附圖中圖IA所示為根據本發明一實施例的旋律辨識流程圖;圖IB所示為根據本發明另一實施例的旋律辨識流程圖;圖2所示為根據本發明一實施例的旋律辨識裝置示意圖。附圖標號
S100、S110、......S170 步驟;20 旋律辨識裝置200 接收器;210 處理器;212 清晰度模塊;214 音高追蹤模塊;216 拍點檢測模塊;220 比對器;222 音高向量比對模塊;2M 節拍比對模塊;230 資料庫;232 音高語料庫;234 節拍資料庫;240 顯示裝置;250 互動裝置。
具體實施例方式以下說明為本發明的實施例。其目的是要舉例說明本發明一般性的原則,不應視為本發明的限制,本發明的範圍當以權利要求範圍所界定者為準。目前旋律辨識多用音高與音高總長度等音高信息來辨識。然而歌曲的節拍也是重要的特徵,若兩首歌曲的音調相近但是節拍不同,則兩首歌曲很有可能是完全不相同的,因此,若能結合音高信息與節拍信息就可以更有效地辨識旋律;此外,更由於使用者哼唱旋律五音不全(輸入不標準)時,所導致的成功辨識率降低的問題,能得到有效的解決方案。圖IA所示為根據本發明一實施例的旋律辨識方法流程圖。步驟SlOO為輸入旋律, 在一實施例中,可通過使用者對著麥克風哼唱一旋律。使用者對麥克風所哼唱的旋律需要經過合適的取樣以將此旋律數位化成數字音頻(Audio Signal)文件。步驟S120,取得該旋律的音高追蹤信息,例如對上述的輸入旋律進行音高追蹤 (Pitch tracking)以取得音高追蹤信息。音高追蹤的相關技術將於後再述。步驟S122,取得該旋律的節拍信息,例如對上述的輸入旋律進行拍點檢測(Onset detection)以取得節拍信息。拍點檢測的相關技術將於後再述。步驟S130,由該音高追蹤信息判斷該旋律的一清晰度,例如,將音高追蹤信息正規化(Normalize)之後所得的值作為清晰度,清晰度的相關技術將於後再述。步驟S150,若該清晰度大於一預設門檻值,先進行一第一比對,以從一資料庫中篩選出第一批候選歌曲。第一比對可以是音高向量比對。本實施例雖以音高向量比對作為舉例說明,但第一比對並不限於音高向量比對。音高向量比對的相關技術將於後再述。步驟S160,進行一第二比對,以從該等第一批候選歌曲中篩選出第二批候選歌曲。 第二比對是指相異於第一比對的另一種比對方式。例如當第一比對是音高向量比對時,第二比對可為節拍比對,但第二比對並不限於節拍比對。節拍比對的相關技術將於後再述。步驟S170,根據該等第二批候選歌曲決定至少一最後候選歌曲。例如,輸出TOP10首候選歌曲以供使用者參考。圖IB所示為根據本發明另一實施例的旋律辨識方法流程圖。其中步驟和圖IA中步驟相同者,以相同標號進行標示。步驟SlOO為輸入旋律。步驟SllO為對輸入的旋律進行前置處理,前置處理為一般音頻處理時所需要的預處理,包括端點檢測(end-point detection)、預強調(pre-emphasis)、音框切割(frame partitioning)等。端點檢測用來判斷音頻中哪些區段是有聲段、哪些是無聲段或背景噪聲;預強調用來補償高頻部分的信號數位化後所造成的失真;音框切割為將音頻文件每間隔一固定時間切割成一個又一個的音框,相鄰音框之間可以重疊。輸入旋律前置處理完成後,步驟S120和步驟S122分別對前置處理過的輸入旋律進行音高追蹤(Pitch tracking)與拍點檢測(Onset detection),以取得輸入旋律的音高追蹤信息和節拍信息。在一些實施例中,可利用自相關函數(Auto-Correlation Function, ACF)進行音高追蹤,音框s中某個時間點t的自相關函數值計算如下

權利要求
1.一種旋律辨識方法,其特徵在於,所述旋律辨識方法包括 輸入一旋律;取得所述旋律的音高追蹤信息;取得所述旋律的節拍信息;由所述音高追蹤信息判斷所述旋律的一清晰度;若所述清晰度大於一預設門檻值,先進行一第一比對,以從一資料庫中篩選出第一批候選歌曲,再進行一第二比對,以從所述第一批候選歌曲中篩選出第二批候選歌曲;以及根據所述第二批候選歌曲決定至少一最後候選歌曲。
2.如權利要求1所述的旋律辨識方法,其特徵在於,更包括若所述清晰度小於所述預設門檻值,先進行所述第二比對,以從所述資料庫中篩選出第三批候選歌曲,再進行所述第一比對,以從所述第三批候選歌曲中篩選出第四批候選歌曲;以及根據所述第四批候選歌曲決定至少一最後候選歌曲。
3.如權利要求2所述的旋律辨識方法,其特徵在於,所述第一比對為音高向量比對,所述第二比對為節拍比對。
4.如權利要求3所述的旋律辨識方法,其特徵在於,更包括 進行所述旋律的前置處理;其中所述前置處理包括檢測所述旋律的端點、預強調處理以及切割所述旋律的音框。
5.如權利要求4所述的旋律辨識方法,其特徵在於,更包括使用白相關函數或平均差異量函數取得前置處理過的所述旋律的各個音框的所述音高追蹤信息,從所述音高追蹤信息取得各個音框的音高值,並將各個音框的所述音高值轉換為所述旋律的音高向量。
6.如權利要求4所述的旋律辨識方法,其特徵在於,更包括 使用相位偏移檢測所述旋律的拍點以取得所述旋律的所述節拍信息。
7.如權利要求4所述的旋律辨識方法,其特徵在於,更包括 使用光譜通量檢測所述旋律的拍點以取得所述旋律的所述節拍信息。
8.如權利要求5所述的旋律辨識方法,其特徵在於,所述音高向量比對使用線性伸縮將所述旋律的所述音高向量與一音高語料庫的所有音高向量數據作比對。
9.如權利要求3所述的旋律辨識方法,其特徵在於,所述節拍比對使用以動態規劃為基礎的一演算法將所述旋律的所述節拍信息與一節拍資料庫的所有節拍數據作比對,所述節拍資料庫紀錄所述資料庫中每首歌曲的節拍信息。
10.如權利要求8所述的旋律辨識方法,其特徵在於,所述音高語料庫紀錄所述資料庫中每首歌曲的音高向量。
11.如權利要求5所述的旋律辨識方法,其特徵在於,所述清晰度為所述音高追蹤信息正規化後的值,且所述清晰度越高代表所述音高值越準確。
12.如權利要求1所述的旋律辨識方法,其特徵在於,更包括 根據所述第一比對產生一第一評估分數;根據所述第二比對產生一第二評估分數;根據所述第一評估分數與所述第二評估分數產生所述至少一最後候選歌曲中每首歌曲的一評估分數;其中所述評估分數為所述第一評估分數與所述第二評估分數根據一權重比例所組成, 若所述清晰度大於所述預設門檻值則所述權重比例偏重所述第一評估分數,若所述清晰度小於所述預設門檻值則所述權重比例偏重所述第二評估分數,所述評估分數越高與所述旋律的匹配度越高。
13.一種旋律辨識裝置,其特徵在於,所述旋律辨識裝置包括一接收器,其接收一旋律;一處理器,其取得所述旋律的音高追蹤信息與節拍信息,並通過所述音高追蹤信息判斷所述旋律的一清晰度;以及一比對器,其根據所述清晰度進行所述旋律與一資料庫的比對;其中若所述清晰度大於一預設門檻值,所述比對器先進行一第一比對,以從所述資料庫中篩選出第一批候選歌曲;所述比對器再進行一第二比對,以從所述第一批候選歌曲中篩選出第二批候選歌曲;其中所述比對器根據所述第二批候選歌曲決定至少一最後候選歌曲。
14.如權利要求13所述的旋律辨識裝置,其特徵在於,若所述清晰度小於所述預設門檻值,所述比對器先進行所述第二比對,以從所述資料庫中篩選出第三批候選歌曲,再進行所述第一比對,以從所述第三批候選歌曲中篩選出第四批候選歌曲,然後根據所述第四批候選歌曲決定至少一最後候選歌曲。
15.如權利要求14所述的旋律辨識裝置,其特徵在於,所述第一比對為音高向量比對, 所述第二比對為節拍比對。
16.如權利要求13所述的旋律辨識裝置,其特徵在於,更包括一顯示裝置,其顯示所述至少一最後候選歌曲。
17.如權利要求16所述的旋律辨識裝置,其特徵在於,更包括一互動裝置,其根據所述旋律的所述節拍信息透過預定的燈光閃爍與動作做出對應所述節拍信息的互動播放。
全文摘要
本發明公開了一種旋律辨識裝置,包括一接收器,其接收一旋律;一處理器,其取得所述旋律的音高追蹤信息與節拍信息,並通過所述音高追蹤信息判斷所述旋律的一清晰度;以及一比對器,其根據所述清晰度進行所述旋律與一資料庫的比對;其中若所述清晰度大於一預設門檻值,所述比對器先進行一第一比對,以從所述資料庫中篩選出第一批候選歌曲;所述比對器再進行一第二比對,以從所述第一批候選歌曲中篩選出第二批候選歌曲;其中所述比對器根據所述第二批候選歌曲決定至少一最後候選歌曲。本發明實施例旋律辨識方法及裝置,根據輸入旋律的清晰度並利用二階段的比對來辨識旋律,可以更精確且更有效率。
文檔編號G10L15/00GK102479509SQ20111003214
公開日2012年5月30日 申請日期2011年1月28日 優先權日2010年11月29日
發明者葉子雋, 張智星, 遊信文, 王崇喆, 王文男, 許丞佑 申請人:財團法人資訊工業策進會

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀