新四季網

一種歌聲位置檢測方法及裝置製造方法

2023-07-28 19:50:01

一種歌聲位置檢測方法及裝置製造方法
【專利摘要】本發明實施例公開了歌聲位置檢測方法及裝置,應用於信息處理【技術領域】。歌聲位置檢測裝置會將待檢測歌曲劃分為多幀歌曲,並獲取每一幀歌曲的特徵,如果某一幀歌曲的特徵滿足第一策略,則得到了包含歌聲的一幀歌曲,則儲存該幀歌曲的標識信息;為了更準確得到歌聲位置,還需要進一步地將上述位置確定的結果與通過第二策略得到的位置進行比較得到最終結果,具體地,將待檢測歌曲的所有幀歌曲中,特徵滿足第二策略的第一個幀歌曲的標識信息,與上述儲存的標識信息進行比較,選擇某一個標識信息對應幀歌曲的位置作為歌聲的位置,這樣得到的歌聲位置較為準確。本實施例的方法可以快速準確地檢測出歌聲位置。
【專利說明】一種歌聲位置檢測方法及裝置

【技術領域】
[0001] 本發明涉及centroidspectral centroid歌聲位置檢測方法及裝置信息處理技術 領域,特別涉及歌聲位置檢測方法及裝置。

【背景技術】
[0002] 在音樂的分析中,對於歌聲的分析是一個很重要的課題,尤其是在流行音樂中,歌 聲部分的分析,首先是定位歌聲的位置。現有的歌聲位置檢測方法,有些是完全根據經驗對 所有的歌曲都按照同樣的時間點來截取一段歌曲,然後對這段歌曲進行分析,雖然這一方 法符合大部分音樂特性,但是存在著一定的缺陷,畢竟,歌曲種類千差萬別,必然會出現所 截取的歌曲段並不是有效段的情況。另外一些方法,主要是探究更好的提取流行音樂的歌 聲部分,然而這類方法的計算量很大,不適合廣泛的應用。


【發明內容】

[0003] 本發明實施例提供歌聲位置檢測方法及裝置,快速準確地檢測出歌聲位置。
[0004] 本發明實施例提供一種歌聲位置檢測方法,包括:
[0005] 獲取待檢測歌曲或經過至少一次處理後的待檢測歌曲中當前幀歌曲的特徵,所述 待檢測歌曲劃分為多巾貞歌曲;
[0006] 如果所述當前幀歌曲的特徵滿足預置的第一策略,儲存所述當前幀歌曲的標識信 息;
[0007] 將所述待檢測歌曲的所有幀歌曲中,特徵滿足預置的第二策略的第一個幀歌曲的 標識信息,與儲存的所述標識信息進行比較,選擇某一標識信息對應幀歌曲所在位置作為 所述待檢測歌曲中包含歌聲的位置;
[0008] 其中,所述選擇的標識信息對應幀歌曲排在所述待檢測歌曲較後的位置。
[0009] 本發明實施例提供一種歌聲位置檢測裝置,包括:
[0010] 特徵獲取單元,用於獲取待檢測歌曲或經過至少一次處理後的待檢測歌曲中當前 幀歌曲的特徵,所述待檢測歌曲劃分為多幀歌曲;
[0011] 儲存單元,用於如果所述特徵獲取單元獲取的當前幀歌曲的特徵滿足預置的第一 策略,儲存所述當前幀歌曲的標識信息;
[0012] 比較選擇單元,用於將所述待檢測歌曲的所有幀歌曲中,特徵滿足預置的第二策 略的第一個幀歌曲的標識信息,與儲存單元儲存的所述標識信息進行比較,選擇某一標識 信息對應幀歌曲所在位置作為所述待檢測歌曲中包含歌聲的位置;
[0013] 其中,所述選擇的標識信息對應幀歌曲排在所述待檢測歌曲較後的位置。
[0014] 本實施例中,歌聲位置檢測裝置會將待檢測歌曲劃分為多幀歌曲,並獲取每一幀 歌曲的特徵,如果某一幀歌曲的特徵滿足第一策略,則得到了包含歌聲的一幀歌曲,則儲存 該幀歌曲的標識信息;為了更準確得到歌聲位置,還需要進一步地將上述位置確定的結果 與通過第二策略得到的位置進行比較得到最終結果,具體地,將待檢測歌曲的所有幀歌曲 中,特徵滿足第二策略的第一個幀歌曲的標識信息,與上述儲存的標識信息進行比較,選擇 某一個標識信息對應幀歌曲的位置作為歌聲的位置,這樣得到的歌聲位置較為準確。且由 於本實施例中在獲取歌曲的特徵時以幀為單位,而一幀歌曲的長度較少,則在得到一幀歌 曲的特徵時,相比得到整個歌曲的特徵的計算量少,進而使得本實施例中整個歌聲位置檢 測的流程所花費時間少。綜上所述,本實施例的方法可以快速準確地檢測出歌聲位置。

【專利附圖】

【附圖說明】
[0015] 為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可 以根據這些附圖獲得其他的附圖。
[0016] 圖1是本發明實施例提供的一種歌聲位置檢測方法的流程圖;
[0017] 圖2是本發明實施例提供的另一種歌聲位置檢測方法的流程圖;
[0018] 圖3是本發明應用實施例中提供的一種歌聲位置檢測方法的流程圖;
[0019] 圖4是本發明實施例提供的一種歌聲位置檢測裝置的結構圖;
[0020] 圖5是本發明實施例提供的另一種歌聲位置檢測裝置的結構圖;
[0021] 圖6是本發明實施例提供的另一種歌聲位置檢測裝置的結構圖。

【具體實施方式】
[0022] 下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於 本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他 實施例,都屬於本發明保護的範圍。
[0023] 本發明的說明書和權利要求書及上述附圖中的術語"第一"、"第二"、"第三""第 四"等(如果存在)是用於區別類似的對象,而不必用於描述特定的順序或先後次序。應該 理解這樣使用的數據在適當情況下可以互換,以便這裡描述的本發明的實施例例如能夠以 除了在這裡圖示或描述的那些以外的順序實施。此外,術語"包括"和"具有"以及他們的任 何變形,意圖在於覆蓋不排它的包含,例如,包含了一系列步驟或單元的過程、方法、系統、 產品或設備不必限於清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對於 這些過程、方法、產品或設備固有的其它步驟或單元。
[0024] 本發明實施例提供一種歌聲位置檢測方法,主要是檢測出某一段歌曲中的唱歌聲 部分的位置,該方法可以被廣泛應用在歌聲相關分析系統中前端處理的歌聲位置檢測過程 中,比如應用在歌唱者身份識別、音樂檢索和歌曲指紋匹配等領域,本實施例的方法是歌聲 位置檢測裝置所執行的方法,流程圖如圖1所示,包括:
[0025] 步驟101,獲取待檢測歌曲或經過至少一次處理後的待檢測歌曲中當前幀歌曲的 特徵,該待檢測歌曲劃分為多幀歌曲。其中至少一次處理可以包括帶通濾波等處理,是為了 更好且準確地得到歌曲的特徵的處理。
[0026] 可以理解,本實施例中,歌聲位置檢測裝置首先要將待檢測歌曲劃分為多幀歌曲, 分別計算每一幀歌曲的特徵,這裡歌曲的特徵可以包括能量特徵、過零率和譜通量,其中 過零率是某一幀歌曲中信號樣本改變符號的次數,用來估計歌曲信號的過零頻率;譜通量 用來描述歌曲信號的頻譜變化率。且獲取歌曲的特徵還可以包括其它特徵,比如譜差異 (spectral difference)和譜矩心(spectral centroid)等。
[0027] 步驟102,判斷當前幀歌曲的特徵是否滿足預置的第一策略,如果滿足,則執行步 驟103,如果不滿足,則需要針對待檢測歌曲中下一幀歌曲返回執行上述步驟101。
[0028] 這裡預置的第一策略可以是用戶預先設置在歌聲位置檢測裝置中的,是能說明在 某一幀歌曲中包含了歌聲的策略,且針對不同的特徵有不同的策略,比如對於能量特徵,一 般情況下,歌曲中包含歌聲部分的能量大於純音樂部分的能量,則一幀歌曲的能量需要超 過預置的第一閾值;對於過零率,一般情況下包含人聲的部分過零率比較高,則一幀歌曲的 過零率需要超過預置的第二閾值;對於譜通量,一幀歌曲的譜通量需要超過預置的第三閾 值。上述第一閾值到第三閾值是歌曲中包含歌聲部分時,一般情況下,該部分歌曲信號所具 有的特徵值。
[0029] 步驟103,儲存當前幀歌曲的標識信息,這裡當前幀歌曲的標識信息是用於標識當 前幀歌曲是哪一幀的歌曲,比如能標識當前幀歌曲是哪一幀的幀索引等信息。
[0030] 步驟104,當對待檢測歌曲的所有幀歌曲都執行了上述步驟101到102,並對部分 幀歌曲執行了上述步驟103之後,歌聲位置檢測裝置還需要得到待檢測歌曲的所有幀歌曲 中,特徵滿足預置的第二策略的第一個幀歌曲的標識信息,並將該標識信息與上述步驟103 中儲存的標識信息進行比較。
[0031] 其中預置的第二策略可以包括某一個特徵(比如能量特徵、過零率或譜通量等)超 過預置的值,其中由於歌曲的能量特徵比較重要,在實際實現時,一般是將預置的第二策略 設置為:一幀歌曲的能量超過預置的值。這裡得到的第一幀歌曲是指在所有幀歌曲中第一 個能滿足第二策略的一幀歌曲,說明,從該幀歌曲開始,以後的歌曲中會包含歌聲部分。
[0032] 步驟105,選擇某一標識信息對應幀歌曲所在位置作為待檢測歌曲中包含歌聲的 位置。
[0033] 如果用幀索引來表示上述標識信息,且幀索引是按照遞增的方式來標識每一幀歌 曲,則如果標識信息即幀索引較大,該標識信息所標識的一幀歌曲排在待檢測歌曲較後的 位置,因此,在執行本步驟的選擇時,由於在一段歌曲中,歌聲並不一定是連續地包含在歌 曲中,也就是說歌曲中包含歌聲的位置有多處,這裡可以選擇標識信息較大的多幀歌曲所 在位置作為待檢測歌曲中包含歌聲的位置。
[0034] 可見,本實施例中,歌聲位置檢測裝置會將待檢測歌曲劃分為多幀歌曲,並獲取每 一幀歌曲的特徵,如果某一幀歌曲的特徵滿足第一策略,則得到了包含歌聲的一幀歌曲,則 儲存該幀歌曲的標識信息;為了更準確得到歌聲位置,還需要進一步地將上述位置確定的 結果與通過第二策略得到的位置進行比較得到最終結果,具體地,將待檢測歌曲的所有幀 歌曲中,特徵滿足第二策略的第一個幀歌曲的標識信息,與上述儲存的標識信息進行比較, 選擇某一個標識信息對應幀歌曲的位置作為歌聲的位置,這樣得到的歌聲位置較為準確。 且由於本實施例中在獲取歌曲的特徵時以幀為單位,而一幀歌曲的長度較少,則在得到一 幀歌曲的特徵時,相比得到整個歌曲的特徵的計算量少,進而使得本實施例中整個歌聲位 置檢測的流程所花費時間少。綜上所述,本實施例的方法可以快速準確地檢測出歌聲位置。
[0035] 參考圖2所示,在另一個具體的實施例中,歌聲位置檢測裝置在針對能量特徵和 過零率執行上述不足後101之前,還可以執行步驟201 ;且在執行完上述步驟101之後,需 要先執行步驟202後再執行步驟102,具體地:
[0036] 步驟202,對待檢測歌曲進行帶通濾波。
[0037] 由於人聲(即歌聲)的頻帶一般處於340?2500Hz以內,則在獲取歌曲的特徵之 前,有必要去除歌聲頻帶以外的成分,以突出人聲的影響,具體地,可以採用如無限脈衝響 應(Infinite Impulse Response, IIR)帶通數字濾波器等對待檢測歌曲進行帶通濾波。
[0038] 且該帶通濾波的主要是針對能量特徵和過零率,對於譜通量來說是表示幀間頻譜 的變化速率,反應的是頻譜在時間上的起伏,加了帶通濾波後,對於非歌聲頻譜會有消弱, 獲取的歌聲部分和非歌聲部分的頻譜在時間上的差異會存在不可靠性,因此,在計算譜通 量時,不需要對歌曲進行帶通濾波。
[0039] 步驟201,如果當前幀歌曲為待檢測歌曲中前段部分歌曲,則對獲取的所述當前幀 歌曲的特徵進行抑制,即將特徵值設置在閾值以下,這裡個閾值可以是歌曲中不包含歌聲 的閾值。
[0040] 由於歌曲之間的特徵是千差萬別的,但在一般情況下,一首歌曲的前一段,往往是 前奏部分,沒有歌聲,為了不讓前奏中歌曲的特徵值過大而幹擾最終的檢測結果,需要對前 奏部分的特徵值進行抑制。而其中前奏部分的設定可以是用戶根據實際預置在歌聲位置檢 測裝置中的,比如設置一個待檢測歌曲中前20s的部分歌曲為前奏部分。
[0041] 在另一個具體的實施例中,歌聲位置檢測裝置具體在執行上述步驟101時,根據 特徵的不同,有不同的獲取方法,具體地:
[0042] (1)特徵為能量特徵

【權利要求】
1. 一種歌聲位置檢測方法,其特徵在於,包括: 獲取待檢測歌曲或經過至少一次處理後的待檢測歌曲中當前幀歌曲的特徵,所述待檢 測歌曲劃分為多巾貞歌曲; 如果所述當前幀歌曲的特徵滿足預置的第一策略,儲存所述當前幀歌曲的標識信息; 將所述待檢測歌曲的所有幀歌曲中,特徵滿足預置的第二策略的第一個幀歌曲的標識 信息,與儲存的所述標識信息進行比較,選擇某一標識信息對應幀歌曲所在位置作為所述 待檢測歌曲中包含歌聲的位直; 其中,所述選擇的標識信息對應幀歌曲排在所述待檢測歌曲較後的位置。
2. 如權利要求1所述的方法,其特徵在於,所述獲取的待檢測歌曲中當前幀歌曲的特 徵包括:能量特徵、過零率和譜通量; 所述預置的第一策略包括:一幀歌曲的能量大於預置的第一閾值,過零率大於預置的 第二閾值,且譜通量大於預置的第三閾值; 所述預置的第二策略包括:一幀歌曲的某一特徵大於預置的值。
3. 如權利要求1所述的方法,其特徵在於,所述獲取待檢測歌曲或經過至少一次處理 後的待檢測歌曲中當如巾貞歌曲的特徵之後,還包括: 如果所述當前幀歌曲為所述待檢測歌曲中前段部分歌曲,則對獲取的所述當前幀歌曲 的特徵進行抑制。
4. 如權利要求2或3所述的方法,其特徵在於,如果所述特徵為能量特徵,則所述獲取 待檢測歌曲中當如巾貞歌曲的特徵,具體包括: 計算所述當前幀歌曲的信號的平方和; 用所述平方和與所述待檢測歌曲中所有幀歌曲的信號的平方和的最大值的商作為所 述當前幀歌曲的能量特徵。
5. 如權利要求2或3所述的方法,其特徵在於,如果所述特徵為過零率,則所述獲取待 檢測歌曲中當前幀歌曲的特徵,具體包括: 計算所述當前幀歌曲的信號中樣本改變符號的次數; 用所述次數與所述待檢測歌曲中所有幀歌曲的信號對應樣本改變符號次數的最大值 的商作為所述當前幀歌曲的過零率。
6. 如權利要求4或5所述的方法,其特徵在於,所述獲取待檢測歌曲中當前幀歌曲的特 徵之前,還包括: 對所述待檢測歌曲進行帶通濾波; 所述獲取經過至少一次處理後的待檢測歌曲中當前幀歌曲的特徵,具體包括:獲取經 過所述帶通濾波後的待檢測歌曲中當前幀歌曲的特徵。
7. 如權利要求2或3所述的方法,其特徵在於,如果所述特徵為譜通量,則所述獲取待 檢測歌曲中當前幀歌曲的特徵,具體包括: 計算所述當前幀歌曲的信號與前一幀歌曲的信號歸一化頻譜係數的差的平方和,並將 所述平方和作為所述當前幀歌曲的譜通量。
8. -種歌聲位置檢測裝置,其特徵在於,包括: 特徵獲取單元,用於獲取待檢測歌曲或經過至少一次處理後的待檢測歌曲中當前幀歌 曲的特徵,所述待檢測歌曲劃分為多幀歌曲; 儲存單元,用於如果所述特徵獲取單元獲取的當前幀歌曲的特徵滿足預置的第一策 略,儲存所述當前幀歌曲的標識信息; 比較選擇單元,用於將所述待檢測歌曲的所有幀歌曲中,特徵滿足預置的第二策略的 第一個幀歌曲的標識信息,與儲存單元儲存的所述標識信息進行比較,選擇某一標識信息 對應幀歌曲所在位置作為所述待檢測歌曲中包含歌聲的位置; 其中,所述選擇的標識信息對應幀歌曲排在所述待檢測歌曲較後的位置。
9. 如權利要求8所述的裝置,其特徵在於,還包括: 抑制單元,用於如果所述當前幀歌曲為所述待檢測歌曲中前段部分歌曲,則對獲取的 所述當前幀歌曲的特徵進行抑制。
10. 如權利要求8或9所述的裝置,其特徵在於,所述特徵獲取單元,具體包括: 能量特徵計算單元,用於計算所述當前幀歌曲的信號的平方和;用所述平方和與所 述待檢測歌曲中所有幀歌曲的信號的平方和的最大值的商作為所述當前幀歌曲的能量特 徵; 過零計算單元,用於計算所述當前幀歌曲的信號中樣本改變符號的次數;用所述次數 與所述待檢測歌曲中所有幀歌曲的信號對應樣本改變符號次數的最大值的商作為所述當 前幀歌曲的過零率。
11. 如權利要求10所述的裝置,其特徵在於,還包括: 濾波單元,用於對所述待檢測歌曲進行帶通濾波; 則所述特徵獲取單元,具體用於獲取經過所述帶通濾波後的待檢測歌曲中當前幀歌曲 的特徵。
12. 如權利要求8或9所述的裝置,其特徵在於,所述特徵獲取單元,具體包括: 譜通量計算單元,用於計算所述當前幀歌曲的信號與前一幀歌曲的信號歸一化頻譜系 數的差的平方和,並將所述平方和作為所述當前幀歌曲的譜通量。
【文檔編號】G10L25/48GK104091600SQ201410109432
【公開日】2014年10月8日 申請日期:2014年3月21日 優先權日:2014年3月21日
【發明者】孔令城 申請人:騰訊科技(深圳)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀