新四季網

雙模的音樂檢測方法

2023-04-25 01:39:31 1


專利名稱::雙模的音樂檢測方法
技術領域:
:本發明涉及語音識別,特別涉及移動通信中的雙模的音樂檢測方法。
背景技術:
:隨著手機使用領域的擴大和利用手機聽音樂的服務的活躍,通過手機來傳送音樂的要求也越來越多。但是移動通信系統中用的語音編解碼器,這對音樂信號會產生損傷。而很多對音樂信號處理的方法,又會損傷語音信號。這就要求對語音和音樂信號的處理需要採取不同的途徑,這樣就需要實現對語音和音樂信號進行區分的音樂信號檢測方法。要求區分語音和音樂信號的應用不光適用於移動通信領域,在其他很多方面都有著類似的需求。而業務的不同對音樂信號檢測方法也有不同的要求。比如有的就是長時間的傳送語音或者音樂,這就要求音樂信號檢測方法對音樂有較高的檢測率,而有的業務就是音樂和語音信號在短時間內互相交替,這就要求音樂信號檢測方法能夠快速的跟上語音和音樂的交替。在移動通信系統中,目前一些語音編解碼器採用了音樂檢測方法,比如SMV算法。但是這個算法的檢測率很低,平均檢測率只有70%,這樣使得在很多情況下,需要區分音樂和語音來做不同的處理,這樣,音樂檢測方法的低檢測率會反而帶來壞的影響。而且,在包括SMV算法在內的很多音樂檢測方法,都只採用一種模式的音樂檢測方法,不能夠適用各種不同的要求。現有技術都是採用一種模式的音樂檢測方法,不能適應當前眾多的系統的不同要求,應用場合受到較大的限制。而且大部分音樂檢測方法檢測率偏低,比如應用範圍較廣的SMV算法中的音樂檢測方法,對音樂的檢測率只有70%。SMV算法的音樂檢測方法是設定一個音樂連續性參數,如果音樂連續性參數大於閾值,則對此參數進行累積。同時判斷輸入信號的非音樂參數,如果非音樂參數大於閾值,則對音樂連續性參數進行衰減。同時SMV算法的音樂檢測方法只有一種模式,不能調整。
發明內容本發明的目的是提供一種雙模的音樂檢測方法。按照本發明的一方面,一種雙模的音樂檢測方法,包括步驟在參數調整單元中設置參數;至少一個模式單元根據設置的參數進行工作。按照本發明的另一方面,一種雙模的音樂檢測裝置,包括參數調整單元,用於確定需要選擇的模式;多個模式單元,根據參數調整單元確定的模式工作。本發明可廣泛應用於不同需要的場合。其中模式l是具有高檢測率的音樂檢測方法,音樂信號的識別率為94.5%。圖l是本發明的簡要框圖2是本發明的模式1的框圖3是本發明的模式2的框圖4是本發明的簡要流程圖5是本發明的模式1的流程圖6是本發明的模式2的流程圖。具體實施例方式本發明的構成如圖l所示,包括一個參數調整單元101,模式l單元102,模式2單元103。如圖1所示,首先根據音樂檢測裝置應用的不同場合,確定需要選擇的模式,然後根據選定的模式,本音樂檢測裝置會在參數調整單元101設置相應的參數,以使得音樂檢測裝置按照選定的模式工作。參數調整單元101就是根據需求進行參數調整,以確定本發明的音樂檢測裝置是按照以高檢測率為優先級還是快速跟蹤音樂和語音的變化為優先級的。根據參數設定的結果,如果是高檢測率為優先級的,將按模式l單元102的方式進行工作。如果是以快速反應為優先級的,將按模式2單元103的方式進行工作。本發明在模式l單元的是以高檢測率為優先級的。模式1是以SMV算法的音樂檢測為基礎,提出了增大語音特徵參數的閾值V—flag,同時增大音樂持續性參數的閾值M一continmflag的改變。SMV算法的音樂檢測是通過檢測音樂特徵參數,如果音樂特徵參數大於其閾值M—flag,則累加音樂持續性參數,同時檢測語音特徵參數,如果語音特徵參數大於其閾值V—flag,則對音樂持續性參數衰減。最後判斷音樂持續性參數是否大於其閾值M一continue—flag來判斷輸出的指示為音樂還是語音。由於採用一個參數來進行識別的話,會存在識別不準確的問題,這點在SMV算法的音樂檢測方法上很突出,SMV算法的音樂檢測方法的識別率只有70%。為了改善這一問題,本發明的模式l的基本思想就是儘量減少語音和音樂特徵的重複,拉大他們之間的差距。於是提出了增大語音特徵參數的閾值V—flag,以使得音樂持續性參數得到較大的積累,拉開音樂和語音的重合區間,同時考慮到增大語音特徵參數的閾值V—flag,即使在輸入為語音的情況下,音樂持續性參數的值也維持在較高的範圍,所以增大了音樂持續性參數的閾值Mjontinue_flag。模式1的框圖如圖2所示,當音頻信號輸入時,音樂特徵計算單元220和語音特徵計算單元260開始計算信號的音樂特徵和語音特徵,然後在音樂特徵參數比較單元230比較音樂特徵參數和設定的閾值M_flag,如果大於閾值M_flag,在更新音樂持續性參數單元240對音樂持續性參數進行累加,如果小於閾值V_nag,保持音樂持續性參數不變。語音特徵參數在語音特徵參數比較單元270比較語音特徵參數和設定的閾值V_flag,如果大於閾值V一flag,在更新音樂持續性參數單元240對音樂持續性參數衰減,如果小於閾值V一flag,則保持音樂持續性參數不變。最後,在音樂持續性參數判斷單元250比較音樂持續性參數和閾值M—continue—flag,如果大於閾值NLcontinue—flag,輸出判斷為音樂,如果小於閾值M—continue—flag,輸出判斷為語音。本發明在模式2單元是以快速跟蹤音樂和語音的變化為優先級的。本發明在模式2單元提出了在音樂持續性參數小於閾值M—continue—flag時加大音樂持續性的累積步長,以及在音樂持續性參數大於閾值M—continue一flag,對音樂持續性參數限幅的方法來保證本發明的模式2單元能快速跟蹤音樂和語音的變化。模式2的框圖如圖3所示,當音頻信號輸入時,音樂特徵計算單元320和語音特徵計算單元350開始計算信號的音樂特徵和語音特徵,然後在音樂特徵參數比較單元330比較音樂特徵參數和設定的閾值M—flag,如果大於閾值l^flag,在更新音樂持續性參數單元340對音樂持續性參數進行累加步長341判斷,並對音樂持續性參數進行累加342,然後在對音樂持續性參數執行限幅343。如果音樂特徵參數小於閾值M一flag,則保持音樂持續性參數不變。語音特徵參數在語音特徵參數比較單元360比較語音特徵參數和設定的閾值V—flag,如果大於閾值V—flag,在更新音樂持續性參數單元340對音樂持續性參數衰減,如果小於閾值V—flag,則保持音樂持續性參數不變。最後,在音樂持續性參數判斷單元380比較音樂持續性參數和閾值JLcontinue—flag,如果大於閾值M—continue—flag,輸出判斷為音樂,如果小於閾值Mjontinue一flag,輸出判斷為語音下面參照圖示對本發明的具體實施方式進行舉例說明。從圖l可以看出,本發明有三個模塊構成。圖4是本發明的流程圖,從圖4可以看出,本發明首先根據輸入的參數進行模式選擇410,確定當前應用場合是模式1還是模式2。然後根據選擇的模式調整參數420,接下來就是根據所選擇的參數進行判別,執行模式1判別430,或模式2判別440,最終輸出判別結果450。圖2是模式1的框圖。圖5是模式1的流程圖。下面結合圖2和圖5介紹一下模式1的工作方式。從圖5中可以看到,輸入的信號510首先要計算音樂特徵參數520。然後根據得到的音樂特徵參數,比較其和閾值N_flag的大小530。如果音樂特徵參數小於閾值M_flag,則保持音樂持續性參數不變,並開始計算語音特徵參數550。如果音樂特徵參數大於閾值M_flag,則對音樂持續性參數累加540。然後計算語音特徵參數550。根據得到的語音特徵參數,比較其和閾值V一flag的大小560。本發明針對原有方法的不足,提高了語音特徵的閾值V_flag的值,由原來的V_flag=0.8提高到V_flag=1-2。如果語音特徵參數小於閾值V_flag,則保持音樂持續性參數不變。如果語音特徵參數大於閾值V_flag,則對音樂持續性參數衰減570。然後,比較當前的音樂持續性參數和閾值M_continue_flag。本發明針對原有技術的不足,在提高V—flag的同時,提高了M_continue_flag的值,由原來的JLcontinue—flag=300提高為M_continue_flag=400-440。如果音樂持續性參數大於閾值M_continue_flag,則判別輸出為音樂。如果音樂持續性參數小於閾值M_continue_flag,則判別輸出為語音圖3是模式2的框圖。圖6是模式2的流程圖。下面結合圖3和圖6介紹一下模式2的工作方式。從圖6中可以看到,輸入的信號601首先要計算音樂特徵參數602。然後根據得到的音樂特徵參數,比較其和閾值M_flag的大小603。如果音樂特徵參數小於閾值M_flag,則保持音樂持續性參數不變,並開始計算語音特徵參數607。如果音樂特徵參數大於閾值M_flag,則先判斷對音樂持續性參數累加的步長604。為了加快音樂持續性參數的累加速度,更快得跟蹤音樂信號的變化,本發明設定如果音樂持續性參數小於閾值M—continue—flag,則其累加步長為180-220。如果大於閾值NLcontinue—flag,則其累加步長為l,最大不超過5。根據得到的累加步長,對音樂持續性參數累加605。累加完畢後,為了使得音樂持續性參數在語音信號到來時能及時衰減到閾值M—continue—flag以下,本發明提出要對音樂持續性參數限幅606,限幅操作是在累加之後判斷音樂持續性參數是否大與限幅值(420),如果大於則被限幅於420。然後計算語音特徵參數607。根據得到的語音特徵參數,比較其和閾值V—flag的大小608。如果語音特徵參數小於閾值V—flag,則保持音樂持續性參數不變.如果語音特徵參數大於閾值V—flag,則對音樂持續性參數衰減609。然後,比較當前的音樂持續性參數和閾值Mjontinmflag。如果音樂持續性參數大於閾值M^ontimnflag,則判別輸出為音樂。如果音樂持續性參數小於閾值Mjontinue—flag,則判別輸出為語音。表l是本發明的檢測率音樂類型檢測率Classical92.94%Electronic95.04%jazz_blues93.2%metal_punk96.02%rock_pop95.87%World93.89%語音88.889&表2是未採用本發明的檢測率音樂類型檢測率Classical89.63%Electronic55.79%jazz—blues84.75%metal—punk42.87%rock—pop69.01%World82.38%語音99.2%模式2是一種快速跟蹤音樂和語音轉換的音樂檢測方法。權利要求1.一種雙模的音樂檢測方法,包括步驟在參數調整單元中設置參數;至少一個模式單元根據設置的參數進行工作。2.根據權利要求l所述的方法,其特徵在於模式單元l工作在高檢測率狀態,模式單元2工作在快速跟蹤音樂和語音的變化狀態。3.根據權利要求2所述的方法,其特徵在於所述模式單元l工作在高檢測率狀態包括步驟計算信號的音樂特徵和語音特徵;將音樂特徵參數與設定的閾值M—flag進行比較,如果大於閾值M_flag,則對音樂持續性參數進行累加;將語音特徵參數與設定的閾值V—flag進行比較,如果大於閾值V—flag,則對音樂持續性參數進行衰減;將音樂持續性參數與閾值M一continue—flag進行比較,如果大於閾值M—continue—flag,則判斷輸出為音樂,如果小於閾值M—continue_flag,則判斷輸出為語音。4.根據權利要求3所述的方法,其特徵在於所述閾值V一flag為r2。5.根據權利要求3所述的方法,其特徵在於所述閾值JLcontinmflag為400440。6.根據權利要求2所述的方法,其特徵在於所述模式單元2工作在快速跟蹤音樂和語音的變化狀態包括步驟計算信號的音樂特徵和語音特徵;將音樂特徵參數與設定的閾值M—flag進行比較,如果大於閾值M一flag,判斷音樂持續性參數累加步長,並對音樂持續性參數進行累加,然後,對音樂持續性參數限幅;將語音特徵參數與設定的閾值V_flag進行比較,如果大於閾值V_flag,則對音樂持續性參數進行衰減;將音樂持續性參數與閾值M—continue—flag進行比較,如果大於閾值M—continue—flag,則判斷輸出為音樂,如果小於閾值M—continue—flag,則判斷輸出為語音。7.根據權利要求6所述的方法,其特徵在於如果音樂持續性參數小於閾值M—continue_flag,則累加步長為180220。8.根據權利要求6所述的方法,其特徵在於如果音樂持續性參數大於閾值M—continue_flag,則累加步長為不超過5。9.一種雙模的音樂檢測裝置,包括參數調整單元,用於確定需要選擇的模式;多個模式單元,根據參數調整單元確定的模式工作。10.根據權利要求9所述的裝置,其特徵在於模式單元l工作在高檢測率狀態,模式單元2工作在快速跟蹤音樂和語音的變化狀態。11.根據權利要求10所述的裝置,其特徵在於所述模式單元l包括-音樂特徵計算單元,用於計算信號的音樂特徵;音樂特徵參數比較單元,將音樂特徵參數與設定的閾值kLflag進行比較;語音特徵計算單元,計算信號的語音特徵;語音特徵參數比較單元,將語音特徵參數與設定的閾值V—flag進行比較;更新音樂持續性參數單元,如果音樂特徵參數大於設定的閾值M_flag,則對音樂持續參數進行累加,如果語音特徵參數大於設定的閾值V—flag,則對音樂持續性參數進行衰減;音樂參數持續性參數判斷單元,將音樂持續性參數與閾值M—continue—flag進行比較,如果大於閾值M—continue—flag,則判斷輸出為音樂,如果小於閾值M一continue一flag,則判斷輸出為語音。12.根據權利要求ll所述的裝置,其特徵在於所述閾值V—flag為12。13.根據權利要求ll所述的裝置,其特徵在於所述閾值M—contimje_flag為400440。14.根據權利要求10所述的裝置,其特徵在於所述模式單元2包括音樂特徵計算單元,計算信號的音樂特徵;音樂特徵參數比較單元,將音樂特徵參數與設定的閾值M_flag進行比較;語音特徵計算單元,計算信號的語音特徵;語音參數特徵比較單元,將語音特徵參數與設定的閾值V_flag進行比較;更新音樂持續性參數單元,如果音樂特徵參數大於閾值M_flag,判斷音樂持續性參數累加步長,並對音樂持續性參數進行累加,然後,對音樂持續性參數限幅,如果語音特徵參數大於閾值V_flag,則對音樂持續性參數進行衰減;音樂持續性參數判斷單元,將音樂持續性參數與閾值M_continue_flag進行比較,如果大於閾值M_continue—flag,則判斷輸出為音樂,如果小於閾值M_continue_flag,則判斷輸出為語音。15.根據權利要求14所述的裝置,其特徵在於如果音樂持續性參數小於閾值M_continue_flag,則累加步長為180220。16.根據權利要求14所述的裝置,其特徵在於如果音樂持續性參數大亍閾值M_continue_flag,則累加步長為不超過5。全文摘要一種雙模的音樂檢測方法,包括步驟在參數調整單元中設置參數;至少一個模式單元根據設置的參數進行工作。本發明可廣泛應用於不同需要的場合。其中模式1是具有高檢測率的音樂檢測方法,音樂信號的識別率為94.5%。文檔編號H04M1/725GK101202992SQ20061016570公開日2008年6月18日申請日期2006年12月12日優先權日2006年12月12日發明者川張,王立眾,胡洪濤申請人:北京三星通信技術研究有限公司;三星電子株式會社

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀