新四季網

個性化的聲音處理系統和設備的製作方法

2023-04-27 21:03:01 1

專利名稱:個性化的聲音處理系統和設備的製作方法
技術領域:
本發明涉及信號處理、心理聲學和聽覺生理學,更具體的說,本發明涉及一種個性化的聲音處理系統,用於測試用戶聽力特徵,報告用戶的聽力健康狀況,並基於該用戶的聽力特徵,將普通的音樂文件,加工成更加好聽的、有利於該用戶聽力健康的、適於長期聆聽的音樂文件。
背景技術:
一些本發明中使用的詞彙,其涵義分別列出如下。人耳解剖結構一包括外耳、中耳、內耳、聽神經、腦幹和聽神經中樞等。聲音在外耳得到增強,中耳將空氣振動轉換成機械震動,內耳將機械震動轉換成神經脈衝,神經脈衝經過聽通路,最終到達聽神經中樞,使人感覺到聲音。 聲學測試一本發明所述的聲學測試包括兩種心理聲學測試和聽覺生理學測試。心理聲學是研究聲音和聽覺之間關係的學科,而心理聲學測試是測試一個人的聽覺特徵的實驗。在物理學中,一個聲音可以從頻率、幅度和相位來描述;而心理聲學的描述則不同,它從人類心理的角度把一個聲音的屬性描述為音高、響度和音色。聽覺生理學測試一發出聲音給人聽,然後記錄下在聽到聲音之後這個人的物理特徵的變化,如腦電和腦磁場的變化,這稱為聽覺生理學測試。常見的聽覺生理學測試,包括聽覺腦幹響應(Auditory Brainstem Response, ABR),畸變產物耳聲發射(DistortionProduct Oto-Acoustic Emissions,DP0AE),複合動作電位(Compound Action Potential,CAP)和腦電圖(Electroencephalography, EEG)。聲壓強——是一種聲音強度的度量單位,通常縮寫為SPL (Sound PressureLevel),也稱為聲壓級、聲音強度或強度。它的單位是dBSPL(Decibel Sound PressureLevel)。它是一個客觀的描述音量大小的物理量。O dBSPL是人類大約能聽到的最小聲音,痛苦的門限值為135 dBSPL。安靜的背景音樂,通常在50 dBSPL,交響樂通常達到110 dBSPL或者更高,而很響的搖滾樂可以達到120 dBSPL ο純音——只含有一個單一頻率的聲音。例如,1000Hz的正弦聲波發出的聲音,是一個1000赫茲的純音。諧波——由一個純音,以及它的整數倍的頻率,疊加共同組成的複合聲音。基音——諧波中最小的那個頻率稱為基音,也稱為基頻。泛音一諧波中,除了基音,所有其它更高的整數倍的頻率成分都稱為泛音。殘餘音一對於純音,它的音高主要決定於頻率;而對於由基音和泛音組成的複合音,其音高較為複雜。自亥姆霍茲以來,普遍認為複合聲的音高決定於基音的頻率,因為基音的振幅在頻譜中佔優勢。但是測試表明,若複合聲的基頻很弱,甚至完全被濾掉,它的音高仍維持基頻的音高不變。這種失去基頻仍保持音高不變的複合音,被稱為殘餘音[I]。單軌錄音——用單一軌道,將所有現場的聲音一起錄下來的技術。多軌錄音——在音樂的製作過程中,使用許多軌將樂器和人聲分別錄進電腦;在後期處理中,經過合成後混為一個成品。多軌錄音的作用和優勢明顯,它避免了「單軌錄音」的兩個缺點缺點一,如果一個演奏者出了偏差,全部演奏者都要重來;缺點二,所有的樂器都錄在一起,後期製作的時候,無法針對每件樂器做精細的調整。耳蝸群延遲效應一當聲音傳播到了人耳的耳蝸,對不同的頻率,耳蝸會產生不同的延遲時間。也就是說,進過耳蝸之後,高頻的聲音到達聽覺神經較快,而低頻的聲音到達的較慢。這種效應,稱為耳蝸群延遲效應。可以看出,耳蝸群延遲扭曲了聲音的相位。對於耳蝸對相位的扭曲,研究者已經確定了其特性[2,3]。德波爾(De Boer)推導出了一種調頻脈衝信號,該信號能夠恰好補償人類耳蝸帶來的相位扭曲[2]。臨界頻帶一當兩個聲音的頻率靠的很近時,人耳不能夠區分出來。這個最小的頻率差值,就稱為臨界頻帶。臨界頻帶的寬度,一般認為1/3-1/6音程。人耳會傾向於合併在臨界頻帶內的聲音。不僅如此,不同的頻帶給人的感覺差異巨大,16 60赫茲頻段能給音樂以力度;提升60 250赫茲能夠使音樂豐滿;250 2000赫茲能賦予音色號角般的色彩;2000 4000赫茲人耳的靈敏度最好;4000 6000赫茲為清晰、明亮和主觀感受的頻 段;5000赫茲稍加衰減定會使聲音產生距離感和透明感;6000 20000赫茲則控制著聲音的明亮與清晰,若稍加調整即可產生輕鬆、清脆和光澤感。響度-響度是主觀感受到的聲音強度,它表不的是一個聲音聽來有多響的程
度。根據美國國家標準學會(American National Standards Institute, ANSI)的定義,響度是聽覺感知的一種屬性,該屬性按照從安靜到響亮的順序排布。響度與聲壓強不同,後者是客觀的聲音強度。通過A加權曲線,過濾聲壓強,可以近似獲得典型人耳的響度。響度的單位是宋(Sone)和方(Phon)。現代心理聲學進行了響度的定量判斷測試,並建立了響度量表。I宋的定義為1000赫茲、40 dBSPL純音所引起的響度,大致相當於輕聲說話的聲級。宋量表證明,響度正比於1000赫茲等響聲壓的O. 6次冪,就是說,1000赫茲等響聲的聲壓級提高10dB,響度加倍。響度和聽力損傷的關係如下如果發生聽力損傷,響度的感覺就會發生變化;較低的聲音就聽不見了,但是很響的聲音還是感覺和原來差不多,這被稱為響度重振[4]。等響曲線——人耳對於不同的聲音敏感程度不同,其中,人耳對2000-5000赫茲的頻率最為敏感。這說明響度的變化不是單純地決定於聲音強度,也與頻率有關。兩個不同頻率的純音,雖強度相同,引起的響度卻不同。總的來說,由於人耳的特點,中頻純音聽來比低頻和高頻純音響一些。以1000赫茲、80 dBSPL的純音為參照聲,通過響度平衡測試,可以得到一條等響線,如圖I所示。在這條等響線上,縱軸是聲壓強,橫軸是頻率,各頻率的純音儘管聲壓級不同,但都與該曲線上的1000赫茲純音等響。所以,此曲線上各純音的響度級,都是80方(phon) [I]。類似的,還有100方,60方,40方,20方,O方的曲線。這一簇曲線,統稱為等響曲線。等響曲線的特點響度從O方增大到100方,等響曲線逐漸變平。這說明響度增長率,隨著頻率的不同而不同。最小的等響曲線,代表人類能聽到的最輕的聲音,被稱為閾值、聽力門限或絕對聽力門限(Absolute Hearing Threshold)。等響曲線,由貝爾實驗室的Fletcher和Munson在1933用純音測量,並在多個人上平均得到。該等響曲線在1986年被寫入了標準化文件ISO 226中。聽力門限一聲音不夠一定強度不能引起聽覺,人類最低能聽到的聲音強度稱為聽力門限,也稱為閾值。聽力門限有個體差異,因而所謂正常聽力門限,只能是一些聽力正常的年輕人的聽力門限的統計平均值。聽力門限隨頻率而變化500 4000赫茲之間閾值最低;在它們之上和之下的高頻聲和低頻聲的閾值都較高,如20赫茲純音的閾值,比1000赫茲的高約70dB,而10000赫茲純音的閾值也比1000赫茲的高約10dB。最敏感的頻率是3000赫茲左右,空氣分子振動的振幅達到10_n米,人類就可以聽到[I]。音長——音長是聲音長短的感覺,人類感覺到的音長和聲音的物理時間長短是不相等的[I]。音程一一個頻率與它的兩倍頻率之間的距離,稱為一個音程。音高——聲音調子高低的程度。音高主要取決於聲音的頻率,它隨頻率的升降而升降。但是,它也不是單純地由頻率決定,與聲音強度也有關係。低頻純音的音高隨強度增加而下降;反之,高頻純音的音高卻隨強度增加而上升。音高定量判斷測試是讓人聽一系列純音,使它們在音高上聽來間隔相等。這樣取得的平均判斷構成了音高量表,其單位稱為美。在此量表上,1000赫茲純音的音高被定為1000美(mel) [I]。 音色——音色是對聲音音質的感覺。純音不存在音色問題。而複合聲的音色具有很多變化。例如,不同樂器所發出的聲音,音色不同。小提琴和鋼琴發出的中央C音,儘管它們響度和音高相同,聽起來還是不一樣,原因在於它們音色的差異。聲音的音色取決於它們的頻譜。複合聲這種多量綱的特點,使得音色也具有多量綱性,不同於只有單個量綱的響度和音高。所以,音色只能用多維空間上相應的點來確定。語言的多維量表測試證明,音色的知覺空間上的點與頻譜的物理空間上的點是非常吻合的[I]。聲音設備的校準——對聲音播放設備的校準,需要根據美國國家標準學會(American National Standards Institute, ANSI)的標準,或者國際標準化組織(International Standard Organization, ISO)的標準來進行。音樂欣賞的個人差異化——人的聽覺特徵參數差異顯著,使用人類平均的曲線,或者任何一定固定的曲線,無法給個人帶來最大化的音樂享受。失真一音樂設備在播放音樂的時候會帶來失真。失真包括三種群延遲失真,諧波失真和互調失真。群延遲失真,是指音樂設備對不同頻率的分量,產生不同延遲,引起音色扭曲。諧波失真是指,如果播放1000赫茲的聲音,由於失真會產生2000赫茲,3000赫
茲,----系列的聲音;互調失真是指,播放1000赫茲的和100赫茲的聲音,產生了 900赫茲
和1100赫茲的聲音。雙耳效應一聲源定位的主要因素為兩耳的時間差和強度差,也稱為雙耳效應。由於頭部、耳廓、外耳道等的共振、反射作用,使聽到的聲音頻譜受到調製。來自右邊的聲音先到達右耳,強度也比左耳收到的強。複合聲的定位比純音容易,純音,尤其是2000 3000赫茲的純音,定位特別困難。在可聽聲範圍內,耳廓的指向性不顯著,但對定位仍有作用。在低頻率,兩耳強度差別不大,定位主要靠相位因素或時間差因素。在高頻率,相位變化複雜,強度差更為重要。在中頻,定位更依賴時間和強度的綜合作用[I]。人耳對聲源定位,對於橫向角度的定位精度為5度左右,甚至可以高達1-2度。如果耳廓的邊緣被逐漸填滿,定位的能力就逐漸消失了,消失的程度正比於填充的面積;顯然,大腦利用了耳廓的反射,來確定聲源。對聲音中所包含的延遲時間的信息,雙耳比較敏感,能夠從中獲取很多信息耳廓反射所引發的延遲,在0. I毫秒的量級;左右耳的時間差非常重要,它在0.5毫秒的量級;對於1-50毫秒的延遲信號,大腦會合併到直達信號,所以大腦並不會認為這是回聲;大於50毫秒的延遲,聽起來會覺得是回聲;50-100毫秒的延遲,給人的感覺像一個洞穴般的回聲;大於400毫秒的回聲,大腦可以把它和原信號區別出來,更有回聲的感覺。最小可區別的強度差一人類最小可區別的強度差別,為l_3dB。所以,高質量的播放設備,其幅譜相應的波動,應被控制在2dB之內。但是,因為房間效應的存在,一個上下波動2dB的頻率響應,在現實世界的自由空間播放是很難達到的。因此,比較現實的要求是高質量的音樂播放設備,200-20000赫茲上下波動5dB,20-200赫茲上下波動10dB。聽力門限的概念還包括差別門限,即兩個(能夠引起聽覺差別的)聲音的最小差值。就頻率說,在63赫茲左右有經驗的人耳能區別相差O. 5赫茲的兩個純音的差別,但這種閾值在1000赫茲要增加到1.4赫茲,頻率越高差別門限越大。在整個聽覺範圍內,可辨別的聲音約34萬個[I]。最小可區別的頻率差一對一個年輕人,最小可區別的頻率差,在1-5赫茲之內,都是正常的[5]。在1000—2000赫茲,最小可區別的頻率差是3. 6赫茲。也就是說,首高的變化超過3. 6赫茲,即能被感知到。 衝激響應一對一個音樂處理系統,當輸入信號為衝激的時候,系統的輸出信號被定義為衝激響應。也即,若輸入是狄拉克衝激抑),則系統輸出Α( )被稱為衝激響應。
如果衝激響應的傅立葉變換為H(Jm),則頻譜響應的定義為的I,幅度譜響應定義為均衡器——在音樂欣賞中,均衡器是一個常用的組件。它的作用就是對不同的頻率增強強度或者衰減強度。通常來說,均衡器被劃分成多個頻率範圍,低音範圍(bass)從20赫茲起;中低音範圍(mid-bass),從100到500赫茲(如低音鼓,低音吉他,話語的低頻段);中頻範圍(midrange),從500赫茲到4000赫茲(如吉他,話語);高頻範圍(tweeters),從 4000 赫茲到 20000 赫茲。濾波——使用特定衝激響應的系統,對輸入信號進行處理,稱為濾波。錄音設備——本發明中錄音設備是可以記錄下外界聲音的電子設備,例如普通動圈話筒、高靈敏度的專業電容麥克等。數字水印技術一本發明測量出的心理聲學參數,可以通過數字水印的方法,嵌入到歌曲當中去。數字水印技術,對於本領域技術人員是顯而易見的。用戶終端——在本發明中,用戶終端是指用戶可以控制的、能夠播放聲音的電子設備,例如消費電子設備、掌上設備、手機、電腦等。本發明所提到的群延遲有兩個方面涵義
第一,群延遲失真如果聲音播放設備產生了群延遲,就能夠被人類聽到失真的感覺。500赫茲人類可以聽出的最小失真是3. 2毫秒的延遲;1000赫茲是2毫秒;2000赫茲是I毫秒;4000赫茲是I. 5毫秒;8000赫茲是2毫秒[6]。另外,群延遲會導致聲音相位譜的失真。相位譜的失真,會帶來音色的改變,使聽者感覺到失真和扭曲。施瓦德(Schroeder)發現了這一現象,具體來說,他發現一個泛音信號,即使幅度譜保持水平,僅僅相位譜改變,就能夠為人們帶來音色和音質的改變[7]。第二,當聲音通過人的內耳,會產生群延遲。實際上,人的內耳的解剖結構,導致了人類對高頻信號反應比低頻信號快。為了描述這一個物理現象,德波爾(doBoer)建立了一個內耳的群延遲數學模型[2]。如果把人耳看作近似為一個線性時不變(LinearTime-Invariant, LTI)系統,那麼它可以用頻率響應ii(SF)來描述。假定外界的聲音是
x{t)=A{t)cQ^{m+θ),那麼人類感覺到的聲音是
y(t) =-r£)-r#) + tf)(公式 I)
在(公式I)中,&是群延遲,是相位延遲。推廣開來,內耳、聽神經末梢、以及聽力系統的各個處理節點,都會對不同頻率,產生不同的延遲。例如,聽力腦幹響應(Auditory Brainstem Response, ABR)檢測,是一種臨床廣泛應用的,篩查新生兒聽力缺陷,檢測成年人聽力障礙的檢查手段 ;如果播放不同的純音,則可以觀察到聽力腦幹響應的延遲是不同的。對於個人電腦、掌上設備和可攜式電子產品,由於尺寸的限制,低於125赫茲的聲音,通過這些設備播放的效果,會嚴重下降,遠遠無法達到家庭影院的音響效果。即使高端的耳機,其頻譜響應,在低於125赫茲的範圍通常也會有IOdB/音程的下降(在高頻端4000赫茲以上,20dB的波動都是常見的)。即使很好的播放設備,其頻譜響應曲線仍然不能保持平坦。而且,每個人的聽力門限的曲線差異巨大。這兩種效果疊加在一起,導致每個人聽同一首歌,聽到的感覺都不是最佳的。對個人來講,疊加後的曲線有尖峰,有低谷。在低谷的地方,這個人就無法聽到音樂的細節。這種情況下,音樂欣賞者傾向於調大音量。大量研究結果表明,音量與聽力永久性損傷有直接的關係,如果音量超過85 dBSPL,則音量越大,收聽時間越長,聽力受到永久性損傷的越快。在不增加音量的情況下,如何給聽者帶來個性化的音樂、更清晰的音樂、更好聽的感覺,從而保護聽力健康,是本領域亟待解決的問題。這個問題,均衡器或者均衡設備無法解決。首先,在不了解個人聽力特徵的情況下,僅憑感覺調節均衡器,有可能會將音樂調的更加不健康。其次,從一個人到另一個人的聽力都不一樣,任何一條或者幾條均衡器曲線,無法匹配個人的聽力。音樂和人類健康之間的關係,包括四方面第一,不適當的音樂,不適當的音樂設備,或者不適當的播放方式,能夠直接損傷人類聽力系統,永久性地導致聽力下降,所以人類應當聆聽適合自己的、有利於自己聽力健康的音樂。第二,每個人的聽力不同,如果一個人的聽力在某些頻率低於平均水平,這個人就無法聽到音樂某些的細節。這種情況下,音樂欣賞者傾向於調大音量。大量研究結果表明,音量越大,聽力永久性損傷越多。這個問題,需要個性化的音樂才能解決。第三,音樂能夠直接影響人的生理狀態,如血壓和心率等,多個研究都證實了音樂療法能夠治療疾病[8,9]。但是,不恰當的播放強度,或者不恰當的頻率成分,不僅不能治療疾病,反而會危害人體健康。例如,人類暴露在400赫茲、109 dBSPL、500毫秒下,其反應如下4-11秒之後,動脈和靜脈血壓顯著上升[10]。讓人感覺刺激性的音樂,還會增加精神疾病的長期風險,影響心率和誘發緊張的荷爾蒙[11,12]。所以,選擇適合於自己的健康的音樂,並欣賞這些音樂,能夠獲得音樂療法的益處,也能夠直接多方面提升健康狀態。第四,在長期實踐中,音樂工作者和音樂愛好者均發現,平坦頻率響應的音樂為平淡無味和沒有活力的。而且,音樂欣賞的個人差異化是顯著的。所以,為每一個人提供個性化的音樂,能夠最大化音樂享受。但是,現有技術和產品,無法滿足這個需求。以上所描述的群延遲失真、低音效果不足、非平坦的頻譜響應、忽視聽力健康、無法獲得個性化的音樂,成為本領域亟待解決的問題。參考文獻
[1].Bekesyj G. v. , Experiments in Hearing. 1960: McGraw-Hill, New York.
[2].deBoer, E. , Auditory physics. Physical principles in hearing theory.Phys. Rep.,1980. 62: p. 87 - 174.
[3].Shore, S. E. and A. L. Nuttallj High-synchrony cochlear compound actionpotentials evoked by rising frequency-swept tone bursts. J. Acoust. Soc. Am.,1985. 78: p. 1286-1295.
[4].ANSI, "American national psychoacoustical terminology" S3.20 AmericanStandards Association. American National Standards Institute, 1973.
[5].Jourdainj R. , Music, the Brain and Ecstasy. 1997: Avon Books, New
York.
[6].Blauertj J. and P. Laws, Group Delay Distortions in ElectroacousticalSystems. Journal of the Acoustical Society of America, 1978. 63(5): p.1478-1483.
[7].Schroederj M. R. and H. W. Strubej Flat-Spectrum Speech. J. Acoust.Soc. Am,1986. 79(5).
[8].Besson, M., et al. , Singing in the brain: independence of lyrics andtunes. Psychol Sci.,1998. 9(494-498).
[9].Platelj H. , Neuropsychology of musical perception: new perspectives.Editorial Oxford, 2002.
[10].Steele, K. M.,J. D. Brown, and J. A. Stoekerj Failure to confirm theRauscher and Shaw description of recovery of the Mozart effect. Percept MotSkills, 1999. 88 (843-848).
[11].Carstensj C. B. , E. Huskinsj and G. W. Hounshellj Listening to Mozartmay not enhance performance on the revised Minnesota Paper form Board Test..Psychol Repj 1995. 77(111-114).
[12].Hughes, J. R. , et al. , The "Mozart effect" on epileptiform activity.Clin Electroencephalogrj 1998. 29 (109-119)0

發明內容
本發明利用聲學測試,獲得用戶個人的聽力特徵,分析得出用戶的聽力健康狀況, 再根據所述用戶的聽力特徵,修改音樂文件,以使所述用戶獲得針對性、健康的、清晰的、好聽的音樂。為實現以上目的,本發明的特徵是一組聲學測試,包括心理聲學測試或聽覺生理學測試;用戶的一組聽力特徵,通過所述的聲學測試獲得;一組聲音處理器,根據所述用戶的聽力特徵,處理、提供個性化的音樂。如前所述,每個人的聽力差異巨大;如果一個人的聽力在某些頻率低於平均水平,那麼這個人就無法聽到音樂在所述頻率的細節;這時,音樂欣賞者傾向於調大音量;大量的研究表明,音量過大,是導致聽力永久性損傷的重要因素。這個矛盾,可以被本發明很好的加以解決。例如,如果用戶在3000赫茲的聽力低於平均水平,而1000赫茲的聽力較好,則本發明自動把音樂中1000赫茲的能量,移動一些到3000赫茲,而不改變總能量;這樣用個性化的能量分配,不僅更健康,而且提高了音樂的細節感和清晰度。從而,本發明使用戶不必增大總音量,即可獲得健康、適合自己的清晰音樂。 本發明設計新穎巧妙、處理效果好、易於實施。


附圖I是等響曲線,曲線上的任何一點所發出的聲音,人類聽到的響度都相同,這條曲線的響度為80方(Phon)。附圖2是本發明的一個具體實施例的結構示意圖,它增強了個性化重低音。附圖3是本發明的一個具體實施例的結構示意圖,它實現了個性化的最佳均衡曲線。附圖4是本發明的一個具體實施例的結構示意圖,它實現了音樂的個性化空間感。附圖5是本發明的一個具體實施例的結構示意圖,它實現了心理聲學空間感的測試。附圖6是本發明的一個具體實施例的結構示意圖,它實現了音樂的空間感隨時間而變化的功能。附圖7是本發明的一個具體實施例的結構示意圖,它實現了心理聲學群延遲的測試。附圖8是本發明的一個具體實施例的結構示意圖,它在音樂信號處理同時採用了個性化幅譜曲線和個性化群延遲。附圖9是本發明的一個具體的時變頻率信號的波形。
具體實施例方式在本發明的描述中,「或」具有包含性的意義,包含任何組合,所以「A、B或C」,包括下面的各種組合{ 「A」,「B」,「 C」,「A和B」,「A和C」,「B和C」,「A、B和C」}。本發明所提到「一個具體實施例」,意味著本發明一個特定的結構或特別的實現。而本發明各段落所提到的「一個具體實施例」,不一定指代同一個實施例。同時,本發明所提到的特定結構和特徵,可以在一個或多個實施例上不受限制的以合適的方式組合。本發明可以運行在網頁伺服器上,也可以獨立運行在用戶終端上,或者通過打電話的方式進行,或者部分運行在網頁伺服器、部分運行在用戶終端上、部分通過打電話的方式進行。本發明不僅包括系統和方法,還包括電腦程式和設備。本發明所提到所有具體實施例,均不對本發明的權利要求產生任何限定。
在本發明的一個具體實施例中,一個心理聲學測試包括多步;每一步有一個聲音從用戶設備中播放出來,如果用戶聽到了聲音,則選「是」,否則選「否」;所述的心理聲學測試,對左耳和右耳分別進行;最終左耳的結果和右耳的結果,分別進行比較,得出聽力健康的報告。在本發明的一個具體實施例中,一個心理聲學測試包括多步;每一步有2個或2個以上的聲音從用戶設備中播放出來;根據測試的要求,用戶必須在多個聲音中選擇一個;所述的心理聲學測試,對左耳和右耳分別進行;最終左耳的結果和右耳的結果,分別進行比較,得出聽力健康的報告。在本發明的另一個具體實施例中,在心理聲學測試的每一步中,用戶可以多選一(即#選1,Λ>1);也可以每一步隨機播放一個刺激,而後採用用戶打分的方法,統計出直方圖,判斷出用戶的測試結果。在本發明的一個具體實施中,心理聲學測試有多個(/7>1)子測試組成;每 個子測試,測量一個用戶的聽力特徵;全部的所述子測試的特徵,組成一個特徵矢量
C = [cu ... c牆C2d ......。地...Cxj ... 總]1";其中。cu,…,e牆是描述弟I個
子測試特徵的數組,t,…,是描述第2個子測試特徵的數組,…,,…,是第《個子測試特徵的數組。在本發明的一個具體實施中,心理聲學測試由多個測試環節組成,每個環節的播放時間;一個測試環節結束之後,用戶做出回答所需的時間為,然後再經過一段等待時間TV,另一個測試環節才開始進行;所述的等待時間·?V,可以因人而異的選擇,實現個性化;這個選擇過程,可以是用戶定製的,也可以由測試程序自動監測,動態配置。在本發明的一個具體實施中,心理聲學測試由多個測試環節組成,每個環節的播放時間;一個測試環節結束之後,用戶做出回答所需的時間為A ;如果在規定的等待時間;內,用戶仍然未做出回答,則自動使用預設回答,並進入下一個測試環節。在本發明的一個具體實施例中,心理聲學測試的目標是獲得響度增長曲線,檢測用戶的聽力好壞;所述的響度增長曲線的獲得,測試了多步;每一步中,用戶對目前的聲音的響度,進行主觀打分;最後,測試的結果是一條客觀音量到主觀響度的映射曲線;所述的映射曲線,其斜率能夠被用於檢查聽力好壞,如果斜率高於平均水平,則有聽力受損發生;如果斜率低於平均水平過多,也是異常情況;所述的映射曲線;第二種用途如下,在多首歌曲播放的時候,或者多個音頻節目播放的時候,實施自動音量控制,保證不同節目播放的音量能夠自適應的個性化的調整。在本發明的一個具體實施例中,用戶的聽力門限,被加以測量;所述的測量中,有#個頻率,被依次測量;第/ 個頻率的聽力門限的測量結果,作為第η+1個測量的初值;這樣的做法,能夠提高測試效率,加速收斂,減小測試時間。在本發明的另一個具體實施例中,用戶使用所述的系統,檢查自己的聽力健康;所述的系統包括多步;每一步中,用戶聽到#個(Λ>2)聲音;在這#個聲音中,#-1個聲音是同樣的(稱為參考聲),只有一個特殊的聲音與其它聲音聽起來不同;所述的N個聲音被順序播放;而特殊聲音隨機出現在其中一個位置;所有的聲音播放結束之後,用戶被要求在#個聲音中找出那個聽起來不一樣的聲音;根據用戶的回答正確或錯誤,測試的難度自動的加大或減小;當難度增加的時候,特殊的聲音和參考聲越來越相似,反之,難度減小的時候,特殊的聲音和參考聲差異越來越大;如果用戶連續#步(M為整數)回答都是正確的,則增大測試的難度,否則,降低測試的難度;所述的測試,跟蹤了用戶的聽力能力;對跟蹤曲線進行分段平均,就能夠得到測試結果;所述的測試結果,代表了用戶的聽力狀態和聽力健康水平。在本發明的一個具體實施例中,用戶使用心理聲學測試,測試聽力,建立個人聽力的模型;所述的心理聲學測試有2*Z個子測試組成;所述的測試,一半對左耳,一半對右耳,使用的聲音可以是純音、噪音、帶通噪音、帶阻噪聲、噪音中的純音、帶通噪音中的純音或帶阻噪聲中的純音。在本發明的一個具體實施例中,一個心理聲學測試實施在用戶上,並最終獲得雙耳的測試結果,該測試結果被用於一個分類算法,最終診斷和篩查聽力的健康狀況。
在本發明的另一個具體實施例中,心理聲學測試的結果,被用於聲音療法,提升記憶力及集中力,緩解自閉症或抑制癲癇。在本發明的另一個具體實施例中,心理聲學的測試結果,被用於配置一個專業的聲音治療設備,為用戶實施相應的治療。在本發明的一個具體實施例中,用戶撥打一個電話做聲學測試,定製個性化的音樂;接通之後,用戶做聲學測試;所述的聲學測試由很多步組成;在每一步中,用戶聽到一個或多個聲音,根據測試的要求,用戶通過#選一的方式做選擇,或者通過打分的方式做出響應;所述的用戶響應,可以是按下一個鍵,也可以是口頭回答;在測試結束之後,所述的用戶響應,被用來計算用戶的聽力特徵;所述的聽力特徵,被用來為用戶提供個人定製的音樂;一旦提取了用戶特徵,用戶就可以獲得多首定製過的、個性化的音樂。在本發明的另一個具體實施例中,用戶通過撥打電話的方式進行聲學測試,測試結果可以用不同的平臺給用戶反饋;所述的反饋,可以用語音的方式告知用戶,也可以用簡訊的方式、網絡的方式、或者紙面的方式;所述的反饋的內容,包含向用戶推薦的一組歌曲,輸出用戶在所有人聽力中的排名,提供用戶聽力健康的狀態,對用戶聽力保健做出建議,對用戶聆聽的音樂的建議或者對用戶日常聽力保健習慣的建議。在本發明的一個具體實施例中,用戶可以撥打電話或者上網的方式,定製個性化鈴音;用戶進入「歌曲庫」,選取一首想用來做彩鈴或炫鈴的歌曲;所選的歌曲,其幅度譜和相位譜被處理成多種音樂效果,播放給用戶聽;所述的每一種音樂效果,用戶加以打分;最高分的音樂效果,被記錄下來,應用到所選音樂上;用戶可以反覆試聽、選擇,直到滿意為止。在本發明的一個具體實施例中,用戶在網絡上進行聲學測試,以獲得推薦的音樂;所述的聲學測試結果,與用戶偏好、用戶打分、用戶選擇歌曲的歷史、用戶個人信息、文字、年齡或性別,進行聯合搜索,推薦適合個人的音樂。結合圖2,詳細說明本發明的一個具體實施例,但不對本發明的權利要求作任何限定。如圖2,用戶的聽力學特徵,被用於個性化重低音;輸入音樂201,通過帶通濾波器202,帶通濾波器203,帶通濾波器204被分成#個頻段;所述的帶通濾波器輸出帶通信號,到諧波發生器205,諧波發生器206,諧波發生器207 ;所述的諧波發生器的輸出,進入到個性化相位器208 ;所述的個性化相位器208,包括相位譜調整器209,相位譜調整器210,相位譜調整器211 ;所述的相位譜調整器,其輸出到個性化幅度器215 ;所述的個性化幅度器包括幅度譜調整器216,幅度譜調整器217,幅度譜調整器218 ;所述的幅度譜調整器的輸出,被加法器219相加,成為輸出音樂220。結合圖3,詳細說明本發明的另一個具體實施例。如圖3,本發明被用來輸出一個用戶的最佳均衡曲線。圖中所述的均衡器庫是一個二維的矩陣,矩陣的第7行、第《列的元素,是一組均衡曲線Etm』n』J),其中,7表示第I個類型的歌曲,m表示第 種用戶需求,/ 表示第條均衡曲線,/是頻率。如圖3,用戶自己的歌曲301,或者歌曲庫302中的歌曲,被選擇成為所選歌曲203 ;所述的用戶對此進行聆聽,根據聽覺感受,從列表中選擇一個需要改進的選項304 ;所述的選項304,表明了用戶對自己需求的主管描述;所述的描述,被用於從均衡器庫305 (由所有的對1,風》,/)構成)讀取所需的均衡曲線;所選歌曲303,經過歌曲分析和分類器306,輸出分類信息到所述的均衡器庫305 ;所述的均衡器庫305,輸出#個具有不同音樂效果的歌曲307 ;所述的用戶對#個歌曲307進行打分,獲得分數308 ;最高分數的歌曲就是最佳的個性化音樂309,並同時輸出的最佳均衡曲線310。 所述的應構成為
=1,用戶需求為增加背景聲效如雷聲、火車聲等;所述的均衡曲線是增強20-40赫茲的頻率;所述的均衡曲線5^皿《2,/)是減弱20-40赫茲的頻率。ffi=2,用戶需求為增強架子鼓的嘭嘭聲、增強低音感覺;所述的均衡曲線
是增強60赫茲-200赫茲,減弱100-4000赫茲,增加5000赫茲;所述的均衡曲線
爾,2,/)是增加泛音。 =3,用戶需求為增強大鼓的聲音;所述的均衡曲線£|, 丄/)是輕微增強80赫
茲,所述的均衡曲線是降低多軌錄音中其它樂器的音量、包括降低電聲吉他的音量。 =4,用戶需求為增強低音,增強吉他、歌聲與號的熱烈感覺,或者增強這些樂器的充實感;所述的均衡曲線_,丄/)是增強80-200赫茲;所述的均衡曲線EtmXA ,為了增強低首,可以減小350赫茲左右,提1 800赫茲。 =5,用戶需求為增強低音同時增強高音;所述的均衡曲線£¢.氣I,/)是輕微降低100-4000 赫茲。 =6,用戶需求為增強音樂的熱烈感覺;所述的均衡曲線是增強120赫茲以下的頻率,增強程度適中,避免出現渾濁感。 =7,用戶需求為增強音樂的隆隆聲、增強電影音樂的爆炸聲或者動作聲、增加原聲吉他和鋼琴的音質;所述的均衡曲線, Χ/)是輕微增強120-125赫茲,這是低音喇叭的上限,也是大鼓和低音吉他的下限,同時是原聲吉他和鋼琴的下限,而原聲吉他的主體在240赫茲,清晰度在2500-5000赫茲;所述的£仏《,2,/)輕微減弱120-125赫茲。 =8,用戶需求為增加音樂深度、增加歌聲和樂器的呈現感;所述的均衡曲線麟凡1,/)是增強120-600赫茲的頻率;所述的均衡曲線_,層,2,/)是減弱120-600赫茲的頻率。 =9,用戶需求為增強音樂中鈸的感覺、減少音樂中的渾濁感覺;所述的均衡曲線韻丄/)是增強200赫茲;所述的均衡曲線是減弱200赫茲。 =10,用戶需求為充實小鼓的感覺、增強原聲吉他的充實感、減弱歌聲以減小;所述的均衡曲線紙1/)是增強240赫茲;所述的均衡曲線£|,歡2,/)是減弱240赫茲。 =11,用戶需求為減弱鼓聲中的「紙板」聲、減弱低音吉他;所述的均衡曲線忍丄/)是減弱350-400赫茲頻率;所述的均衡曲線是增強350-400赫茲。ffi=12,用戶需求為增強呈現感、增強音樂的硬度;所述的均衡曲線韻,》上/)是增強600-3000赫茲頻率,尤其是搖滾樂;所述的均衡曲線》,2,/)是減弱600-3000赫茲。
=13,用戶需求為增強低音吉他的打擊感、減弱電聲吉他的劣質聲音;所述的均衡曲線韻ΛΙ,/)是增強800赫茲的頻率;所述的均衡曲線域具2,/)是減弱800赫茲的頻率。 =14,用戶需求為增強大鼓的鼓槌的敲打感;所述的均衡曲線SCiV· ;!,/)是增強2000-4000赫茲頻率;所述的均衡曲線£^,謂,2,/)是減弱2000-4000赫茲頻率。 =15,用戶需求為增強吉他真實的絲絲聲、增強低音吉他的感覺;所述的均衡曲線 丄/.)是增強2500赫茲頻率,尤其是彈弦/擊弦彈奏風格;所述的均衡曲線
是減弱2500赫茲頻率。 =16,用戶需求為增強原聲吉他和鋼琴的清晰度;所述的均衡曲線是增強2500-5000赫茲頻率;所述的均衡曲線Si 麼/)是減弱2500-5000赫茲頻率。 =17,用戶需求為增強搖滾樂的響度、增加熱烈感覺;所述的均衡曲線是增強3000-7000赫茲頻率;所述的均衡曲線是減弱3000-7000赫茲頻率。 =18,用戶需求為增強音樂的歌聲;所述的均衡曲線讀,《,〗,/)是增強4000赫茲頻率所述的均衡曲線5仏》,2,/)是減弱4000赫茲頻率。 =19,用戶需求為增強架子鼓的打擊感、為小鼓增加的清晰尖利感、減小背景聲;所述的均衡曲線靡丄/)是增強5000赫茲頻率;所述的均衡曲線5(1,房,2,/)是減弱5000赫茲頻率。 =20,用戶需求為增強鈸的質量和準確性、增加歌曲的精確度、減小歌聲中的噝聲;所述的均衡曲線£|具1,/)是增強7000赫茲以上的頻率;所述的均衡曲線讀,樹,2,/)是減弱7000赫茲以上的頻率。 =21,用戶需求為增強鈸、高帽鈸音樂的亮度;所述的均衡曲線讀,層丄/)是增強8000-12000赫茲頻率;所述的均衡曲線£仏》,.2,/)是減弱8000-12000赫茲頻率。 =22,用戶需求為增強鋼琴、風琴的清晰度;所述的均衡曲線51取1,/)是增強10000赫茲頻率;所述的均衡曲線是增強10000赫茲頻率。在本發明的另一個具體實施例,一個多軌錄音的個性化混音如圖3所示;所述的混音器的目的,是為了個人獲得最大的音樂享受;所述的混音器,除了包含圖3所述的均衡曲線讀,紙《,/),還增加了一個維度,就是樂器類型;所述的樂器類型是指吉他,鋼琴,鈸,高帽鈸,大鼓,小鼓,架子鼓,風琴,歌曲等;根據不同的樂器類型,多軌錄音在混音以前,可以對每一軌的樂器進行單獨的均衡,均衡的方式如圖3所示;最後,均衡後的單軌聲再疊加在一起。在本發明的一個具體實施例中,心理聲學測試結果,被結合於雙耳效應,使人產生虛擬的空間感,把多軌錄音中的歌聲和多個樂器,在空間中排布開來 ,給人身臨其境的感覺;如果在單軌錄音的情況下,則單軌錄音先被提取出歌聲和多個樂器的聲音,然後在空間排布;如圖4所示,輸入音樂401,通過音樂分析器,被分成#個空間信號,即空間信號403,空間信號404,空間信號405 ;所述的空間信號,分別進入個性化幅度均衡器406,個性化幅度均衡器407,個性化幅度均衡器408 ;所述的個性化幅度均衡器的輸出,被個性化相位器409,個性化相位器411,個性化相位器412分別加以處理,在加法器412相加,成為個性化的
Vr. ΓΤ.
曰本 在本發明的另一個具體實施例中,心理聲學測試包含多步;每一步中,#個空間信號被播放出來,用戶做出一個選擇;根據所述的選擇,在下一步中#個空間信號被播放出來;最終,測試結果可以顯示用戶的空間分辨能力;所述的空間分辨能力,可以用來個性化用戶的歌曲,以產生個性化的、虛擬三維空間的感覺;所述的具體實施例,如圖5所示,空間心理聲學測試501包含多步,在每一步,發射#個信號,即空間信號502,空間信號503和空間信號504。在本發明的一個具體實施例中,音樂的個性化空間感,由圖6的結構實現;音樂分析器分析出多個獨立成分;所述的獨立成分,是歌曲和多個樂器;然後隨著節拍的提取,歌曲的聲源可以指向虛擬空間中某一點;所述的指向性,隨著時間的變化而變化,以重現歌手在舞臺上的走動;這種移動,結合個性化幅度均衡器,以及個性化相位均衡器,給人以個性化的現場感;如圖6所示,輸入的音樂601,進入音樂分析器602,被分成#個空間信號;所述的Ar個空間信號,是空間信號604,空間信號605, ···,空間信號606 ;所述的音樂分析器602的第二個輸出是音樂節拍603 ;所述的音樂節拍603,經過空間軌跡器613,產生隨時間變化的空間軌跡,控制空間信號605,使用戶的歌聲隨著時間變化位置,產生歌手走動的,歌聲來自不同方向的感覺;所述的#個空間信號的輸出,分別連在個性化幅度均衡器607,個性化幅度均衡器608,…,個性化幅度均衡器609上;所述的個性化幅度均衡器,輸出到個性化相位均衡器610,個性化相位均衡器611, ···,個性化相位均衡器612上,由加法器614對信號進行相加,得到個性化的音樂615。用戶通過用戶設備,連接網絡進行測試,獲得測試結果;所述的測試結果,能夠結合用戶其它個人信息,為用戶提供多種不同的個性化服務,包括聽力健康諮詢,網絡音樂定製,音樂預處理,音樂療法等。用戶的聲學測試,分為開放聲場型和耳機型。前者是直接通過空氣,播放給用戶聽;後者通過耳機,直接插入耳朵,覆蓋在外耳,或者戴在頭上收聽。
在本發明的一個具體實施例中,實驗方式為開放聲場型,播放激勵音時,用戶捂住一隻耳朵,用另一隻耳朵聽取聲音;測試一隻耳朵結束後,換成另一隻耳朵,重複測試。用戶也可以使用耳塞或者聲音隔絕工具,阻塞一隻耳朵。對於本領域技術人員,選擇使用耳塞的方法,是顯而易見的,可以挑選噪聲降低評級(NoiseReductionRating, NRR)高的耳塞。在本發明的另一個具體實施例中,聲學測試使用開放聲場型,對於雙耳聽力不平衡的用戶,有一隻耳朵A不好,另一隻耳朵B明顯較好;有可能這種情況,當測試耳朵A的聽力、阻塞耳朵B時,因為需要的音量較大,導致耳朵B通過頭部骨骼的漏音,聽到一部分聲音,這影響了對耳朵A的單耳測試效果。為求更好的測試效果,可以用一隻耳機,對耳朵B播放掩蔽的噪音,同時對耳朵A進行測試。
在本發明的另一個具體實施例中,快速測試的用戶,可以在自由聲場或者佩戴耳機時同時測量兩個耳朵的聯合聽力,將測試時間減小一半。在本發明的一個具體實施例中,心理聲學測試需要測量背景噪聲的強度;在所述的測量中,用戶的一隻耳朵外露,另一隻耳朵聆聽耳機的聲音。不限定性的舉例,右耳外露,左耳通過耳機收聽聲音;耳機中的聲音會逐漸增大音量,直到雙耳感覺聲音平衡時,用戶停止測試;另一種測試方法是,耳機中聲音的音量也可以從響亮到微弱,直到感覺雙耳響度平衡,用戶停止測試;又一種測試方法,耳機中的聲音的音量,也可以從響亮到微弱,從微弱到響亮,反覆多次,直到最後取算數平均值或幾何平均值,即為背景噪聲的強度。然後,左右耳交換位置,重複以上步驟,即可測得另一隻耳朵的背景噪聲強度。除非特殊的環境,左右耳的噪聲強度是相同的;一旦兩者有差異,則其中的一隻耳朵有聽力損傷。播放的聲音,可以是噪音;也可以是濾波噪音,濾波噪音譜的形狀,由用戶個人的響應曲線決定,也可以由ANSI平均的響應曲線確定。在本發明的一個具體實施例中,音效卡的影響在聲學測試之前能夠被消除掉;用戶登錄一個網站,用音頻線把耳機輸出口接在錄音輸入口上,點擊開始,則網站播放一個或多個聲音,同時錄下聲音;所述的錄下的聲音,被上傳到網站,並加以分析,得到音效卡的頻譜響應曲線;根據所述的頻率響應曲線,存在網站上,用於精準的校準該用戶的心理聲學測試結果;網站所播放的聲音,可以是白噪聲,濾波噪聲,純音,或者特定的聲音文件如格雷碼(Golay Code)。在本發明的另一個具體實施例中,音效卡的影響,能夠使用離線法來消除;用戶下載一個或者多個聲音文件,用音頻線連接音頻輸出口到音頻輸入口 ;所述的聲音文件,使用用戶設備自帶的播放軟體播放,並同時用錄音軟體進行錄音;最後,將錄音文件用分析軟體進行分析,即可獲得音效卡的頻譜響應曲線,以校準而獲得精準的心理聲學測試結果。在本發明的一個具體實施例中,音樂設備被提前校準,以獲得極為精確的心理聲學測試結果;所述的音樂設備,可以從網上或者本機軟體,依次播放一個特定的聲音,可以是白噪聲,濾波噪聲,純音;使用電壓表,電流表,或者聲強儀,調節音量,直到電壓,電流,或者聲壓,達到耳機手冊的標稱值。在本發明的一個具體實施例中,用戶的心理聲學測試結果,通過數字水印技術,寫在歌曲文件中,如寫入mp3文件中;在歌曲播放的時候,需要具有解碼功能的播放器;所述的播放器,解碼數字水印,在播放的過程中調整歌曲的幅譜響應和相位譜響應,使用戶獲得實時的個性化享受。
在本發明的另一個具體實施例中,用戶的心理聲學測試結果,被用數字水印技術,寫在歌曲文件中,作為頭信息;所述的頭信息,具有防盜版功能,用戶甲的播放器,無法播放用戶乙的音樂文件。在本發明的一個具體實施例中,個性化幅譜曲線被提供給單個用戶,處理輸入的音樂流;所述的用戶的雙耳聽力門限為At/,I),其中i=l表示左耳,i=2表示右耳,/表示頻
率;所述的個性化幅譜曲線,使用IM/,來均衡音樂,其中A 均為整數;不加限制的舉
例,n/m= 2的時候,均衡後的個性化音樂,給人的感覺清晰而且柔和。本發明的一個具體實施例中,可以隨著響度的大小,自動調整均衡曲線的方法;將頻帶分割成符合人耳臨界頻帶的方式,測量每個頻帶的能量,計算其響度,然後疊加起來。在本發明的一個具體實施例中,用戶使用噪聲中的純音,獲得自身的聽力檢測門限;利用此門限,獲得一條幅度隨著頻率變化的曲線;所述的曲線,加入了掩蔽的效應,更 加符合收聽音樂時,用戶個人對每個頻段的感知能力;所述的曲線,可以被用於均衡,獲得更加健康的歌曲和音樂。在本發明的一個具體實施例中,音樂信號處理採用了激勵相位對齊技術,濾波輸入的音樂流,獲得個性化群延遲,從而使用戶的音樂體驗達到巔峰;所述的激勵相位對齊技術,保證了每一個頻率分量,到達耳蝸的時間,都是嚴格對齊的;對齊的相位,隨頻率變化而變化,其規律符合一個調頻脈衝信號;不限定的舉例,調頻脈衝信號表達如下
Tgifh kif +aTd
(公式2)
其中,TffC/)是群延遲時間,/是頻率,k=4. 78,a=165. 4,d=l. I。根據群延遲時間,可以計算出相位延遲時間&(/),方法如下
I
(公式3)
在本發明的另一個具體實施中,音樂信號處理採用了激勵相位對齊技術,針對如下兩個問題進行精細的修正;第一個問題是,個人的相位特性,與(公式2)的平均相位特性不完全吻合,這會破壞相位補償關係;第二個問題是耳機帶來附加的扭曲,則此補償關係進一步遭到了破壞;所述的兩種破壞有可能疊加在一起,或者單獨存在,需要進一步適配,得到個性化的補償;所述的激勵相位對齊技術,利用降頻的調頻信號,根據圖7所示的群延遲心理聲學測試,搜索出用戶最小可區別的降頻速率;所述的最小可區別的降頻速率,於公式(2)相比較,根據兩者的差值,就能夠計算出進一步相位補償的程度;如圖7所示,在群延遲心理聲學測試中,時變頻率信號702,時變頻率信號703,…,時變頻率信號704,共#個信號發送給用戶,用戶聆聽之後,被要求選擇其中一個。在本發明的另一個具體實施中,音樂信號處理採用了激勵相位對齊技術,採用如下方法做進一步的修正;用戶採用聽覺生理實驗的方法,記錄在播放純音或帶通噪聲的條件下,測量出來的聽覺腦幹響應(Auditory Brainstem Response, ABR),畸變產物耳聲發射(Distortion Product Oto-Acoustic Emissions,DPOAE),複合動作電位(Compound ActionPotential, CAP)或腦電圖(Electroencephalography, EEG),然後計算出個人的群延遲曲線;所述的群延遲曲線和公式(2)相比較;兩者的差值,被用於得出個性化群延遲。在本發明的一個 具體實施例中,音樂信號處理同時採用了個性化幅譜曲線和個性化群延遲,以使音樂滿足用戶獨特的音樂欣賞要求,其步驟如圖8,輸入音樂801,通過個性化幅度譜均衡803 ;所述的個性化幅度譜均衡803,由一個心理聲學測試802的結果控制;所述的輸入音樂801,通過響度分析模型805,得到響度估計值804 ;所述的響度估計值804,控制了個性化幅度譜均衡803 ;所述的個性化幅度譜均衡803的輸出,通過相位均衡806,得到輸出音樂807。在本發明的一個具體實施例中,個性化群延遲信號可以被加以簡化如下
x(l) = cm(2M2)(公式 4)。
權利要求
1.聲音處理系統,包括心理聲學測試和聲學處理器;其特徵在於所述的心理聲學測試,驅動ー個播放設備,將測試所需的多個聲音發給ー個用戶;所述的用戶,針對所述的聲音做出相應回答;所述的回答,被收集起來,得出心理聲學測試的結果;所述的測試結果,作為參數被配置到所述的聲學處理器中;所述的聲學處理器,分析所述的測試結果,得出用戶的聽カ特徵和聽力健康狀態;根據所述的聽カ特徵,所述的聲學處理器,把普通音樂處理成個性化的、專門為所述用戶定製的音樂,以達到有利於用戶聽カ健康的,提高聽覺體驗的效果。
2.根據權利要求I的聲音處理系統,其特徵在於所述的心理聲學測試被聽覺生理學測試所代替。
3.根據權利要求I或2的聲音處理系統,其特徵在於所述的處理,包括對輸入音樂的幅度譜的個性化調整,以及對輸入音樂的相位譜的調整,為所述用戶提供最優化的聽覺體驗;所述的最優化的聽覺體驗,有利於所述用戶的聽覺系統健康,同時帶來更加個性化的,更加震撼的音樂效果和更加增強的音樂感受。
4.根據權利要求2的聲音處理系統,其特徵在於所述的聽覺生理學測試,通過發送純音、帶通噪音,測量用戶的聽覺腦幹響應,計算出聽覺處理的群延遲,利用群延遲和相位延遲之間的關係,得到相位延遲;所述的相位延遲,被用於調整輸入音樂的相位,以使所述的用戶獲得個人最優的聽覺體驗。
5.根據權利要求3的聲音處理系統,其特徵在於所述的對輸入音樂的相位譜的調整,是個性化的,是針對每個用戶聽カ特徵單獨定製的。
6.根據權利要求I或2的聲音處理系統,其特徵在於所述的處理,目的是進行個性化低音增強。
7.根據權利要求I或2的聲音處理系統,其特徵在於所述的處理,目的是對音樂進行個性化的空間感增強,使音樂更加有立體感。
8.根據權利要求I或2的聲音處理系統,其特徵在於多軌錄音的每ー軌,都被単獨的個性化,然後合成為ー個音樂作品。
9.根據權利要求I或2的聲音處理系統,其特徵在於多軌錄音的每ー軌,作為ー個聲源;利用雙耳效應,讓人感覺所述聲源來自聲場空間的某ー個點,進行個性化空間感增強;最後,所有軌處理後的信號合成為ー個作品。
10.根據權利要求I或2的聲音處理系統,其特徵在於所述的聲學處理器被個性化音樂搜索和個性化音樂分類所代替;所述的聲學測試結果,被用於音樂捜索和分類;所述的音樂搜索和分類,為單個用戶捜索出個性化的音樂,推薦個性化的音樂。
11.根據權利要求I或2的聲音處理系統,其特徵在於所述的處理,根據一首歌曲的信號特徵,相應地補償,把最適合用戶個性聽カ特性的幅度譜和相位譜,應用到所述歌曲上去。
12.根據權利要求I或2的聲音處理系統,其特徵在於所述的聲學處理器,為每ー類風格的音樂,做個性化的幅譜調整和相位譜調整;從而,對於一個用戶,所述的聲學處理器根據用戶選擇的音樂類型不同,做出不同的處理。
13.根據權利要求I或2的聲音處理系統,其特徵在於所述的聲學處理器,針對雙耳的互掩蔽、互時間差和互強度差的特性,個性化地提供立體聲雙通道的最佳播放效果。
14.根據權利要求I或2的聲音處理系統,其特徵在於所述的聲學處理器,根據個人的幅度響應特徵和相位響應特徵,推導最適合個人的空間濾波器,該濾波器能夠使用戶產生空間感覺;所述的空間濾波器為多個,分別並行處理音樂中的多個組成部分,使用戶聽到每ー個組成部分來自空間的某ー個點。
15.根據權利要求14的聲音處理系統,其特徵在於所述的空間濾波器是隨著音樂的播放而時變的;這種隨著時間的變化,使用戶感覺到音樂的來源在空間中隨著時間的變化而移動,帶來更多的身臨現場的動態效果。
16.根據權利要求I或2的聲音處理系統,其特徵在於所述的用戶的聲學測試結果,被加上密碼,寫入音樂文件中,形成ー個包含了用戶個人信息的新音樂文件;在被播放的時候,所述的新音樂文件中的個人信息,被解碼得到個人聲學測量結果,在播放的過程中最優化聽覺體驗。
17.根據權利要求I或2的聲音處理系統,其特徵在於所述的ー個用戶的心理聲學測試結果,提供了聲學的曲線;所述的聲學的曲線,可以用於把大的音樂文件壓縮成小的音樂文件;所述這種壓縮是個性化的,在被播放的時候,所述的用戶不會察覺到音質的受損。
18.聽カ檢查系統,其特徵在於通過心理聲學測試,獲得用戶的左右耳聽カ曲線;左右耳聽カ曲線做差,得到第一條曲線;在左耳聽カ曲線上,每個頻率點的值,與相鄰頻率點的值做差,得到第二條曲線;在右耳的聽カ曲線上,每個頻率點的值,與相鄰的頻率點做差,得到第三條曲線;所述的三條曲線,被聯合加以分析,獲得用戶聽カ特徵,報告聽カ健康的狀態。
19.根據權利要求18的聽カ檢查系統,其特徵在於所述的左右耳聽カ曲線,使用純音、噪聲、噪聲中的純音、帶通噪音、帶阻噪聲、帶通噪音中的純音和帶阻噪聲中的純音這些聲音中的ー種以上,分別測量左右耳得出,從而獲得用戶聽カ特徵,最優化音樂,增強個性化的音樂體驗。
20.根據權利要求I或2的聲音處理系統,其特徵在於所述的聲學測試,利用時變頻率信號,來測試個人聽覺對音樂的群延遲;所述的測試結果,被用來增強各個頻率之間的同步到達性,使用戶感受最優的音色。
21.根據權利要求I或2的聲音處理系統,其特徵在於所述的聲學處理器,基於輸入的音樂信號,產生諧波信號,諧波信號的相位譜由ー個聲學測試來確定,諧波的幅度譜由第ニ個聲學測試來決定;所述的第一個聲學測試,測試個人聽覺的群延遲;所述的第二個聲學測試,測試個人的等響曲線。
全文摘要
本發明公開了一種面向個人聽覺的聲音處理系統;本系統通過測試個人的聽力,結合多年的人耳聽覺以及心理學的研究數據,分析出個人聽覺特徵,建立個人聽力模型,從而評估用戶的聽力健康狀況;根據所評估的聽力健康狀況,本系統可以完成對各類音樂、歌曲的個性化處理,以達到有利於用戶聽力健康的,提高聽覺體驗的效果;本系統還可以對各類音樂、歌曲進行聲學特徵分析,基於用戶聽覺與心理特徵,為用戶搜索歌曲,向用戶推薦音樂,達到個性化營銷的目的;本系統不僅可以通過互動式語音應答或在網絡上實現,還可以在終端設備上進行集成;本系統廣泛適用於網際網路行業和電子產品行業。
文檔編號G10L11/00GK102682761SQ20111005899
公開日2012年9月19日 申請日期2011年3月12日 優先權日2011年3月12日
發明者謝津 申請人:謝津

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀