音頻信號的編輯的製作方法
2023-05-07 12:54:36 1
專利名稱:音頻信號的編輯的製作方法
技術領域:
本發明涉及編輯音頻信號。
通常,在變換編碼器中,輸入音頻信號被編碼為包括一個或多個幀的位流,每個幀包括頭部以及一個或多個段。編碼器將信號分成以給定採樣頻率採集的採樣塊,並且這些被變換成頻域以識別給定段的信號的譜特徵。所得的係數(resulting coeeficient)不被傳輸至全精度,而相反被量化以代之以較小的精度,實現了字長的節省並因此實現了壓縮。解碼器執行逆變換以產生具有較高、成形、噪聲底層的原始版本。
通常理想的是通過例如拼接原始信號以包括另一信號或簡單地去除原始信號的部分來編輯音頻信號。在以壓縮格式表示音頻信號的情況下,不理想的是首先將原始音頻信號壓縮成時域以使其在對所編輯的信號進行有損再壓縮之前可與另一時域信號拼接。這通常將導致音頻信號原始部分的較低質量。這樣,位流被壓縮的數據的編輯一般是在幀基礎上進行的,這與壓縮格式關聯,同時使編輯點位於幀邊界。這使得原始信號質量不受插入新信號的影響。
因此編輯的精度與幀的大小有關—其典型地具有近似100ms的解析度。即使具有較高位速率要求的單段的幀被使用(由於幀頭部開銷),精度可以在最佳段大小處—近似10ms的解析度。
因此,為了允許精細網格編輯,幀需要為適當短。短幀的缺點是過多的幀開銷,其涉及例如幀頭部,以及以下事實連續的幀之間的冗餘不能被利用到最完全的程度,從而導致較高的位速率。
因此,為了有效的編碼,大幀是理想的,而就編輯能力而言,短幀是理想的。不幸的是,這些方面是衝突的。
在提交於2000年3月15日的歐洲專利申請No.00200939.7(代理RefPH-NL000120)中所述類型的正弦編碼器中,有可能限定所謂的瞬變位置,它是動態範圍突然變化的位置。典型地,在瞬變位置處,動態範圍的突然變化被觀察並且被合成為瞬變波形。
如果使用自適應成幀,則從瞬變波形的位置,用於信號剩餘正弦和噪聲分量的合成的分段(segmentation)被計算。
依照本發明,提供了一種編輯由被編碼的音頻位流表示的原始音頻信號的方法,所述被編碼的音頻位流包括多個幀,每個所述幀包括頭部以及一個或多個段,每個段都包括表示所述原始音頻信號的參數,該方法包括步驟確定對應於所述原始音頻信號中時間上某一瞬間的編輯點;對含有時間上的所述瞬間的時間階段在表示所述原始音頻信號的目標幀中插入表示時間上所述瞬間的瞬變的參數和所述參數表示編輯點的指示符;以及產生表示經編輯的音頻信號並包括所述目標幀的經編碼的音頻信號。
在優選實施例中,提供了一種以高子幀精度來編輯相對長的幀以便於在正弦編碼的情況下進行編輯的方法。為了提供這種用於高精度編輯的方法,所謂的瞬變位置可被應用於先前所編碼的信號中需要編輯點的地方。通過例如音頻編輯應用,作為某種後處理而進行添加。使用瞬變位置作為編輯點的優點是信號可由此在原則上以採樣解析度精度在瞬變位置處突然結束或開始,而在現有技術系統中,人們被局限於幀邊界,其例如每100ms出現一次。
事實上,本發明「濫用」瞬變位置來限定編輯點。這些編輯瞬變位置事實上是一種偽瞬變,因為在這些位置處沒有瞬變波形被產生。
本發明與現有技術自適應成幀的不同之處在於,在自適應成幀中,成幀依賴於瞬變位置而被確定(因此,幀的細分在兩個隨後的瞬變位置之間被進行)。本發明的不同之處在於,給定成幀是所需的(在編輯位置上)並且瞬變位置被限定給予所述所需的成幀。事實上,本發明可與自適應成幀一起或無需它而工作。
現在將參照附圖來描述
具體實施例方式
圖1示出提交於2000年3月15日的歐洲專利申請No.00200939.7(代理人RefPH-NL000120)中所述類型的音頻編碼器的實施例;圖2示出被安排以播放依照本發明產生的音頻信號的音頻播放器的實施例;圖3示出依照本發明包括音頻編碼器、圖2的音頻播放器和編輯器的系統;以及圖4示出依照本發明來處理的位流的一部分。
在本發明的優選實施例、圖1中,待編輯的音頻信號最初是由提交於2000年3月15日的歐洲專利申請No.00200939.7(代理RefPH-NL000120)中所述類型的正弦編碼器所產生的。在該較早的案例中,音頻編碼器1以特定採樣頻率來採樣輸入音頻信號,從而產生音頻信號的數字表示x(t)。這改變(render)了依賴於採樣速率的時間尺度t。編碼器1然後將所採樣的輸入信號分為三個分量瞬變信號分量、持續確定性分量和持續隨機分量。音頻編碼器1包括瞬變編碼器11、正弦編碼器13和噪聲編碼器14。音頻編碼器任選地包括增益壓縮機構(GC)12。
在本案例中,在持續編碼之前進行瞬變編碼。這是有利的,因為在本實施例中,實驗表明瞬變信號分量在持續編碼器中被較低效地編碼。如果持續編碼器被用於編碼瞬變信號分量,需要大量的編碼勞動強度;例如,人們可以想像僅以持續正弦波來編碼瞬變信號分量是困難的。因此,在持續編碼之前從待編碼的音頻信號去除瞬變信號分量是有利的。亦將看到,在瞬變編碼器中得到的瞬變開始位置可被用於持續編碼器以便進行自適應分段(自適應成幀)。
儘管如此,本發明不局限於特別使用歐洲專利申請No.00200939.7中所公開的瞬變編碼,而這被提供僅僅是為了舉例。
瞬變編碼器11包括瞬變檢測器(TD)110、瞬變分析器(TA)111和瞬變合成器(TS)112。首先,信號x(t)進入瞬變檢測器110。該檢測器110估算是否有瞬變信號分量及其位置。該信息被饋給瞬變分析器111並亦可被用於正弦編碼器13和噪聲編碼器14以獲得信號誘發的自適應分段。如果瞬變信號分量的位置被確定,則瞬變分析器111嘗試提取瞬變信號分量(的主要部分)。它將形狀函數匹配於優選在所估算的開始位置處開始的信號段,並且通過採用例如一個(小)量的正弦分量來確定形狀函數之下的內容。該信息被包含在瞬變編碼CT中,而有關產生瞬變編碼CT的較詳細信息被提供在歐洲專利申請No.00200939.7中。在任何情況下將看到,例如,在瞬變分析器採用Meixner如形狀函數的地方,則瞬變編碼CT將包括瞬變開始的開始位置;基本上表示初始侵襲率(attackrate)的參數;和基本上表示衰減率的參數;以及該瞬變正弦分量的頻率、振幅和相位數據。
如果由編碼器1產生的位流待由解碼器獨立於用於產生位流的採樣頻率而合成,則開始位置應作為時間值而不是例如幀內的採樣數被傳輸;並且正弦波頻率應作為絕對值或使用表示絕對值的標識符而不是作為僅可從變換採樣頻率得出或與其成比例的值被發送。在其它現有技術系統中,一般選擇後者的選項,這是因為作為離散值,它們從直觀上較容易編碼和壓縮。然而,這需要能重新產生採樣頻率的解碼器以重新產生音頻信號。
在歐洲專利申請No.00200939.7中公開了在瞬變信號分量是振幅包絡中的階梯形變化的情況下,瞬變形狀函數亦可包括階梯指示。同樣,儘管本發明不局限於任何一個實施,階梯形變化的位置可被編碼為時間值,而不是採樣數,其可能與採樣頻率相關。
瞬變編碼CT被提供給瞬變合成器112。所合成的瞬變信號分量在減法器16中從輸入信號x(t)被減去,從而產生信號x1。在GC12被省略的情況下,x1=x2。信號x2被提供給正弦編碼器13,在這裡它在正弦分析器(SA)130中被分析,該分析器確定(確定性的)正弦分量。結果信息被包含在正弦編碼CS中。說明示例正弦編碼的產生的較詳細實例被提供於PCT專利申請No.WO00/79579-A1(代理RefPHN017502)中。可替換的是,基本實施被公開於「Speechanalysis/synthesis based on sinusoidal representation」,R.McAulay和T.Quartieri,IEEE Trans.Acoust.,Speech,SignalProcess.,43744-754,1986或「Technical description of theMPEG-4 audio-coding proposal from the University of Hannoverand Deutsche Bundespost Telekom AG(revised)」,B.Edler,H.Purnhagen和C.Ferekidis,Technical note MPEG95/0414r,Int.Organisation for Standardisation ISO/IEC JTC1/SC29/WG11,1996。
然而,簡而言之,優選實施例的正弦編碼器將輸入信號x2編碼為從一個幀段被連結到下一個幀段的正弦分量的軌跡。對於在給定段內開始(誕生)的正弦波,所述軌跡最初是由開始頻率、開始振幅和開始相位表示的。之後,該軌跡在隨後的段中由頻率差、振幅差並且可能還有相位差(延續)來表示,直到軌跡結束(死亡)的段。在實際中,可以確定在編碼相位差的過程中幾乎沒有增益。這樣,相位信息可被編碼為絕對值。可替換的是,根本不需要編碼相位信息為延續的,並且相位信息可使用連續相位重構來重新產生。
同樣,如果要使位流獨立於採樣頻率,則開始頻率在正弦編碼CS中被編碼為絕對值或表示絕對頻率的標識符以確保經編碼的信號獨立於採樣頻率。
從正弦編碼CS,正弦信號分量由正弦合成器(SS)131來重構。從輸入信號x2到正弦編碼器13,該信號在減法器17中被減,從而產生剩餘信號x3,其沒有(大的)瞬變信號分量和(主要的)確定性正弦分量。
假定剩餘信號x3主要包括噪聲,而優選實施例的噪聲分析器14產生表示該噪聲的噪聲編碼CN。如在例如被提交於2000年5月17日的PCT專利申請No.PCT/EP00/04599(代理RefPH NL000287)中,在常規上,噪聲譜是依照等效矩形帶寬(ERB)尺度藉助組合的AR(自動回歸)MA(移動平均)濾波參數(pi,qi)由噪聲編碼器來模擬的。在圖2的解碼器中,濾波參數被饋給噪聲合成器NS33,其主要是濾波器,具有近似噪聲譜的頻率響應。通過用ARMA濾波參數(pi,qi)來過濾白噪聲信號並且隨後將其加給所合成的瞬變yT和正弦波yS信號,NS33產生經重構的(合成的)噪聲yN。
然而,ARMA濾波參數(pi,qi)同樣依賴於噪聲分析器的採樣頻率,並且如果經編碼的位流要獨立於採樣頻率,則這些參數在被編碼之前被變換為線譜頻率(LSF),其亦已知為線譜對(LSP)。這些LSF參數可在絕對頻率網格或與ERB尺度或Bark尺度相關的網格上被表示。有關LSP的更多信息見「Line Spectrum Pair(LSP)and speechdata compression」,F.K.Soong and B.H.Juang,ICASSP,pp.1.10.1,1984。在任何情況下,如在解碼器中所需要的從依賴於編碼器採樣頻率的一個類型的線性預測濾波類型係數,在此情況下為(pi,qi),到獨立於採樣頻率的LSF以及反過來的這種變換是眾所周知的,並且在此不作進一步的討論。然而,將看到,在解碼器中將LSF轉換為濾波係數(p』i,q』i)可參照噪聲合成器33產生白噪聲採樣的頻率來進行,從而使解碼器能產生噪聲信號yN,而獨立於其被原始採樣的方式。
將看到,類似於正弦編碼器13中的情況,噪聲分析器14亦可使用瞬變信號分量的開始位置作為用於開始新分析塊的位置。然而,正弦分析器130和噪聲分析器14的段大小沒有必要相等。
最後,在復用器15中,音頻流AS被構成,其包括編碼CT、CS和CN。音頻流AS被提供給例如數據總線、天線系統、存儲介質等。
參考圖3,本發明的編輯器4適合於處理由例如優選實施例的編碼器1產生的一個或多個音頻流。在本發明的一個實施例中,編輯器4包括新型應用軟體,其使用戶能選擇一個或多個所存原始音頻信號中的時間上的相應瞬間或點,在這裡相應的編輯點待被插入以產生經編輯的信號。同樣,編輯器4又可包括在歐洲專利申請No.00200939.7中所述類型的解碼器2,從而允許用戶收聽原始音頻信號,並且可能甚至包括圖形部件,從而在用戶拾取編輯點之前允許圖形解碼的信號被察看。然而,儘管本發明的優選實施例是根據交互式編輯器而被描述的,但本發明並不局限於對所存音頻信號的用戶交互驅動的編輯。這樣,例如編輯器可以是在網絡設備上運行的一件守護程序軟體,音頻信號通過所述網絡設備流動。這種編輯器可適合於在進一步傳遞經編輯的信號之前在預定的點上自動切割或拼接一個或多個原始音頻信號。
在任何情況下,在知道編輯點的時間上的點的情況下,編輯器確定原始信號中的目標幀,其表示在編輯點之前開始和在編輯點之後結束的時間階段。
對於在一個或多個原始位流中確定的每個編輯點,編輯器被安排成將階梯瞬變編碼插入到經編輯的信號位流的相應目標幀中,所述階梯瞬變編碼有一個位置,表示對應於編輯點的時間上的點。
參考圖4,其說明了在經編輯的位流的幀i中所得的結束編輯點(EEP)和幀j中所得的開始編輯點(SEP)。這樣,例如在幀j及以下中被編碼的信號正在原始信號中被插入,該原始信號已在幀i內的一個段中出現的時間被拼接。作為結果,因此理想的是,僅在幀i中的瞬變位置之前和在幀j中的瞬變位置之後的內容被合成。沒有輸出會從幀中的中間採樣產生,因此在第一實施例中,如果幀i和幀j被聯結,則結果信號包括短的靜音。
編輯器為每個幀在頭部(H)放置一個指示符(被散列示出)以在瞬變位置處標記軌跡,從而使當如以下所說明的被解碼時,它們將在用於結束編輯點的瞬變位置附近漸弱或將在用於開始編輯點的該瞬變位置附近漸強。瞬變參數本身或與階梯瞬變關聯的附加參數可任選地被用於描述優選的漸強漸弱類型,即它是靜音、cos函數或其它。由解碼器來確定如何處理這樣的參數,即這是否應當為漸變,如何應用給定類型的漸強/漸弱,以及這種漸變應如何發生。解碼器可進一步支持用於該特點的不同選項。這樣,由於瞬變位置能以採樣精度解析度來限定,因此能以採樣精度來編輯音頻信號。因此將看到,表示開始和結束編輯點的瞬變限定其各自幀內的幀邊界,而表示結束編輯點之前的音頻信號的軌跡獨立於表示開始編輯點之後的音頻信號的軌跡。
圖2示出依照本發明用於解碼信號的音頻播放器3。例如由依照圖1的編碼器產生並可能由編輯器4後處理的音頻流AS』從數據總線、天線系統、存儲介質等獲得。如在歐洲專利申請No.00200939.7中所公開的,音頻流AS在去復用器30中被去復用以獲得編碼CT、CS和CN。這些編碼被分別提供給瞬變合成器31、正弦合成器32和噪聲合成器33。從瞬變編碼CT,瞬變信號分量在瞬變合成器31中被計算。在瞬變編碼表示形狀函數的情況下,基於所接收的參數來計算形狀。此外,基於正弦分量的頻率和振幅來計算形狀內容。總的瞬變信號yT是所有瞬變的和。
如果使用了自適應成幀,則從瞬變位置,用於正弦合成SS32和噪聲合成NS33的分段被計算。正弦編碼CS被用於產生信號yS,其被描述為給定段上的正弦波的和。噪聲編碼CN被用於產生噪聲信號yN。為此,用於幀段的線譜頻率首先被變換為ARMA濾波參數(p』i,q』i),其專用於噪聲合成器產生白噪聲的採樣頻率,並且這些被與白噪聲值組合以產生音頻信號的噪聲分量。在任何情況下,通過例如重疊添加方法來添加最後的幀段。
總信號y(t)包括瞬變信號yT和任何振幅解壓縮(g)的乘積的和,以及這些信號yS和噪聲信號yN的和。音頻播放器包括兩個加法器36和37以對相應的信號進行求和。總信號被提供給輸出單元35,其例如是揚聲器。
如在相關申請中所公開的,如果瞬變編碼CT表示階梯(step),則沒有瞬變被計算。然而,優選實施例的音頻播放器包括幀頭部解碼器38。解碼器38被安排成在幀頭部中檢測幀段之一是否包括開始編輯點或結束編輯點之一。如果如在圖4的幀i中頭部指示結束編輯點(EEP),則解碼器向瞬變、正弦和噪聲合成器31、32和33的每個發送信號通知,它們的輸出在對應於階梯瞬變的位置時間或採樣數之後應被設置為零,可任選地採用漸弱間隔。
如果如在圖4的幀j中頭部(H)指示開始編輯點(SEP),則解碼器向瞬變、正弦和噪聲合成器31、32和33的每個發送信號通知,它們的輸出在對應於階梯瞬變的位置時間或採樣數之前應被設置為零,可任選地採用漸弱間隔。這在正弦合成器的情況下是特別有利的,這是因為從軌跡的誕生經過其延續,它可連續從幀的開始將軌跡合成為正常、規劃的頻率、振幅和相位信息而不是簡單地將其輸出設置為零,直到階梯瞬變的位置。此時,它然後開始輸出其計算值,其一些可以是在階梯瞬變之前開始的原始信號的延續。這樣,當包含諸如圖4中所示的幀的音頻信號被解碼時,其導致從結束編輯點到開始編輯點的時間運行的短靜音。
如果感覺這是個問題,則播放器3可被用於以在任何音頻信號中的總的可能靜音長度的最大值來高速緩存所進入的音頻流。如果需要,這將允許播放器在解碼音頻流時在前讀取,從而使如果檢測到結束編輯點,則它可跳過一直到幀結束,通過下一幀計算軌跡值直到開始編輯點,並且緊接著在開始編輯點的信號之後開始輸出被聯結的經合成的信號,任選地應用適當的跨接漸變(cross-over fade)。
在另一個可替換的解決方案中,可能不能理想地看到需要計算正弦軌跡值直到包括諸如幀j的幀的開始編輯點的段。在此情況下,對於與開始編輯點相同的段中的延續軌跡,編輯器可被安排成計算用於這種軌跡的絕對頻率、振幅和相位,由此將位流中的延續軌跡編碼替換成誕生軌跡編碼。然後,用於幀的先前段中的軌跡的任何延續或誕生編碼可被去除或歸零,從而在位速率要求和音頻播放器處理上略為節省。
在任何情況下將看到,原則上任何編碼方案的語法可被擴展以提供上述的採樣精度編輯的靈活性。
此外,依照實施本發明的過程中的環境,上述優選實施例的許多變化是可能的。因此,例如,如果要廣泛地編輯信號,將看到對所存信號的重複更新以包括編輯點瞬變信息可能需要在處理位流中所包含的大量數據方面的相當資源。在優選的編輯器中,每次編輯點被確定時位流不被修改,相反,與正被編輯的位流關聯的編輯器維持一列編輯點。一旦用戶已完成對信號的編輯,依照所述列的編輯點來插入瞬變並且經編輯的位流被一次寫給存儲。
在另一個變化中,通過限定單個或成對的編輯點瞬變,可避免使用限定瞬變的單獨參數和指示該瞬變是編輯點的指示符,所述編輯點瞬變在整體上既包括限定在時間上的瞬間處的瞬變的參數,也指示該參數是編輯點或具體而言是開始或結束編輯點。在使用單一類型的這種編輯點瞬變的情況下,這些瞬變可被配對以使當解碼器檢測到第一所述瞬變時,其在該點之後產生零位信號,並且一旦檢測到所述對中的第二所述瞬變,才開始輸出信號。
在這兩種情況下並且在優選實施例中,將理解所述解碼器可被編程以假定在結束編輯點或第一編輯點之後的幀應包括開始編輯點。這樣,如果信號被破壞,或檢測器未在結束編輯點之後的幀中檢測到開始編輯點,則其可從下一幀的開始處開始輸出信號,從而使破壞導致的損壞最小。
圖3示出依照本發明的音頻系統,包括如圖1中所示的音頻編碼器1、如圖2中所示的音頻播放器3和如以上所述的編輯器。這樣的系統提供了編輯、播放和記錄特徵。音頻流AS在通信通道2上從音頻編碼器被提供給音頻播放器或編輯器,所述通信通道可以是無線連接、數據總線或存儲介質。在通信通道2是存儲介質的情況下,存儲介質可被固定於系統中或亦可以是可移動盤、固態存儲設備,如來自SonyCorporation等的Memory StickTM等。通信通道2可以是音頻系統的一部分,但常常將在音頻系統外。
可以看出,本發明可被實施於專用的硬體中,在DSP(數位訊號處理器)上或通用計算機上運行的軟體中。本發明可被實施於諸如CD-ROM或DVD-ROM的有形介質中,其承載用於執行依照本發明的編碼方法的電腦程式。本發明亦可被實施為在諸如網際網路的數據網絡上發送的信號或通過廣播服務發送的信號。
本發明在諸如固態音頻、網際網路音頻發行或任何壓縮音樂發行的領域中找到應用。亦將看到,本發明的操作亦可兼容於在提交於2001年4月18日的歐洲專利申請No.01201405.6(代理人RefPHNL010251)中描述的可兼容加擾(scrambling)方案。
應指出,上述實施例說明了而不是局限了本發明,並且本領域的技術人員將能在所附權利要求的範圍內設計許多可替換的實施例。在權利要求中,被置於括弧之間的任何參考符號不應被理解為限制本發明。單詞「包括」不排除除了權利要求中所列的以外的元件或步驟的存在。本發明可藉助包括幾個獨特元件的硬體並藉助適當編程的計算機來實施。在列舉幾個裝置的設備權利要求中,這些裝置的幾個可由硬體的一個或相同項來實施。在相互不同的獨立權利要求中細述特定措施的僅有事實不表示這些措施的組合不能被用於優點。
總之,在正弦編碼被公開的情況下,本發明的優選實施例提供了一種以用於編輯的高子幀精度來編輯相對長的幀的方法。為提供用於高精度編輯的這種方法,所謂的瞬變位置可被應用於在先前編碼的信號(AS)中需要編輯點(EEP、SEP)的地方。通過例如音頻編輯應用,作為某種後處理而進行添加。使用瞬變位置作為編輯點的優點是信號然後能以原則上採樣解析度精度被突然結束或開始於瞬變位置,而在現有技術系統中,人們被局限於幀邊界,其例如每100ms出現一次。
權利要求
1.一種編輯(4)由經編碼的音頻流(AS)表示的原始音頻信號(x)的方法,所述經編碼的音頻流包括多個幀,每個所述幀都包括頭部(H)和一個或多個段(S),每個段都包括表示所述原始音頻信號(x)的參數(CT、CS、CN),該方法包括步驟確定所述原始音頻信號(x)中對應於時間上的瞬間的編輯點;在表示含有所述時間上的瞬間的時間階段的所述原始音頻信號(x)的目標幀(i,j)中插入表示所述時間上的瞬間處的瞬變(EEP、SEP)的參數和所述參數表示編輯點的指示符;以及產生表示經編輯的音頻信號並包括所述目標幀的經編碼的音頻流(AS)。
2.權利要求1的方法,其中所述指示符包括開始編輯點或結束編輯點之一。
3.權利要求1的方法,其中所述插入步驟包括在所述目標幀的段中插入所述參數並在所述目標幀的頭部中插入所述指示符。
4.權利要求1的方法,其中表示所述瞬變的所述參數指示所述經編輯的音頻信號中的振幅的階梯形變化。
5.權利要求1的方法,其中表示所述原始音頻信號(x)的所述參數包括用於濾波器的濾波參數(CN),該濾波器具有與表示音頻信號的噪聲分量的噪聲分量的目標譜近似的頻率響應。
6.權利要求1的方法,其中表示所述原始音頻信號(x)的所述參數包括參數(CN),其獨立於被用於產生所述經編碼的音頻流的第一採樣頻率,所述參數從用於濾波器的濾波參數(pi,qi)得出,該濾波器具有近似於表示音頻信號的噪聲分量的噪聲分量的目標譜的頻率響應。
7.權利要求6的方法,其中所述濾波參數是自動回歸(pi)和移動平均(qi)參數,並且所述獨立的參數表示線譜頻率。
8.權利要求7的方法,其中所述獨立的參數以ERB尺度或Bark尺度或絕對頻率之一來表示。
9.權利要求1的方法,其中表示所述原始音頻信號(x)的所述參數包括參數(CT),其表示音頻信號中瞬變信號分量的相應位置;所述參數限定具有形狀參數和位置參數的形狀函數。
10.權利要求9的方法,其中所述位置參數表示所述原始音頻信號(x)中所述瞬變信號分量的絕對時間位置。
11.權利要求1的方法,其中表示所述原始音頻信號(x)的所述參數包括參數(CS),其表示音頻信號中的持續的信號分量,所述參數包括表示在隨後的信號段中存在的被連結的信號分量的軌跡以及在先前被連結的信號分量的基礎上延伸軌跡。
12.權利要求11的方法,其中用於軌跡中第一信號分量的參數包括表示所述信號分量的絕對頻率的參數。
13.權利要求1的方法,其中所述經編輯的位流包括待由解碼器使用的推薦最小帶寬。
14.解碼(3)音頻流的方法,該方法包括步驟讀取表示經編輯的音頻信號(x)的經編碼的音頻流(AS』),所述流包括多個幀,每個所述幀都包括頭部(H)和一個或多個段(S),每個段都包括表示所述經編輯的音頻信號(x)的參數(CT、CS、CN);以及響應於表示給定時間階段的所述經編輯的音頻信號(x)的、包括表示所述時間階段內時間上的瞬間處的瞬變的參數和所述參數表示編輯點的指示符的幀,對所述時間階段的一部分產生零輸出,並採用(31、32、33)所述參數表示從而對所述時間階段的剩餘部分合成所述音頻信號,所述部分在時間上的瞬間被劃分。
15.權利要求14的方法,其中所述產生步驟響應於表示所述編輯點是結束編輯點的所述指示符,對所述時間上的瞬間之後的所述時間階段的部分產生零輸出,並且採用(31、32、33)所述參數表示從而對所述時間上的瞬間之前的所述時間階段的部分合成所述音頻信號。
16.權利要求15的方法,其中所述產生步驟是響應於所述結束編輯點,在時間上的所述瞬間附近使所述信號漸弱。
17.權利要求14的方法,其中所述產生步驟響應於表示所述編輯點是開始編輯點的所述指示符,對時間上的所述瞬間之前的所述時間階段的部分產生零輸出,並且採用(31、32、33)所述參數表示從而對時間上的所述瞬間之後的所述時間階段的部分合成所述音頻信號。
18.權利要求17的方法,其中所述產生步驟響應於所述開始編輯點,在時間上的所述瞬間附近使所述信號漸強。
19.權利要求14的方法,其中所述產生步驟包括產生所述零輸出作為靜音信號。
20.權利要求14的方法,其中所述產生步驟包括聯結在一對編輯點的第一編輯點處結束的音頻信號與在所述對的編輯點的第二編輯點處開始的音頻信號。
21.權利要求20的方法,其中所述聯結步驟包括在所述第一編輯點處結束的音頻信號與在第二編輯點處開始的音頻信號的跨接漸變。
22.用於編輯(4)由經編碼的音頻流(AS)表示的原始音頻信號(x)的音頻編輯器,所述經編碼的音頻流包括多個幀,每個所述幀都包括頭部(H)和一個或多個段(S),每個段都包括表示所述原始音頻信號(x)的參數(CT、CS、CN),所述編輯器包括裝置,用於確定所述原始音頻信號(x)中對應於時間上的瞬間的編輯點;裝置,用於在表示含有所述時間上的瞬間的時間階段的所述原始音頻信號(x)的目標幀(i,j)中插入表示所述時間上的瞬間處的瞬變(EEP、SEP)的參數和所述參數表示編輯點的指示符;以及裝置,用於產生表示經編輯的音頻信號並包括所述目標幀的經編碼的音頻流(AS)。
23.音頻播放器(3),包括裝置,用於讀取表示經編輯的音頻信號(x)的經編碼的音頻流(AS』)的子幀,所述流包括多個幀,每個所述幀都包括頭部(H)和一個或多個段(S),每個段都包括表示所述經編輯的音頻信號(x)的參數(CT、CS、CN);以及裝置,響應於表示給定時間階段的所述經編輯的音頻信號(x)的、包括表示所述時間階段內時間上的瞬間處的瞬變的參數和所述參數表示編輯點的指示符的幀,用於對所述時間階段的一部分產生零輸出,並採用(31、32、33)所述參數表示從而對所述時間階段的剩餘部分合成所述音頻信號,所述部分在時間上的瞬間被劃分。
24.音頻系統,包括權利要求22的音頻編輯器(4)和權利要求23的音頻播放器(3)。
25.表示經編輯的的音頻信號(x)的音頻流(AS),包括多個幀,每個所述幀都包括頭部(H)和一個或多個段(S),每個段都包括表示所述經編輯的音頻信號(x)的參數(CT、CS、CN);並且一個或多個所述幀包括表示所述時間階段內時間上的瞬間處的瞬變的相應參數和所述參數表示編輯點的指示符。
26.存儲介質,其上已存儲了權利要求25的音頻流(AS)。
全文摘要
公開了一種以高子幀精度編輯(4)相對長的幀以便於在正弦編碼的情況下進行編輯的方法。為了提供這種用於高精度編輯的方法,所謂的瞬變位置可被應用於先前所編碼的信號(AS)中需要編輯點(EEP、SEP)的地方。通過例如音頻編輯應用,作為某種後處理而進行添加。使用瞬變位置作為編輯點的優點是信號可由此在原則上以採樣解析度精度在瞬變位置處突然結束或開始,而在現有技術系統中,人們被局限於幀邊界,其例如每100ms出現一次。
文檔編號G10L19/02GK1514997SQ02811448
公開日2004年7月21日 申請日期2002年6月5日 優先權日2001年6月8日
發明者A·W·J·奧門, A W J 奧門, L·M·范德科克霍夫, 範德科克霍夫 申請人:皇家菲利浦電子有限公司