用於編排及播放一多媒體串流的裝置及方法
2023-09-20 01:10:15 2
專利名稱:用於編排及播放一多媒體串流的裝置及方法
技術領域:
本發明是關於一種用於編排及播放一多媒體串流的裝置及方法。更具體而言,本發明藉由使影像串流(video stream)與音頻串流(audio stream)相互交錯而編排該多媒體串流,並播放經編排的多媒體串流。
背景技術:
由於通訊及多媒體技術的迅速發展,所創建的多媒體檔日趨增多。此外,人們不僅可於傳統電腦上、且亦可於移動裝置上觀看多媒體串流。一多媒體串流通常同時包含一影像串流與一音頻串流。當一裝置播放(或存取)多媒體串流時,為得到最佳的效能,需要使影像串流與音頻串流同步。
圖1例示一用於儲存一多媒體串流的先前技術檔案結構11。檔案結構11包含一第一部分111及一第二部分112,其中第一部分111具有區塊0至區塊n,第二部分112則具有區塊n+1至區塊m。各該區塊可為一扇區或一使用者自定義(user-defined)儲存單元。第一部分111儲存該多媒體串流的一影像串流,而第二部分112儲存該多媒體串流的一音頻串流。該影像串流與該音頻串流分別儲存於檔案結構11中,這是因為二者為實質不同種類的多媒體,因而具有不同的編碼及解碼方法。因影像串流與音頻串流是分別儲存,故試圖存取該二串流的裝置必須具有二存取指針(accessing pointer),即一影像存取指針121及一音頻存取指針122。
檔案結構11及相應存取方法存在某些缺點。第一缺點是效能大幅降低。當一裝置播放著儲存於如圖1所示檔案結構11中的多媒體串流時,其需要能夠隨機地存取此些串流,以使影像串流與音頻串流二者同步。然而,隨機存取會消耗裝置的大量資源。若裝置為資源有限的移動/可攜式裝置,則其可能無法流暢地播放多媒體檔案。更有甚者,於播放多媒體檔案期間,移動/可攜式裝置可能無法處理其他功能。
另一缺點在於,為了於影像串流與音頻串流間達成同步,除一額外定時器或計數器外,尚需要一巨大的緩衝器。現今存在二種使影像串流與音頻串流達成同步的主要方法,第一種方法是針對影像串流與音頻串流使用二獨立的觸發器機構(trigger mechanism),其中此些觸發器機構相依於裝置的系統時脈。影像串流的觸發器機構是於每一預定時間間隔觸發影像串流的一部分,而音頻串流的觸發器機構則以其預定時間間隔觸發音頻串流的一部分;第二種方法是因應音頻串流的每一部分而觸發影像串流的一部分,其中音頻串流的該部分包含不止一個音頻採樣。現提供一更具體的實例,其中以N表示影像串流的影像畫面速率(video frame rate)並以M表示音頻串流的音頻採樣頻率(audiosampling rate)。於一秒鐘內存在N個影像畫面及M個音頻採樣意味著一個影像畫面對應M/N個音頻採樣。於一實例中,影像串流的一部分為一個影像畫面,而音頻串流的一部分包含M/N個音頻採樣。第二種方法是因應音頻串流的每一部分(即M/N個音頻採樣)而觸發影像串流的一部分(即一個影像畫面)。觸發之前,該二方法皆須完全解碼影像畫面及音頻框,並將其儲存於緩衝器中,以便該裝置可流暢地播放。
根據上文說明可知,利用傳統檔案結構儲存多媒體串流存在某些缺點。當一資源有限的裝置試圖播放一多媒體檔案時,此些缺點變得愈發明顯。因此,仍非常需要提供一種用於儲存一多媒體檔案的新結構以及一種用於編排該多媒體檔案的所儲存影像及音頻部分的相應方法。
發明內容
本發明的一目的是提供一種用於編排一多媒體串流的方法。該多媒體串流包含一影像串流及一音頻串流。該方法包含下列步驟(a)寫入該影像串流的一第一部分;(b)寫入該音頻串流的一第一部分,其對應於該影像串流的該第一部分;(c)於步驟(a)及步驟(b)後,寫入該影像串流的一次一部分;以及(d)於步驟(a)及步驟(b)後,寫入該音頻串流的一次一部分,其對應於該影像串流的該次一部分。
本發明的另一目的是提供一種用於編排一多媒體串流的裝置。該多媒體串流包含一影像串流及一音頻串流。該裝置包含一處理器。該處理器適以寫入該影像串流的一第一部分;寫入該音頻串流的一第一部分,其對應該影像串流的該第一部分;於該影像串流的該第一部分及該音頻串流的該第一部分寫入後,寫入該影像串流的一次一部分;以及於該影像串流的該第一部分及該音頻串流的該第一部分寫入後,寫入該音頻串流的一次一部分,其對應該影像串流的該次一部分。
本發明的再一目的是提供一種用於播放一多媒體串流的方法。該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、以及一次一音頻部分。該第一影像部分及該第一音頻部分較該次一影像部分及該次一音頻部分先到達。該方法包含下列步驟(a)解碼該第一影像部分,以取得一第一解碼影像部分;(b)解碼該第一音頻部分,以取得一第一解碼音頻部分;(c)播放該第一解碼影像部分及該第一解碼音頻部分;(d)於步驟(a)及步驟(b)後,解碼該次一影像部分以取得一次一解碼影像部分;(e)於步驟(a)及步驟(b)後,解碼該次一音頻部分以取得一次一解碼音頻部分;以及(f)於步驟(c)後,播放該次一解碼影像部分及該次一解碼音頻部分。
本發明的又一目的是提供一種用於播放一多媒體串流的裝置。該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、以及一次一音頻部分。該第一影像部分及該第一音頻部分較該次一影像部分及該次一音頻部分先到達。該裝置包含一處理器。該處理器適以播放該第一影像部分及該第一音頻部分,以及於播放該第一影像部分及該第一音頻部分後,播放該次一影像部分及該次一音頻部分。該裝置可更包含一緩衝器,用於暫時儲存該第一音頻部分及該次一音頻部分,其中該緩衝器的一容量小於該第一影像部分的一容量及該次一影像部分的一容量。
對於同時包含一影像串流與一音頻串流的一多媒體串流,本發明根據下列準則來編排該影像串流的各部分及該音頻串流的各部分此些影像及音頻串流的前一部分較此些影像及音頻串流的次一部分先到達。換言之,於編排後,此些影像及音頻串流中對應於前一時間間隔的部分較此些影像及音頻串流中對應於一次一時間間隔的部分先到達。由於本發明根據該概念編排多媒體串流;因此,一試圖播放所編排多媒體串流的裝置可按該次序播放之,而無需配備緩衝器、計數器或定時器。此意味著該裝置可於解碼影像串流的一部分及音頻框的一部分之後立即輸出之,即無需緩衝解碼結果或者僅緩衝解碼結果的一小部分。該特徵尤其適用於資源有限的可攜式裝置。
為讓本發明的上述目的、特徵和優點能更明顯易懂,以下結合附圖對本發明的具體實施方式
作詳細說明,其中 圖1例示一用於儲存一多媒體串流的先前技術檔案結構; 圖2例示本發明的一第一實施例; 圖3例示第一實施例的檔案的一檔案結構; 圖4例示畫面速率與採樣頻率的間關係的一實例; 圖5例示本發明的一第二實施例; 圖6A例示本發明一第三實施例的流程圖的一部分; 圖6B例示第三實施例的流程圖的另一部分;以及 圖7例示本發明一第四實施例的一流程圖。
主要元件符號說明 2裝置5裝置 11先前技術檔案結構 21介面 22處理器 23緩衝器 31檔案結構 50多媒體串流 51處理器 52緩衝器 111第一部分 112第二部分 121影像存取指針 122音頻存取指針 201多媒體串流202影像串流 203音頻串流 310標頭 311影像串流的第一部分312音頻串流的第一部分 313影像串流的次一部分314音頻串流的次一部分
具體實施例方式 本發明的目的是提供一種藉由使一多媒體串流的一影像串流與一音頻串流相互交錯而編排該多媒體串流的裝置及方法。此外,亦提供用於播放所編排多媒體串流的相應裝置及方法。
圖2例示本發明的一第一實施例,其為一種用於編排一多媒體串流201的裝置2。裝置2包含一處理器22,且與一介面21及一緩衝器23配合運作。於其他實施例中,介面21及緩衝器23亦可配置於裝置2內。
介面21接收多媒體串流201,其中多媒體串流201包含一影像串流202及一音頻串流203。圖3例示多媒體串流201的一檔案結構31。於介面21接收到多媒體串流201後,處理器22寫入多媒體串流201的一標頭310至該檔案中,然後寫入影像串流202的一第一部分311至該檔案中,並接著寫入音頻串流203的一第一部分312至該檔案中,該第一部分312系對應於影像串流202的第一部分311。於影像串流202的第一部分311及音頻串流203的第一部分312寫入檔案中之後,處理器22寫入影像串流202的一次一部分313及音頻串流203的一次一部分314至該檔案中,其中音頻串流203的次一部分314系對應於影像串流202的次一部分313。對第一部分311、312及次一部分313、314的確定將於下文予以闡釋。若影像串流202及音頻串流203仍存在某些尚未寫入的部分,處理器22將繼續將影像串流202及音頻串流203交錯編排於該檔案中。於上述過程中,緩衝器23可於音頻串流203的第一部分312及次一部分314被寫入該檔案之前,暫時儲存該第一部分312及次一部分314。應注意,處理器22可將上述第一部分311、312及次一部分313、314寫入另一多媒體串流中以供直接傳送。
根據圖3所示檔案結構31可以理解,處理器22藉由交錯編排影像串流202與音頻串流203而將多媒體串流201寫入該檔案中。根據檔案結構31,標頭310可佔據用於儲存該檔案的一儲存器的區塊0,影像串流202的第一部分311可佔據用於儲存該檔案的儲存器的區塊1及2,音頻串流203的第一部分312可佔據用於儲存該檔案的儲存器的區塊3,影像串流202的次一部分313可佔據用於儲存該檔案的儲存器的區塊4及5,且音頻串流203的次一部分314可佔據用於儲存該檔案的儲存器的區塊6。
處理器22於寫入多媒體串流201至該檔案前,決定影像串流202的一畫面速率以及音頻串流203的一採樣頻率。於該實施例中,假定畫面速率是每秒呈現N個畫面,採樣頻率是每秒進行M個採樣。然後,處理器22根據畫面速率N將影像串流202編碼為多個影像畫面,並根據採樣頻率M將音頻串流203編碼為多個音頻採樣。於某些情形中,一多媒體串流201的一影像串流202及一音頻串流203可能早已編碼為影像畫面及音頻採樣。於這些情形中,處理器22無需執行決定及編碼,而是僅需根據影像串流202及音頻串流203來決定畫面速率及採樣頻率。
在下文中將闡釋如何決定第一部分311、312及次一部分313、314。於該實施例中,影像串流202的各該第一部分311及次一部分313皆包含此些影像畫面其中之一。類似地,音頻串流203的各該第一部分312及次一部分314皆包含一音頻採樣計算數目。於其他實施例中,影像串流202的第一部分311與次一部分313二者可分別僅包含一個影像畫面的一部分,例如一切面(slice)、一巨集區塊(macro-block)、一列巨集區塊等等,其中音頻串流203的第一部分312及次一部分314隨的包含對應部分。
第一部分311、312及次一部分313、314是根據畫面速率N及採樣頻率M加以決定。該實施例能夠處理M與N的各種組合以及其他狀況,例如(1)M為N的倍數,(2)M不為N的倍數,以及(3)一音頻框中音頻採樣的數量為固定。
首先,闡述當M為N的倍數時對第一部分311、312及次一部分313、314的確定。變數M及N表示於一秒內應存在N個影像畫面及M個音頻採樣。亦即,每1/N秒應存在一個畫面及M/N個音頻採樣,如圖4所示。於圖4中,橫軸表示時間(單位秒),每一V0,V1,V2,...,及VN-1表示影像串流的一影像畫面,每一A0,A1,A2,...,及AN-1則表示音頻串流203的一音頻框。此外,各該Ai包含M/N個音頻採樣。例如,音頻框A0包含音頻採樣a0,0,a0,1,...,及a0,M/N-1。於該實施例中,影像串流202的第一部分311被確定為第一影像畫面V0,音頻串流203的第一部分312被確定為第一音頻框A0(即前M/N個音頻採樣a0,0,a0,1,...,及a0,M/N-1),影像串流202的次一部分313被確定為次一影像畫面V1,且音頻串流203的次一部分314被確定為音頻框A1,等等。根據上述說明,影像串流202的第一部分311及音頻串流203的第一部分312對應於第一區段時間(即前1/N秒)。類似地,影像串流202的次一部分313及音頻串流203的次一部分314對應於次一區段時間(即次一1/N秒)。
此處提供一具體實例。考量以下情形音頻採樣頻率為44100Hz(即M=44100)且畫面速率為每秒15個畫面(N=15),由此計算出每秒有44100個音頻採樣及15個影像畫面。亦即,每1/15秒存在44100/15=2940個音頻採樣及一個影像畫面。因此,該實施例將一影像畫面寫入該檔案中,並接著將一音頻框(即2940個音頻採樣)寫入該檔案中,依此類推。
第二,闡述當M不為N的倍數(即M/N不為整數)時,如何決定第一部分311、312及次一部分313、314。若M/N不為整數,則音頻採樣包含至少
個音頻採樣。於相除之後,將殘餘音頻採樣分配至音頻框中。影像串流202的第一部分311被確定為第一影像畫面,音頻串流203的第一部分312被確定為第一音頻框,影像串流202的次一部分313被確定為次一影像畫面,音頻串流203的次一部分314被確定為次一音頻框,等等。更具體而言,處理器22採用下列規則 若{M%N==0},則否則,最後,闡述當一音頻框內的音頻採樣數目應固定時,如何決定第一部分311、312及次一部分313、314。其一實例為MP3規格,其需要於一個音頻框內具有1152個音頻採樣。假定於一音頻框內所需音頻採樣的數目為L。處理器22首先判斷音頻採樣數目是否為L的倍數。若不是,則處理器22填充若干額外音頻採樣至此些音頻採樣,直到所得音頻採樣數目為L的倍數。然後,處理器22確定影像串流202的第一部分311為第一影像畫面。處理器22確定音頻串流203的第一部分312包含至少一個音頻框,其中對應於第一部分312內所包含音頻採樣的一第一時間長度大到足以覆蓋另一影像畫面的起始邊界。然後,處理器22確定影像串流202的次一部分313為次一影像畫面。此後,處理器22確定音頻串流203的次一部分314包含至少一音頻框,其中對應於次一部分314中所包含音頻採樣的一第二時間長度大到足以覆蓋另一影像畫面的起始邊界。更具體而言,處理器22採用下列規則 若則 否則,
其中k為音頻框的索引,且
表示自第0個至第k個音頻框的累積音頻採樣數目。
現提供一如下情形的具體實例每一音頻框的長度為固定,其中M=44100,N=15且L=1152。因M/N=2940,故理想情況下應每2940個音頻採樣出現一影像畫面。亦即,系統2應每2940個採樣脈衝出現一影像畫面。為方便起見,將處理器22所確定的影像畫面及音頻框的順序列於表1中。根據上述規則,處理器22確定影像串流202的第一部分311為第一影像畫面V0。處理器22確定音頻串流203的第一部分312為三個音頻框A0、A1及A2,其中各該音頻框具有1152個音頻採樣。於音頻框A2之後,對應於所寫入音頻採樣(即第一部分312)的第一時間長度大到足以覆蓋另一影像畫面的起始邊界,亦即第一部分312的採樣脈衝(即1152×3=3456)大到足以覆蓋出現於第2940個採樣脈衝處的次一影像畫面V1的起始邊界。然後,處理器22確定影像串流202的次一部分313為次一影像畫面V1。此後,處理器22確定音頻串流203的次一部分314為三個音頻框A3、A4及A5。類似地,於音頻框A2之後,對應於所寫入音頻採樣(即第一部分312及次一部分314)的第二時間長度(3456+1152×3=6912)大到足以覆蓋出現於第5880個採樣脈衝處的另一影像畫面的起始邊界。接著,確定影像串流202的次一部分為次一影像畫面V1。此時,處理器22確定音頻串流203的次一部分314為二音頻框A6及A7。此乃因一第三時間長度(3456+3456+1152×2=9216)大到足以覆蓋出現於第8820個採樣脈衝處的另一影像畫面的起始邊界。該多媒體串流201的其餘部分依此類推得到處理。
表1 上文已論述了於三種情形中(基於M、N、以及一音頻框的所需長度),如何決定第一部分311、312、次一部分313、314等等。於寫入多媒體串流201至檔案的過程中,處理器22實際根據音頻採樣的時間次序逐一寫入各音頻採樣至該檔案。更具體而言,處理器22寫入影像串流202的第一部分311至該檔案。然後,處理器22將未寫入的音頻採樣逐一寫入至該檔案,計算已寫入音頻採樣的一累積數目,並重複此些未寫入音頻採樣的寫入以及累積數目的計算,直至累積數目等於一第一所需數目且對應於已寫入音頻採樣的一第一時間長度大於或等於一第一所需時間長度。藉此,寫入音頻串流203的第一部分312至該檔案。接著,處理器22寫入影像串流202的次一部分313至該檔案。隨後,處理器22將未寫入的音頻採樣逐一寫入至該檔案,計算已寫入音頻採樣的累積數目,並重複此些未寫入音頻採樣的寫入以及累積數目的計算,直至累積數目等於一第二所需數目且對應於已寫入音頻採樣的一第二時間長度大於或等於一第二所需時間長度。視M、N及L而定,第一所需數目、第二所需數目、第一時間長度、及第二時間長度有所不同。
此外,於寫入第一部分311、313及第二部分312、314之後,處理器22將重複地寫入一次一影像畫面及一音頻框,直至整個多媒體串流201皆已得到編排為止。
於某些其他情形中,裝置2可於影像串流202的第一部分311之前寫入音頻串流203的第一部分314,或者於影像串流202的次一部分之前寫入音頻串流203的次一部分314。對裝置2的唯一要求是不時地交錯編排影像串流202與音頻串流203。因影像串流202與音頻串流203是交錯編排,故當一裝置試圖播放該多媒體串流201時,僅需一個存取指針,即一音頻/影像指針。
圖5例示本發明的一第二實施例,為一種用於播放一多媒體串流50的裝置5。多媒體串流50已於第一實施例中由裝置2加以編排。更具體而言,多媒體串流50包含一第一影像部分、一次一影像部分、一第一音頻部分、以及一次一音頻部分,其中於多媒體串流50中,該第一影像部分及該第一音頻部分較該次一影像部分及該次一音頻部分先到達。該影像串流的第一部分及次一部分分別為一已編碼微區塊、一已編碼巨集區塊、一已編碼巨集區塊列、一已編碼切片、以及一已編碼碼框其中之一。該第一音頻部分及該次一音頻部分分別包含多個已編碼音頻採樣。
裝置5包含一處理器51及一緩衝器52,其中該緩衝器52的一容量小於該第一影像部分的一容量及該次一影像部分的一容量。處理器51解碼該第一影像部分以得到一第一解碼影像部分,解碼該第一音頻部分以得到一第一解碼音頻部分,並播放該第一解碼影像部分及該第一解碼音頻部分。此後,處理器51解碼該第二影像部分以得到一第二解碼影像部分,解碼該第二音頻部分以得到一第二解碼音頻部分,並播放該第二解碼影像部分及該第二解碼音頻部分。
當解碼第一解碼影像部分時,利用該緩衝器52暫時儲存該第一解碼音頻部分的一部分。更具體而言,該第一音頻部分包含若干已編碼音頻採樣,而該第一影像部分包含一個已編碼影像畫面。當此些音頻採樣其中之一(第一音頻部分的一部分)已被解碼為一音頻採樣時,該影像畫面尚未得到解碼。因此,可將已解碼的音頻採樣儲存於緩衝器52中。類似地,當播放第二解碼影像部分時,利用該緩衝器52暫時儲存第二解碼音頻部分。
裝置5可重複地解碼及播放該多媒體串流50,直到整個多媒體串流50皆已得到解碼及播放。
藉由第一及第二實施例的配置,可按照時間次序編排多媒體串流,並可由資源有限的裝置播放所編排的多媒體串流。
圖6A及6B例示本發明一第三實施例的一流程圖。該多媒體串流同時包含一影像串流與一音頻串流。首先,該方法執行步驟601,以決定該影像串流的一畫面速率。然後,該方法執行步驟602,以決定該音頻串流的一採樣頻率。
於決定畫面速率及採樣頻率後,該方法執行步驟603及604,以分別根據該畫面速率將該影像串流編碼為多個影像畫面以及根據該採樣頻率將該音頻串流編碼為多個音頻採樣。爾後,該方法執行步驟605,以寫入該影像串流的一第一部分至該檔案。此後,該方法執行步驟606、607、608,以寫入該音頻串流的一第一部分至該檔案,其中該音頻串流的第一部分對應於該影像串流的第一部分。更具體而言,步驟606按照時間次序將此些未寫入音頻採樣其中之一寫入該檔案,而步驟607是計算已寫入音頻採樣的累積數目。步驟608判斷該累積數目是否等於一第一所需數目以及對應於已寫入音頻採樣的一第一時間長度是否大於或等於一第一所需時間長度。若結果為否,則該方法返回步驟606。若結果為是,則該方法進行至步驟609,以寫入該影像串流的一次一部分。接著,該方法執行步驟610、611、612,以寫入該音頻串流的一次一部分至該檔案,其中該音頻串流的次一部分對應於該影像串流的次一部分。更具體而言,步驟610按照時間次序寫入此些未寫入音頻採樣其中之一至該檔案,而步驟611是計算已寫入音頻採樣的累積數目。步驟612判斷該累積數目是否等於一第二所需數目且對應於已寫入音頻採樣的一第二時間長度是否大於或等於一第二所需時間長度。若結果為否,則該方法返回步驟610。而若結果為是,則該方法繼續進行至步驟613,以判斷是否整個多媒體串流皆已得到編排。若結果為否,則返回步驟609。而若結果為是,則執行步驟614,以結束整個過程。
除上述步驟外,該實施例更可執行在第一實施例中所述的操作及方法。
圖7例示本發明第四實施例的一流程圖,該第四實施例為一種用於播放一多媒體串流的方法。該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、及一次一音頻部分。於該多媒體串流中,該第一影像部分及該第一音頻部分較該次一影像部分及該次一音頻部分先到達。
首先,執行步驟701,解碼該第一影像部分以得到一第一解碼影像部分,並解碼該第一音頻部分以得到一第一解碼音頻部分。於步驟701之後,執行步驟702,以播放該第一解碼影像部分及該第一解碼音頻部分。然後,執行步驟703,解碼該次一影像部分以得到一次一解碼影像部分,並解碼該第二音頻部分以得到一第二解碼音頻部分。此後,執行步驟704,以播放該次一解碼影像部分及該次一解碼音頻部分。然後,執行步驟705,以判斷是否整個多媒體串流皆已得到播放。若結果為否,則再次執行步驟703。而若結果為是,則執行步驟706以結束該方法。
除上述步驟外,該實施例更可執行在第二實施例中所述的操作及方法。
上述方法可由一電腦程式執行。換言之,任何筆記本電腦、基站及網關(gateway)皆可單獨安裝恰當的電腦程式,該電腦程式具有用以執行上述方法的代碼。該電腦程式可儲存於一電腦可讀取記錄媒體中。該電腦可讀取記錄媒體可為一軟式磁碟片、一硬碟、一光碟、一快閃記憶體盤(flash disk)、一磁帶、一可自一網絡存取的資料庫、或者熟習此項技術者可輕易思及的具有相同功能的一儲存媒體。
根據上文說明,本發明以某種次序交錯編排多媒體串流的影像串流與音頻串流。任何試圖播放該多媒體串流的裝置皆將以相同次序解碼及播放該多媒體串流。舉例而言,本發明時時地使M/N個音頻採樣與一個影像畫面交錯編排。然後,該裝置應每次解碼及播放M/N個音頻採樣及一個影像畫面。換言之,於對應音頻採樣得到解碼之前,裝置不能解碼次一影像畫面。該方法能確保以串流次序播放音頻串流與影像串流,而無需利用額外的同步化機構。此外,裝置可於解碼後立即輸出影像畫面及音頻框。亦即,裝置無需緩衝整個影像畫面的解碼結果,此尤其適用於一資源有限的可攜式裝置。
雖然本發明已以較佳實施例揭示如上,然其並非用以限定本發明,任何本領域技術人員,在不脫離本發明的精神和範圍內,當可作些許的修改和完善,因此本發明的保護範圍當以權利要求書所界定的為準。
權利要求
1.一種用於編排一多媒體串流的方法,該多媒體串流包含一影像串流及一音頻串流,該方法包含下列步驟
(a)寫入該影像串流的一第一部分;
(b)寫入該音頻串流的一第一部分,其對應於該影像串流的該第一部分;
(c)於步驟(a)及步驟(b)後,寫入該影像串流的一次一部分;以及
(d)於步驟(a)及步驟(b)後,寫入該音頻串流的一次一部分,其對應於該影像串流的該次一部分。
2.如權利要求1的方法,其特徵在於,更包含下列步驟
重複步驟(c)及步驟(d),直到該多媒體串流已完全編排。
3.如權利要求1的方法,其特徵在於,該音頻串流包含多個音頻採樣,該些音頻採樣具有一時間順序,且該步驟(b)包含以下步驟
(b1)根據該時間順序,寫入該些未寫音頻採樣其中之一;
(b2)計算該些已寫入音頻採樣的一累積數目;以及
(b3)依次重複步驟(b1)及步驟(b2),直到該累積數目等於一第一所需數目,且對應該些已寫入音頻採樣的一第一時間長度,大於或等於一第一所需時間長度。
4.如權利要求3的方法,其特徵在於,該步驟(d)包含下列步驟
(d1)根據該時間順序,寫入該些未寫音頻採樣其中之一;
(d2)計算該些已寫入音頻採樣的累積數目;以及
(d3)依序重複步驟(d1)及步驟(d2),直到該累積數目等於一第二所需數目,且對應該些已寫入音頻採樣的一第二時間長度,大於或等於一第二所需時間長度。
5.如權利要求1的方法,其特徵在於,更包含以下步驟
針對該影像串流,決定一畫面速率;
針對該音頻串流,決定一採樣頻率;
根據該畫面速率,編碼該影像串流為多個影像畫面;以及
根據該採樣頻率,編碼該音頻串流為多個音頻採樣,其中該影像串流的各第一部分及該影像串流的各次一部分,包含該些影像畫面其中之一,且該音頻串流的各第一部分及該音頻串流的各次一部分,包含一音頻採樣計算數目。
6.如權利要求5的方法,其特徵在於,該音頻串流的該第一部分及該音頻串流的該次一部分,是根據該畫面速率及該採樣頻率所決定。
7.如權利要求1的方法,其特徵在於,該影像串流的該第一部分及該音頻串流的該第一部分,對應一第一區段時間,且該影像串流的該次一部分及該音頻串流的該次一部分,對應一次一區段時間。
8.如權利要求1的方法,其特徵在於,於步驟(a)之前,更包含一寫入該多媒體串流的一標頭的步驟。
9.如權利要求1的方法,其特徵在於,各該影像串流的第一部分及各該影像串流的次一部分,為一微區塊、一巨集區塊、一巨集區塊列、一切面以及一畫面其中之一。
10.一種用以編排一多媒體串流的裝置,該多媒體串流包含一影像串流及一音頻串流,該裝置包含
一處理器,適以寫入該影像串流的一第一部分,及寫入該音頻串流的一第一部分,其對應該影像串流的該第一部分,及於該影像串流的該第一部分及該音頻串流的該第一部分寫入後,寫入該影像串流的一次一部分,以及於該影像串流的該第一部分及該音頻串流的該第一部分寫入後,寫入該音頻串流的一次一部分,其對應該影像串流的該次一部分。
11.如權利要求10的裝置,其特徵在於,該音頻串流包含多個音頻採樣;該音頻採樣具有一時間順序,且該處理器藉由下列方式,寫入該音頻串流的該第一部分根據該時間順序,寫入該些未寫音頻採樣其中之一;計算該些已寫入音頻採樣的一累積數目;以及重複寫入該些未寫音頻採樣,及重複計算該些已寫入音頻採樣的一累積數目,直到該累積數目等於一第一所需數目,以及對應該些已寫入音頻採樣的一第一時間長度,大於或等於一第一所需時間長度。
12.如權利要求10的裝置,其特徵在於,該處理器藉由下列方式,寫入該音頻串流的該次一部分根據該時間順序,寫入該些未寫音頻採樣其中之一;計算該些已寫入音頻採樣的累積數目;重複寫入該些未寫音頻採樣及重複計算該些已寫入音頻採樣的累積數目,直到該累積數目等於一第二所需數目,以及對應該些寫入音頻採樣的一第二時間長度,大於或等於一第二所需時間長度。
13.如權利要求10的裝置,其特徵在於,該處理器更適以針對該影像串流決定一畫面速率,及針對該音頻串流決定一採樣頻率,及根據該畫面速率,編碼該影像串流為多個影像畫面,以及根據該採樣頻率,編碼該音頻串流為多個音頻採樣,其中該影像串流的各第一部分及各次一部分,各包含該些影像畫面其中之一,且該音頻串流的各第一部分及各次一部分,各包含一音頻採樣計算數目。
14.如權利要求12的裝置,其特徵在於,該音頻串流的第一部分及該音頻串流的次一部分,是根據該畫面速率及該採樣頻率所決定。
15.如權利要求10的裝置,其特徵在於,該影像串流的該第一部分及該音頻串流的該第一部分對應一第一區段時間,且該影像串流的該次一部分及該音頻串流的該次一部分對應一次一區段時間。
16.如權利要求10的裝置,其特徵在於,該處理器更於寫入該影像串流的該第一部分前,寫入該多媒體串流的一標頭。
17.如權利要求10的裝置,其特徵在於,該處理器於寫入該影像串流的該先前部分及該音頻串流的該先前部分後,重複寫入該影像串流的一次一部分及該音頻串流的一對應部分。
18.如權利要求10的裝置,其特徵在於,各該影像串流的第一部分及各該影像串流的次一部分為一微區塊、一巨集區塊、一巨集區塊列、一切面以及一畫面其中之一。
19.一種用於播放一多媒體串流的方法,該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、及一次一音頻部分,於該多媒體串流中,該第一影像部分及該第一音頻部分,較該次一影像部分及該次一音頻部分先到達,該方法包含下列步驟
(a)解碼該第一影像部分,以取得一第一解碼影像部分;
(b)解碼該第一音頻部分,以取得一第一解碼音頻部分;
(c)播放該第一解碼影像部分及該第一解碼音頻部分;
(d)於步驟(a)及步驟(b)後,解碼該次一影像部分以取得一次一解碼影像部分;
(e)於步驟(a)及步驟(b)後,解碼該次一音頻部分以取得一次一解碼音頻部分;以及
(f)於步驟(c)後,播放該次一解碼影像部分及該次一解碼音頻部分。
20.如權利要求19的方法,其特徵在於,該影像串流的各該第一部分及該影像串流的各次一部分為一微區塊、一巨集區塊、一巨集區塊列、一切面以及一畫面其中之一。
21.一種用於播放一多媒體串流的裝置,該多媒體串流包含一第一影像部分、一次一影像部分、一第一音頻部分、及一次一音頻部分,該多媒體串流中該第一影像部分及該第一音頻部分,較該次一影像部分及該次一音頻部分先達到,該裝置包含
一處理器,適以解碼該第一影像部分以取得一第一解碼影像部分,解碼該第一音頻部分以取得一第一解碼音頻部分,播放該第一解碼影像部分及該第一解碼音頻部分,於針對該第一影像部分及該第一音頻部分解碼後,解碼該次一影像部分以取得一次一解碼影像部分,於解碼該第一影像部分及該第一音頻部分後,解碼該次一音頻部分以取得一次一解碼音頻部分,以及於播放該第一解碼影像部分及該第一解碼音頻部分後,播放該次一解碼影像部分及該次一解碼音頻部分。
22.如權利要求21的裝置,其特徵在於,更包含
一緩衝器,用於暫時儲存該第一解碼音頻部分及該次一解碼音頻部分,該緩衝器的一容量小於該第一解碼影像部分的一容量及該次一解碼影像部分的一容量。
23.如權利要求21的裝置,其特徵在於,各該影像串流的第一部分及次一部分為一微區塊、一巨集區塊、一巨集區塊列、一切面以及一畫面其中之一。
全文摘要
本發明提供用於編排及播放一多媒體串流的裝置及方法。該多媒體串流同時包含一影像串流與一音頻串流。該裝置用以寫入該影像串流的一第一部分以及寫入該音頻串流的一第一部分,其中該音頻串流的第一部分對應於該影像串流的第一部分。此後,處理器亦寫入該影像串流的一次一部分及寫入該音頻串流的一次一部分至該檔案,其中該音頻串流的次一部分對應於該影像串流的次一部分。緩衝器用以於音頻串流的第一部分及次一部分被寫入該檔案前暫時儲存之。所編排的多媒體串流可由資源有限的裝置進行播放。
文檔編號G11B27/031GK101483055SQ20081017678
公開日2009年7月15日 申請日期2008年11月18日 優先權日2008年1月11日
發明者沈揚智, 黃浚菁 申請人:慧國(上海)軟體科技有限公司, 慧榮科技股份有限公司