消除字幕數據噪聲的數字視頻數據編碼和解碼裝置及方法

2023-05-10 12:33:31 2

專利名稱：消除字幕數據噪聲的數字視頻數據編碼和解碼裝置及方法
技術領域：
本發明涉及一種對數字視頻數據進行編碼和解碼的裝置和方法，特別是涉及到一種用於對能夠從其中所包含的字幕數據中消除噪聲的數字視頻數據進行編碼和解碼的裝置和方法。
如所知，表示將要被疊加在一個視頻圖像上的字幕的字幕數據在被記錄和傳送以前與視頻信號一起存儲。在一個稱為CAPTAIN系統的系統中，字幕是以點圖形的字符代碼形式傳送的。在公知的數據格式CD-G(光碟圖形)下，圖形圖像和字幕數據被存儲在數據格式的子碼區。如

圖1(a)到圖1(c)所示，這些圖簡要地示出了CD-G格式的數據結構，一個塊的數據包含有98個幀，每一幀包含有一個字節的子碼區，在其後是32個字節的數據。一幀中32個字節數據由6個4位元組的樣本和一個8位元組誤差校正碼組成，如圖1(A)所示，每個樣本由2個字節的L通道數據和2個字節的R通道數據組成。如圖1(b)所示，一個塊由98個幀即幀0到97組成，且如圖1(c)所示，每個塊也被分成8個通道P、Q、R、S、T、U、V和W。幀0和幀1的子碼數據被作為同步模式S0和S1存儲在P到W8個通道的每一個之中，並且在R到W通道中的同步模式後面各跟隨有一個96位元組的數據區，在該數據區中存儲有幀2-97的數據。跟在同步模式S0和S1之後的通道P和Q通常包括「搜索」數據，該「搜索」數據被用於搜索光道，圖形數據通常被存儲在通道R到W中同步模式S0和S1之後。這樣，在每一個塊中存儲有每通道96位乘以6個通道R至W＝576位圖形數據。另外，當以75赫茲的周期頻率傳送每個塊時，用於一個塊的數據傳送速率是7.25kHz(75Hz×98位元組)，從而使子碼傳送位速率為7.35kbs(每秒千字節)。
圖2簡要地示出了圖1中通道R到W的傳送格式，其中，所傳送的「碼元」由來自通道R到W中每通道的單個位的組合構成，所傳送的「包」由96個碼元組成，而所傳送的「子包」包括24個碼元0到23。每個子包的碼元0的通道R、S和T的三個位被保留給「模式」數據，且每個子包的碼元0的通道U、V和W三個位被保留給「項」數據。下面示出的表1表示當使用模式數據和項數據進行定義時的各種數據模式。
表1
指令信息被存儲在每個子包的碼元1中，奇偶校驗和其它附加信息被存儲在每個子包的碼元2到7中。圖形數據通常被存儲在每個子包的碼元8至19中，誤差校正碼被存儲在每個子包剩餘的碼元20-23中。
在上面所討論的格式下，每個子包可以存儲6×12＝72個圖形數據位或圖形數據的72個像素。如果一個單一的字符被存儲在每個子包的8-19(6位×12碼元)中，那麼，每秒種以75Hz的位傳送速率傳送300個字符。在CD-G格式下，一個單一的圖像包括192行，其中每行包括288個水平像素，這樣，傳送每個圖像需要2.56秒，如等式1所示(288/6)×(192/12)/300＝2.56(秒)(1)如果以十六進位形式來表示每個像素值，並且一個像素的每個十六進位表示需要4位，那麼，傳送一個單一圖像所需的時間量約是10.24秒。
在CAPTAIN系統中，每個圖像顯示192行(每行248個水平像素)，但是，對於數位電視的720×480解析度來講，這一解析度是不夠的。另外，由於混淆或其它的現象，以上述數據格式存儲的字幕字符可能失真(例如，「參差不齊」)。避免字幕字符在其編碼和解碼期間失真的一種技術就是使用高解析度濾波器把數字圖像轉換成「多值」數據，但這種濾波器通常都很昂貴，並且它們可能引起畫面背景圖像失真。
通常，表示字幕字符的位映像數據都要經過「加強」(thickening)處理，其中對字符的邊緣「加輪廓」，但這種處理通常使字符在水平方向上「拖尾」。因此，所得到的由位映像數據表示的字幕的質量一般很差。
因此，本發明的目的是提供一種用於對數字視頻數據進行編碼和解碼的裝置和方法，其克服了上述技術中的缺點。
本發明的另一個目的是提供一種裝置和方法，用於對具有字幕數據的數字視頻數據進行編碼和解碼並從字幕數據中消除噪聲。
本發明的再一個目的就是提供一種裝置和方法，用於將數字視頻信號與字幕數據一起進行編碼，它在字幕數據和數字視頻信號相結合之前從字幕數據中消除了噪聲。
本發明的各種其它的目的，優點和特徵對於本專業技術領域以內的普通技術人員將變得非常明顯，且在所附權利要求書中將特別指出本發明的新穎特徵。
根據本發明的一個實施例，運用本發明的裝置和方法接收字幕數據，該數據表示具有多個像素的字幕，根據字幕各像素和與各像素相鄰的像素之間的相互關係從字幕數據中消除噪聲，並對數字視頻數據與已消除噪聲的字幕數據一起進行編碼。
作為本發明的一個方面，當通過確定一個像素的值是否小於背景電平像素的值而該像素表示一個噪聲像素時，則各像素被變成背景電平像素，且相鄰像素代表背景電平像素。
作為本發明的另一方面，與各個像素相鄰並垂直校直的像素被用於確定是否改變各像素的值。
作為本發明的另一方面，與各個像素相鄰並水平校直的像素被用於確定是否改變各像素的值。
根據本發明的另一實施例，運用本發明的裝置和方法接收包括字幕數據的數字視頻數據，所述的字幕數據表示具有多個像素的字幕；從所接收的數字視頻數據中提取該字幕數據；根據該字幕的各個像素和與該各像素相鄰的像素之間的相互關係從所提取的字幕數據中消除噪聲，和將由已被消除噪聲的字幕數據表示的字幕疊加到由數字視頻數據表示的一個視頻圖像上。
根據本發明的再一個實施例，運用本發明的裝置和方法接收含有噪聲的字幕數據；確定在該字幕中的各個像素是否是噪聲像素；確定在該字幕中與該各像素相鄰的像素是否是背景電平像素；並且當所述各像素被確定為是噪聲像素且相鄰像素被確定是背景電平像素時，把代表各像素的字幕數據改變成背景電平。
下面將結合附圖藉助於舉例對本發明進行詳細描述，這些例子對本發明不構成限定，圖中相同的標號表示相同的元件或部分，其中，圖1(a)到1(c)簡要地示出了DC-G數據格式的數據結構；圖2簡要示出了圖1(a)到1(c)所示數據格式的傳送格式；圖3的方框圖示出了依據本發明的一個數據解碼設備；圖4的方框圖示出了圖3所示的字幕解碼器7；圖5(a)和5(b)是地址表，它示出了一個內容表(TOC)的內容；圖6(a)和6(b)簡要地示出了存儲在一個記錄介質上的視頻，音頻和子碼數據的數據流；圖7的表示出了在系統控制器14和35之間的各種通信；圖8的表示出了系統控制器14和35之間各種通信的參數；圖9(a)到9(c)示出了根據本發明的字幕數據的信號波形；圖10示出了在本發明編碼處理期間使用的彩色查詢表；圖11的方框圖示出了根據本發明的數據解碼設備；圖12(a)和12(b)簡要地示出了圖11所示的劃變數據取樣器70；圖13是由本發明編碼和解碼設備使用的另一個彩色查詢表；圖14簡要地示出了本發明字幕解碼器的代碼緩衝器的內容；圖15的方框圖示出了本發明字幕解碼器緩衝器；圖16(a)到16(c)簡要地示出了彩色劃變操作；圖17的方框圖示出了彩色查詢表電路；圖18(a)到18(c)簡要示出了顯示位置改變操作；圖19是位置控制電路的方框圖；圖20(a)和20(b)簡要地示出了加有和未加有噪聲的位映像數據；圖21的方框圖示出了根據本發明的噪聲消除濾波器；和圖22(a)和22(b)簡要地示出了由加有和未加有噪聲的字符數據表示的一個字幕字符。
參看圖3，該圖示出了根據本發明的一個數據解碼設備的方框圖。該數據解碼設備包括一個數據解碼器/信號分離器1、緩衝存儲器2、4、6、和12、視頻解碼器3、信箱電路5、字幕解碼器7、複合編碼器8、模式顯示電路9、D/A轉換器10和13、音頻轉換器11和系統控制器14。可選擇地，所述數據解碼設備還可以包括一個驅動控制器15；用於將字幕數據存儲到一個例如磁光碟91的記錄介質上或從該記錄介質上再現該字幕數據。
其中具有被編碼的音頻、視頻和字幕數據的視頻信號被提供給解碼器/信號分離器1(此後稱之為信號分離器1)，該信號分離器1對所提供的信號進行解碼並進行誤差校正，同時對其中的視頻、字幕和音頻數據進行多路分解，並將多路分解的視頻、字幕和音頻數據分別提供給視頻解碼器3、字幕解碼器7和音頻解碼器11。存儲器2是一個由信號分離器1以公知方式使用的緩衝存儲器。
視頻解碼器3對提供給它的多路分解的視頻數據進行解碼，並將解碼後的視頻數據提供給信箱電路5，當需要時，該信箱電路5進行操作以在垂直方向上將由該視頻信號表示的視頻圖像壓縮3/4，以使得視頻圖像可以被顯示在寬高比為4∶3的一個視頻監視器上。信箱電路5將該視頻數據提供給字幕解碼器7(下面討論)。
音頻解碼器11對提供給它的多路分解的音頻數據以公知方式進行解碼，並將解碼後的音頻數據提供給D/A轉換器13，該轉換器13將數字音頻數據轉換成模擬音頻信號以輸出。視頻解碼器3、信箱電路5和音頻解碼器11分別以現有技術中公知方式使用緩衝存儲器4、6和12。
字幕解碼器7以下面將要討論的方式對提供給它的字幕數據進行解碼，並將字幕數據疊加到由信箱電路5提供的視頻信號上，然後將組合的視頻和字幕數據提供給複合編碼器8。複合編碼器8將其上疊加有字幕數據的視頻信號以現有技術中公知的方式轉換成NTSC、PAL或SECAM信號，並將轉換後的信號提供給D/A轉換器10，該轉換器10將數字視頻數據轉換成模擬信號輸出。
上面討論的圖3所示解碼器設備每一電路的操作是由系統控制器14以及模式顯示電路9控制的，所述模式顯示電路9允許用戶向系統控制器14提供指令並監視和顯示各種操作。
圖4以方框圖的形式表示了字幕解碼器7，它包括一個字檢測器電路20、一個調度電路21、一個代碼緩衝器22、一個逆變長編碼器(逆VLC)23、一個逆遊程長度電路24、一個3∶4濾波器25、一個彩色查詢表(CLUT)電路26、一個混合器34、一個字幕系統控制器35和一個噪聲消除濾波器400。如將要討論的，字幕解碼器7接收位流形式的字幕數據，並在將其存儲到代碼緩衝器22之後在指定時間對該位流進行解碼。如圖3所示的信號分離器1輸出的字幕數據被提供給字檢測器20，以檢測其首標信息、首標誤差信息和數據誤差信息(下面將要討論)，並將檢測後的信息提供給系統控制器35。字檢測器20另外還要檢測並從所提供的字幕數據中提取時間標記(PTSS)數據，該數據用於識別所述字幕什麼時候被疊加到該視頻信號上；位置數據，該數據用於識別在視頻圖像的什麼位置處該字幕被進行疊加；像素數據，該數據用於表示字幕本身；以及更新的CLUT數據。所提取的數據被提供給代碼緩衝器22，該緩衝器22用於在其中存儲數據。調度器21控制代碼緩衝器22的讀出和寫入操作，代碼緩衝器22的讀/寫「存取」帶寬是根據存儲器存取調度處理過程決定的，該過程是由數據從信號分離器1傳送的數據的位速率以及顯示速率控制的。例如，如果信號分離器1的位速率輸出最大是20Mbps(每秒兆位)且代碼緩衝器22具有一個8位的I/O埠，那麼將數據存儲到代碼緩衝器22中的最佳速率是2.5MHz。但是，數據是根據垂直和水平同步信號，存儲在代碼緩衝器22中的位置信息以及從系統控制器14中接收解碼起動信號而從代碼緩衝器22中讀出的。數據是以13.5MHz的像素取樣速率從代碼緩衝器22中讀出，並且由於寫入速率是2.5MHz，所以，最慢的讀出速率是3.375MHz，該速率是13.5MHz的1/4。換言之，處於13.5MHz時鐘速率的每4個時鐘周期中的一個被用於寫入操作，而每4個時鐘周期中其餘的三個時鐘周期被用於從代碼緩衝器22讀出數據。由於代碼緩衝器22的I/O埠是8位寬，所以在每4個時鐘周期中從中讀出3個時鐘周期×8位＝24位，並且如果子碼的每個像素最多包含6位，字幕的實時顯示是可能的。
如前所述，字檢測器20提供字幕顯示時間標記(PTSS)數據給系統控制器35，該控制器35將PTSS數據提供給系統控制器14。系統控制器14將時間標記數據和系統時鐘(未示出)的當前時間進行比較，並且當到達由該時間標記所指出的時間時，系統控制器14把一個適當的指令提供給字幕解碼器7中的系統控制器35，該控制器35響應提供給它的指令控制調度器21和代碼緩衝器22輸出其中存儲的字幕數據。另外，在普通重放模式下，存儲在代碼緩衝器22中的字幕數據被重複讀出，從而使該字幕被連續地疊加到該視頻圖像的每一幀上，直到達到字幕顯示結束時間為止，這種信息被包括在字幕顯示時間標記數據之內。在特殊重放模式下，例如，在「n」倍的快進或快倒模式下，字幕數據從代碼緩衝器22讀出的持續時間是在普通重放模式期間它被讀出所用時間長度的1/n。在普通和特殊重放模式下通常可以使用一個脈衝計數器以確定從代碼緩衝器22的字幕數據的讀出操作在什麼時候將被中止，其中，脈衝計數器在普通重放模式下加1計數到規定的數(或從規定的數減到0)，在特殊重放模式下以速率n計數到規定的數。
來自代碼緩衝器22的字幕數據提供給逆VLC電路23，如果需要的話，該電路對讀出的數據執行逆變長編碼操作並將解碼後的數據提供給逆遊程長度電路24，該電路通過以現有技術中公知的方式產生「電平」數據對所述數據解碼，並將解碼後的數據(即擴展數據)提供給3∶4濾波器25。當一個顯示器的寬高比為4∶3時，擴展後的字幕數據在3∶4濾波器25內以水平方向壓縮，這種壓縮是響應來自系統控制器35的X擠壓命令而形成的。當監視器的寬高比為16∶9或當字幕數據表示多個字形時，字幕數據不進行水平壓縮。
如前所述，系統控制器14在一個適當的時刻向系統控制器35提供一個解碼開始指令，但是，由字幕解碼器各個電路開始進行解碼的時間被延遲一個預定的時間量，以補償視頻信號(沒有字幕數據)解碼的任一延遲。同樣，該視頻信號的解碼可以被延遲一個預先確定的時間量，從而可以使字幕數據向該視頻信號的疊加同步。
濾波器25將字幕數據提供給噪聲消除濾波器400，如下面將要討論的，根據本發明，該濾波器400用於從字幕數據中消除噪聲並且將(已經消除了噪聲的)字幕數據提供給彩色查詢表(CLUT)電路26。如前所述，字檢測器20從字幕數據中提取更新後的CLUT數據，並將CLUT數據提供給其中存儲有數據的代碼緩衝器22。該CLUT數據從代碼緩衝器22中讀出並提供給CLUT電路26，該電路26根據提供給它的CLTU數據產生用於由噪聲消除濾波器400提供的字幕數據的適當的色彩，並為每個像素選擇與字幕數據相對應的地址，同時向混合器34提供混合比率K和彩色分量Y、Cr和Cb。混合器34響應來自控制器35的適當的疊加控制信號根據混合率K利用處於適當位置(如用字幕位置數據所確定的)的視頻數據對由CLUT電路26提供的彩色數據Y、Cr和Cb進行「混合」。另外，當在模式信息中規定衰減係數時，如前所述，實現來自該視頻圖像的字幕的漸顯和漸隱。當該字幕未被疊加在視頻信號上時，如由來自控制器35的疊加控制信號所識別的，混合器34僅提供加給它的視頻數據作為輸出。
當字幕發生器(在圖11中表示為字符發生器55)以將被疊加到一個視頻信號上的位映像數據形式產生並提供一個字幕時，該數據通常以模擬信號的形式通過一個適當的模擬系統傳送到一個字幕編碼器，該編碼器在該字幕數據被疊加到一個視頻信號上之前對它進行編碼。由於這種模擬系統的各種頻率特性和帶寬函數，將導致上升的「過量」和/或「不足」，並與位映像數據相重合，這將使得位映像數據在水平方向上「拖尾」。圖20(A)示出了一個有「拖尾」的位映像數據，且如這裡所標記的，該位映像數據表示了加有「噪聲」的字幕數據。圖20(B)示出了一個無拖尾的位映像數據，該數據表示已經消除了噪聲的字幕數據。本發明字幕解碼器的噪聲消除濾波器400消除字幕數據中的「噪聲」(即消除拖尾)(下面還要討論)並將消除了噪聲的字幕數據提供給CLUT電路26。
下面結合附圖5(A)和5(B)來說明從一個記錄介質(例如數字視頻盤)中提取字幕的方式。與上述將視頻、音頻和子碼數據多路轉換成一個單一視頻信號然後再將其提供給信號分離器1的數據格式不同，字幕數據可以與視頻和音頻數據分開存儲，或者所有的視頻，音頻和字幕數據可以被存儲在例如一個數字視頻盤的記錄介質上，其中，當需要時，本發明的解碼裝置從盤91中提取在其上面存儲的字幕數據。如圖5(A)所示，一個通常被存儲在盤91最內緣(稱為「引入」)上的內容表(TOC)包括對應每一子碼幀號(N、N＋1等)的識別幀位置的一字節指針值(PONT)和與該幀的時間相對應的時間代碼(PMIN、PSEC、PFRAME)。示於圖5(B)的內容表識別包括在數據流(即視頻、音頻或字幕數據)中的數據的類型，各數據流的幀號以及在所述盤上各數據流被存儲的起始和結束地址(起始扇區地址和結束扇區地址)。如圖3所示，系統控制器14藉助於驅動控制器15從盤91中提取TOC數據，以識別所選數據流的位置。
另外，記錄在盤上各個位置處的一個流「映像」識別該數據流的存取點，以提供從記錄介質上提取字幕的另一種手段。流映像被作為數據包加以提供，並用於識別視頻、音頻和字幕數據的位置以及各種消隱信息的位置，同時還用於識別每一數據流的包長度，流映像的長度等等。系統控制器14以類似於提取TOC數據的方式提取特定的流映像。
從數字視頻盤中提取字幕的另一種方法是利用由每一個字幕(這裡被定義為「當前字幕」)進行存儲的字幕流扇區地址數據，該數據包括附屬於以前字幕的數據，即在包括該扇區地址數據的字幕之前進行疊加的字幕，且該字幕還包括附屬於跟在當前字幕之後的一個字幕的數據，即在當前字幕被疊加之後將要被疊加在該視頻圖像上的下一個字幕(這裡被定義為「後續字幕」)。下面的表2示出了字幕流扇區地址數據的數據結構。
表2
字幕解碼器7對字幕流扇區地址數據進行解碼，並將解碼後的數據通過字幕系統控制器35提供給系統控制器14，該控制器14從盤91中提取在其上記錄的與所需字幕相應的字幕數據。
圖6(A)示出了在數據流中被分配有字幕數據的位置。如所示，包括在每一組字幕數據中的字幕流扇區地址數據「指向」數據流中的設置有「以前」和「後續」字幕的位置。另外，圖6(A)還示出了在一個再現設備普通重放模式下被提取的「普通模式」流，其中，每一個字幕頁被作為部分的或「劃分的」頁Sp被存儲在視頻盤上數據流中的多個位置處。圖6(B)示出了在該再現設備特殊重放模式(例如快進)下提取的「特技模式」流，其中，緊接在一個字幕頁之前存儲的數據表示一個幀內編碼的視頻圖像(V_I)(即一個「I」圖像)。在數據流中每個全部或「整個」字幕頁Sw之前是一個「I」圖像，所以可以利用一個特殊的重放模式(例如快進或快倒模式)與字幕一起再現視頻圖像。在圖6(A)和圖6(B)中，VP表示一個預編碼圖像(「P」圖像)，V_B表示一個雙向預編碼圖像(「B」圖像)及「A」表示一個音頻數據包。
圖7是一個示出了在解碼設備的系統控制器14和字幕解碼的系統控制器35之間各種通信的表，圖8的表示出了從系統控制器14傳送給系統控制器35的每種數據的位數。由於系統控制器14和35之間的精確通信不屬於本發明的一部分，所以這裡省略對它們的進一步描述。
下面參照圖9(a)到9(c)來描述一種使用4位編碼方法對字幕數據進行編碼的方法。圖9(a)簡要地示出了將要被疊加到一個視頻圖像上的字符「A」，9(b)和9(c)分別示出了與圖9(a)中水平行相對應的填充數據和關鍵數據的字幕數據信號電平。填充數據對應於字幕像素的亮度電平(Y)，且如圖9(b)所示在時間周期T1、T2、T4和T5期間填充數據處於最低電平「0h」(十六進位格式)，只有在周期T3內處於高於最低電平的一個電平。關鍵數據表示混合率K並且通常對應於填充數據與視頻圖像混合的程度，且如圖9(c)所示，關鍵數據在周期T1和T5期間內處於電平「0h」，所以僅提供視頻圖像(這裡也稱之為「背景圖像」)，該圖像在周期T2和T4期間處於「0h」和「E0h」之間的中間電平，從而不同程度地使字幕和背景圖像進行混合，所述視頻圖像在周期T3期間處於「E0h」電平，從而僅提供由填充數據所表示的字幕。由於與字幕圖像相鄰的背景圖像被部分地進行了「噪聲抑制」，並且「落後於」字幕圖像的背景圖像被全部進行了「噪聲抑制」，所以在視頻圖像中字幕圖像是完整並清晰可見的。
圖10示出了包括在圖4所示CLUT電路26中的一個彩色查詢表(CLUT)，當字幕和背景圖像相互混合(即疊加)時利用該表。該表被表示為包括0到F(十六進位)的多個地址，每個地址具有各自亮度(Y)和色度(Cr和Cb)值和關鍵數據K，其中對於具有亮度電平為0和關鍵值K為E0h的地址僅僅顯示字幕(沒有與其相混合的任何背景圖像)。
參看圖11，這裡示出了一個包括有本發明噪聲消除濾波器的一個數據編碼設備的方框圖。電視攝像機51產生一個模擬視頻信號並將其提供給視頻編碼單元52，該單元52把模擬視頻信號轉換成數字視頻信號並對該數字視頻信號進行壓縮，然後將壓縮後的數據以包為單位提供給多路複合器58。另外，視頻信號還可以從一個記錄介質中再現出來並提供給視頻編碼單元52。視頻編碼單元52包括一個速率控制器52a，用於響應由一個字幕緩衝檢驗器(SBV)68(下面討論)提供的位速率信號，根據將要被包括在其中的字幕數據的量來控制視頻數據壓縮的程度。
話筒53提供一個模擬音頻信號給音頻編碼單元54，該單元54將模擬音頻信號轉換成數字音頻數據，並對該數字音頻數據進行壓縮，然後將壓縮後的數字音頻數據以包為單位提供給多路複合器58。另外，音頻信號也可以從一個記錄介質中再現出來並提供給音頻編碼單元54。
字符發生器55以數字位映像數據的形式產生字幕數據，並將該數字位映像數據提供給字幕編碼單元57。另外，飛點掃描器56以模擬位映像信號的形式提供字幕數據給字幕編碼單元57。字幕編碼單元57包括開關61、62和69、處理電路63、數字濾波器72、量化電路64、劃變數據取樣器和位置取樣器電路70、彩色查詢表電路71、微分PCM編碼器(DPCM)電路65、遊程長度編碼電路66、變長編碼電路67、字幕緩衝檢驗器(SBV)電路68和噪聲消除濾波器200。
字符發生器55將字幕數據(即填充數據)提供給開關61的「a」端，將關鍵數據提供給開關61的「b」端。另外，字符發生器55還將消隱數據提供給開關62的「a」端。字幕數據和關鍵數據通過開關61被時分多路復用，並被提供給數字濾波器72，該濾波器以現有技術中公知的方式對字幕和關鍵數據進行濾波，並將濾波後的數據提供給開關62的「b」端。假如飛點掃描器56提供字幕數據，那麼該數據在被轉換成數位訊號並以公知方式在處理電路63中進行處理之後提供給開關62的「c」端。
開關62將由字符發生器或掃描器提供的字幕數據提供給量化電路64，該電路64使用存儲在電路71中的彩色查詢表中的數據對字幕數據進行量化並將量化後的字幕數據提供給噪聲消除濾波器200。在字幕數據通過開關69被提供給DPCM電路65以前，以將要在濾波器200中討論的方式從中消除噪聲，所述DPCM電路65對字幕數據進行微分PCM編碼，並將編碼後的字幕數據提供給遊程長度編碼電路66，而後再提供給變長編碼電路67，該電路67以公知方式對字幕數據進行壓縮。
以RGB數據或位置數據的形式存在並用於提供滾動字幕(例如用於卡拉0K)的彩色劃變數據是在一個彩色劃變發生器(未示出)中產生的，並通過一個劃變控制杆81提供給一個適配器82，該適配器82提供彩色劃變數據給轉換開關83和劃變數據取樣器70。轉換開關83從字符發生器55中接收字幕數據並使該字幕數據和提供給它的彩色劃變數據相互疊加，然後將結合的字幕數據提供給監視器84，從而使所產生的字幕數據可視。
圖12(a)簡要地示出了所產生的字幕的幀的顯示，圖12(b)是劃變數據取樣器70的方框圖。如所示，適配器82把RGB彩色數據提供給電路70的寄存器300和比較器301。寄存器300鎖存包括在所提供信號之中的每個像素的值，並將鎖存的值提供給比較器301，比較器301把(來自適配器82的)所提供像素的值和(來自寄存器300的)以前提供的像素的值進行比較，並且在每當比較值相等時控制計數器302的計數值加1。換言之，當多個像素中的每一個都是根據同一彩色查詢表產生時，比較器301輸出「真」狀態，而當彩色查詢表改變時則輸出「假」。如此形成的計數值等於當前和以前值之間匹配的數量，這與彩色查詢表改變的位置相同。每當出現水平或垂直同步信號時，計數器302內的計數被復位，且在每個垂直同步信號處該計數被鎖存到寄存器303之中。寄存器303通過開關69將鎖存的計數值提供給DPCM電路65，然後提供電路67和68，它們對計數數據進行壓縮並以包的形式提供給多路複合器58。
字幕彩色劃變信息或字幕位置信息以幀為單位進行編碼，但是也可以把多個幀歸併成一個單一的單元進行編碼。字幕緩衝器68控制量化電路64的量化電平，所以，由於對緩衝器68提供大量的已編碼字幕數據，所以它不會溢出。
圖13示出了類似於圖10所示彩色查詢表的一個彩色查詢表(CLUT)並且該表被包括在彩色查詢表(CLUT)電路71中。如所示，0到F(十六進位)地址中的每一個具有各自的亮度(Y)、色度(Cr和Cb)以及關鍵數據K的值。亮度值Y對應於填充數據，關鍵數據K對應於混合比率。CLUT電路71將彩色查詢表的值提供給字幕緩衝器68，從而和字幕數據一起存儲這個表。在解碼設備中再現CLUT數據以在其中建立CLUT值，這點如前所述。當需要用於不同的字幕時，可以對彩色查詢表進行修改。
字幕緩衝器68(或字幕緩衝檢驗器68)接收扇區地址數據，普通/特技播放數據和位置數據等，並將所提供的數據組合成經過壓縮和編碼的字幕數據，而後將產生的字幕數據提供給多路複合器58。字幕緩衝器68通過控制量化電路64的量化電平來控制它的輸入的位速度以避免其中數據的下溢或上溢。
多路複合器58多路復用、例如時分多路復用由視頻編碼單元52提供的視頻數據、由音頻編碼單元54提供的音頻數據以及由字幕緩衝器68提供的字幕數據，對多路復用數據執行誤差校正，並調製多路復用的數據(例如8到14調製)。多路複合器58把作為數據流的多路復用數據輸出給分區處理器100，該處理器100根據所提供的數據流產生固定長度的扇區，每個扇區包括一個或多於一個的數據包並提供每個數據扇區，或輸出到盤91上進行記錄或通過傳送通道進行傳送。分區處理器100還將每個數據扇區提供給一個內容表(TOC)和流映像產生器101，該產生器101如前所述地根據提供給它的扇區數據產生該內容表和流映像，並將該內容表及流映像數據作為輸出提供給盤91進行記錄。
參看圖14，下面來討論圖11所示的字幕緩衝器68的操作，其中，豎軸表示數據量，橫軸表示時間，緩衝器的大小(即數據容量)由斜線A和B之間的垂直距離表示，且緩衝器的讀/寫位速率由斜線A和B的斜率表示。「步進」線C表示也將要被傳送的存儲在代碼緩衝器中的數據量，並且「步進」線C需避免和線A交叉，因為交叉將導致下溢狀態，同時要避免線C和線B交叉，因為這種交叉將導致上溢狀態。幾個數據項S0、S1、S2和S3被相繼存儲在代碼緩衝器中並在所指出顯示時間處開始輸出。線C的水平部分表示時間，在這些時間處數據被存儲在代碼緩衝器中，線C的垂直部分表示數據被從代碼緩衝器中提取出來的時間。雖然在圖14中斜線A和B的斜率被表示為一個常數，但是可以考慮可變的位速率(即可變的斜率)。
回過來考慮在圖4所示字幕解碼器中的代碼緩衝器22，代碼緩衝器22的工作方式類似於參考字幕緩衝器68和圖14所描述的方式。圖15示出了代碼緩衝器22的方框圖，它被表示成包括一個代碼緩衝器22-1、顯示存儲器22-2和一個分析程序22-3。提供給代碼緩衝器22的位流被提供並存儲在代碼緩衝器22-1中，當系統時鐘在時間上與顯示時間PTSS數據相一致時，代碼緩衝器22-1將其中的一頁字幕數據傳輸給顯示緩衝器22-2，分析程序22-3將首標數據從剩餘的字幕數據中分離出來。圖15所示的電路23-26先前已經參照圖4進行了描述。
下面參照圖16到19來描述當彩色劃變數據被包括在該位流的字幕數據中時CLUT電路26的操作。首先看圖16(a)到16(c)。圖16(a)示出了一個位置A，在該位置處，該彩色查詢表被從第一彩色查詢錶轉換到一個不同的彩色查詢表。將要被顯示的圖16(b)中所示每一字幕(n、n＋1、n＋2......等)字幕模式數據和劃變數據(WPA、WPB等)被存儲在代碼緩衝器22中，其中，每個字幕的數據量示於圖16(c)中，且其中圖16(b)中的每個PTS代表一個指示將要顯示各個字幕的時間的時間「標記」。當達到了由第一字幕n的時間標記PTS所指示的時間時，字幕n的字幕數據從代碼緩衝器中讀出，解碼和顯示(即疊加到視頻圖像上)。當到達由下一個字幕n＋1的時間標記PTS所指示的時間時，在收到垂直同步信號時在幀n＋1的垂直消隱間隔的期間內，劃變數據WPA被從代碼緩衝器22中讀出並鎖存在寄存器205中，如圖17所示。寄存器205將鎖存的劃變數據WPA提供給像素計數器208，以對CLUT電路26內CLUT表中的值進行修改。劃變數據例如規定對上層地址和下層地址中的表數據的轉換，以提供表的下部中的「上層」數據和提供表的上部內的「下層」數據。
從寄存器205提供給像素計數器208的劃變數據被存儲在其中，在這期間，每出現一次水平同步信號，其中的計數都被遞減。對於「水平劃變」時間處的每一行執行類似的處理。當像素計數器等於零時，在其中設置借位標記，並將該借位標記提供給CLUT電路26，該電路26響應提供給它的標記執行劃變操作。
與劃變數據不同，字幕模式數據在該視頻信號的有效周期內被從代碼緩衝器22中讀出並提供給逆VLC電路23，隨後通過電路24、25和400提供給CLUT電路26，如前所述。
參看圖13，所示的彩色查詢表包括兩組彩色，一組用於地址0h到7h，第二組用於地址8h到Fh。因此，通過改變CLUT地址的最高有效位(MSB)可以改變劃變彩色。如圖17所示從像素計數器208輸出的借位標記BR可以作為CLUT地址的MSB而被提供，當每個像素由4位表示時，這使需要被編碼的位的數量減少到3，而當每個像素由2位表示時，這使需要被編碼的位數減少到1。另外，由於使用了每2個像素4位的格式，所以只有MSB被用於彩色控制，而其餘的3位被用作像素信息。
下面參照附圖18(a)到18(c)和19來描述多個字幕位置的移動操作。諸如圖18(a)所示表示沿著一個圖像水平軸的一個字幕位置的位置數據如圖18(c)所示在一個適當的幀期間內和字幕數據一起被提供給字幕解碼器。類似於圖16(b)，圖18(b)示出了每個字幕的顯示時間標記PTS和字幕數據，其中包括劃變數據WPA、WPB等。如圖19所示，在每個垂直同步信號處位置數據被從代碼緩衝器22中讀出並鎖存在寄存器205中，並且被鎖存的位置數據被提供給像素計數器208，計數器208在其中存儲該位置，並在每個水平同步信號處遞減所存儲的位置。當所存儲的位置數據等於零時，設置借位標記BR，系統控制器35(圖4)響應該借位標記的設定控制代碼緩衝器22和遊程長度解碼器24開始讀出和解碼該字幕。
下面參考圖20到22來描述依據本發明的在圖4和11中示出的噪聲消除濾波器200和400的操作。如在前面所討論的，由於模擬設備的頻率特性和帶寬函數，以來自例如圖11所示編碼設備的掃描器56的模擬信號的形式提供的位映像數據在由一個字幕解碼器進行編碼時是「拖尾」的。該拖尾結果是由於位映像數據的上升和下降的「過量」和/或「不足」造成的。圖20(A)示出了一個有拖尾的位映像數據，由一個拖尾的位映像數據所表示的字幕的質量是低劣的。
根據本發明，如前所述，噪聲消除濾波器被包括在數據編碼和解碼設備中，其中，如圖11所示，噪聲消除濾波器200被設置在編碼設備中量化電路64之後，而噪聲消除濾波器400如圖4所示被設置在解碼設備中濾波器25之後。量化後的每個像素用4位表示，所以對於每個像素而言具有總數為16的不同值。前4個電平0到3用於作為「邊緣附著」關鍵電平，其餘的電平4到15用作填充數據，如結合圖9所述。為討論的目的，假設電平4代表背景視頻電平，即在這個電平處不存在字幕，該背景視頻電平例如是圖9(b)所示時間周期T1、T2、T4和T5內填充數據的值。因此，由於關鍵電平原來應當為4或更大，所以低於4的關鍵電平(即關鍵電平0到3)被認為是「噪聲」。
圖21的方框圖示出了依據本發明的噪聲消除濾波器(濾波器200和400)。如所示，噪聲消除濾波器由行延遲器210和211以及布爾邏輯門電路212-230組成。像素數據的水平行、由4位組成的每個像素被相繼地提供給行延遲器210，並提供給門電路212-215。行延遲器210在其中存儲水平行數據，並在該延遲等於一個水平行間隔之後陸續輸出所存儲的數據作為延遲的水平行，並將該延遲的水平行提供給行延遲器211。從行延遲210輸出的延遲的水平行還被提供給門電路216、217以及門電路227-230。與行延遲器210類似，行延遲器211存儲提供給它的已經延遲了的水平數據，並在該延遲等於一個水平行間隔之後輸出所存儲的數據作為雙倍延遲的水平行。雙倍延遲的水平行被提供給門電路219-222。
為討論的目的，提供給圖21的電路(以及提供給行延遲器210)的像素數據的水平行這裡被定義為「以前像素行」，從行延遲器210輸出的延遲後的水平行這裡被定義為「當前像素行」，由行延遲器211輸出的雙倍延遲的水平行這裡被定義為「後續像素行」。根據本發明，當4位像素值小於4時，與位於「當前像素行」內的單個像素相對應的4位數據被認為是噪聲(如前所述)，且該4位數據被垂直置於其像素值與背景視頻電平4相對應的兩個像素之間。當這種噪聲像素被垂直定位在兩個「背景」像素之間時，根據本發明，該噪聲像素的數據在噪聲消除濾波器中被改變成4的背景電平。圖21的電路實現該結果。
如前所述，以前像素行(即提供給圖21的噪聲消除濾波器的像素數據的水平行)被提供給門電路212-215，當前像素行(即行延遲器210的輸出)提供給門電路216、217以及門電路227-230，而後續像素行(行延遲器211的輸出)提供給門電路219-222。每個像素的4個位被並行地提供給各門電路，其中，在以前像素行中一個像素的位1(最低有效位)、位2和位4(最高有效位)被分別提供給「非」電路214、213和212，這些電路使所提供的各位值反相。「非」電路212-214的輸出以及該像素的位3被提供給「與」電路215，當所提供的所有值均為高時，與電路215輸出高值(即一個「真」值)由此有效地確定在當前像素行中所提供像素的4位值是否是「0100」(二進位)，該值相當於值4(十進位)。
類似地，在後續像素行中相應像素的位1、2和4被分別提供給「非」電路221、220和219，這些電路將提供給它們的位值反相併將其各自的輸出提供給「與」電路222。「與」電路222還被提供有未被反相的位3，由此來確定在後續像素行中所提供像素的4位值是否是與值4相對應的「0100」。
在當前像素行中對應像素的位3和4(兩個最高有效位)被分別提供給「非」電路217和216，使提供給它們的位值反相併將其各自的輸出提供給「與」電路218。由於只有當該像素的4位值小於4時位3和位4才是「0」，所以，「與」電路218確定該像素值是否小於4。
「與」門電路215、218和222中每一個的輸出都被提供給「與」門電路223，當滿足上面所討論的條件時，「與」門電路223輸出為高(或「真」)。就是說，當在當前像素行中的像素是噪聲(由門電路216-218確定)時，「與」門電路輸出高值，在當前像素行中對應像素的值是4(由門電路212-215確定)，且在後續像素行中相應像素的值是4(由門電路219-222確定)。因此，當「與」門電路輸出一個高值時，當前像素行中該像素的值被改變成背景電平4，而當「與」門電路輸出低電平時，則表示上述的所有條件都沒有被滿足，在當前像素行中像素的值不改變。門電路224-230實現該結果。
在當前像素行中一個像素的位1、2、3和4(來自行延遲器210的輸出)被分別提供給「與」門230、「與」門229、「或」門228和「與」門227。「與」門223的輸出被提供給「或」門228並提供給「非」電路224-226。「非」電路224-226的輸出被分別提供給「與」門227、229和230。如可以理解的，當「與」門223的輸出為低時，「與」門227-230輸出提供給它們的各位值，但當「與」門223的輸出為高時，「與」門230、229、228和227的輸出分別被強制為各電平0、0、1、0，這與4位像素值「0010」或4(十進位)相對應。由此，當與那個噪聲像素垂直相鄰的像素處於背景電平時，圖21的電路進行工作以將噪聲像素值變成背景電平4。
圖20(B)示出了消除了圖20(A)所示噪聲像素的位映像字幕數據。圖22(A)簡要地示出了由被加有噪聲的像素位映像數據所表示的字幕字符「A」，圖22(B)簡要地示出了由字幕數據表示的字幕字符「A」，在所述字幕數據中，利用依據本發明的噪聲消除濾波器200或400從中消除了噪聲。
根據本發明的另一實施例，當那個噪聲像素被水平地定位在兩個相鄰的具有與背景視頻像素電平4相對應的像素值的像素之間時，可操作噪聲消除濾波器改變小於4的噪聲像素的4位值。如果利用像素延遲器來取代行延遲器210和211，那麼可操作圖21的電路執行這種噪聲消除，其中，輸入給噪聲消除濾波器的輸入將構成「以前像素」，(像素)延遲器210的輸出將是「當前像素」，而(像素)延遲器211的輸出將是「後續像素」。由此，利用本發明也可以消除在垂直方向上發生的「拖尾」。
在結合最佳實施例對本發明作了具體的表示和敘述以後，對於本專業技術領域以內的普通技術人員來講易於理解，在不脫離本發明精神和範圍的前提下可對本發明作出各種修改。例如，雖然已描述過的噪聲消除濾波器是利用與噪聲像素垂直或水平相鄰的像素，但本發明並不局限於與噪聲像素相鄰的像素，而是可以利用各種其它像素值來判斷噪聲像素是否應改變為背景電平像素。例如，可以使用在噪聲像素以上的若干垂直相鄰像素的值和該噪聲像素以下的若干垂直相鄰像素的值，關於水平相鄰像素，與此類似。
作為另外一個例子，雖然本說明書的描述是針對數字視頻信號，本發明並不僅僅局限於這種類型的信號，而可廣泛地應用於從視頻信號的各種其它類型的字幕數據中消除噪聲。
另外，雖然這裡的噪聲是按照像素值小於4或者小於背景像素電平所描述的，也可以用其它的電平。
因此，希望所附權利要求書被理解為包括本說明書描述的實施例、上述替換方案以及所有與其等效的內容。
權利要求
1.一種用於對包括有字幕數據的數字視頻數據進行編碼的裝置，包括用於接收字幕數據的裝置，所述字幕數據表示具有多個像素的一個字幕；用於根據所述字幕各個像素和與所述各個像素相鄰的多個像素之間的相關性從所述字幕數據中消除噪聲的裝置；和用於對所述數字視頻數據和其中已經消除了噪聲的所述字幕數據一起進行編碼的裝置。
2.如權利要求1的裝置，其中，所述用於消除的裝置包括用於確定所述各個像素是否是噪聲像素的裝置和用於當相鄰像素是背景電平像素時把所述噪聲像素改變成背景電平像素的裝置。
3.如權利要求2的裝置，其中，當所述各像素的值小於與背景電平相對應的一個值時，用於確定的所述裝置工作以確定所述各像素是噪聲像素。
4.如權利要求2的裝置，其中，當與所述噪聲像素相鄰並垂直校直的多個像素是背景電平像素時，所述用於改變的裝置工作以把所述噪聲像素改變成背景電平像素。
5.如權利要求2的裝置，其中，當與所述噪聲像素相鄰並水平校直的像素是背景電平像素時，所述用於改變的裝置工作以把所述的噪聲像素改變成背景電平像素。
6.如權利要求1的裝置，其中，用於接收的所述裝置連續接收字幕數據的水平行，其中的每個水平行表示所述字幕的像素的各自水平行；和所述用於消除的裝置包括第一延遲裝置，用於延遲所接收的字幕數據的水平行以產生字幕數據的第一延遲行；第二延遲裝置，用於延遲字幕數據的所述第一延遲行以產生字幕數據的第二延遲行；以及一裝置，用於當所述每個像素具有小於背景電平值的像素值並且在所接收的水平行和第二延遲行中與所述每個像素相應的多個像素具有等於背景電平值的像素值時，把在第一延遲行中每個像素的像素值改變成背景電平值。
7.如權利要求1的裝置，還包括用於量化所接收字幕數據的一個裝置，且其中所述用於消除噪聲的裝置可操作從量化後的字幕數據中消除噪聲。
8.一種用於對其中包括有字幕數據的數字視頻數據進行解碼的裝置，包括用於接收所述包括字幕數據的數字視頻數據的裝置，所述字幕數據代表具有多個像素的字幕；用於從所接收的數字視頻數據中提取所述字幕數據的裝置，用於根據所述字幕各像素和與所述各像素相鄰的像素之間的相關性從所提取的字幕數據中消除噪聲的裝置；和用於把由已經消除噪聲的所述字幕數據表示的所述字幕疊加到由所述數字視頻數據表示的一個視頻圖像上的裝置。
9.如權利要求8的裝置，其中所述用於消除的裝置包括用於確定所述各像素是否是噪聲像素的裝置，以及用於當相鄰像素是背景電平像素時把所述噪聲像素變成背景電平像素的裝置。
10.如權利要求9的裝置，其中用於確定的所述裝置工作以當所述各像素值低於與背景電平相對應的值時，確定所述各像素是噪聲像素。
11.如權利要求9的裝置，其中，用於改變的所述裝置進行工作以當與所述噪聲像素相鄰並垂直校直的像素是背景電平像素時，把所述的噪聲像素改變成背景電平像素。
12.如權利要求9的裝置，其中，用於改變的所述裝置當與所述噪聲像素相鄰並水平校直的像素是背景電平像素時，用於把所述的噪聲像素改變成背景電平像素。
13.如權利要求8的裝置，其中，用於接收的所述裝置連續接收字幕數據的水平行，其中的每一行代表所述字幕像素的各水平行；且所述用於消除的裝置包括第一延遲裝置和第二延遲裝置，所述第一延遲裝置用於延遲字幕數據的一個所接收的水平行以產生字幕數據的第一延遲行，所述第二延遲裝置用於延遲字幕數據的所述第一延遲行以產生字幕數據的第二延遲行；還包括一個裝置，用於當所述每個像素的像素值小於背景電平值並且在所接收的水平行及第二延遲行中與所述每個像素對應的像素的像素值等於背景電平值時，將第一延遲行中每個像素的像素值改變成背景電平值。
14.一種用於對包括字幕數據的數字視頻數據進行編碼的方法，包括如下步驟接收表示具有多個像素的一個字幕的字幕數據；根據所述字幕各像素和與所述各像素相鄰的像素之間的相關性，從所述字幕數據中消除噪聲；和對所述數字視頻數據和其中已經消除了噪聲的所述字幕數據一起進行編碼。
15.如權利要求14的方法，其中，用於消除的所述步驟包括確定所述各像素是否是噪聲像素並且當相鄰像素是背景電平像素時將所述噪聲像素改變成背景電平像素的步驟。
16.如權利要求15的方法，其中，所述用於確定的步驟是當所述各像素的值小於與背景電平相應的值時，通過確定所述各像素是噪聲像素而執行的。
17.如權利要求15的方法，其中，所述用於改變的步驟是當與所述噪聲像素相鄰並垂直校直的像素是背景電平像素時，通過把所述的噪聲像素改變成背景電平像素而執行的。
18.如權利要求15的方法，其中，所述用於改變的步驟是當與所述噪聲像素相鄰並水平校直的像素是背景電平像素時，通過將所述噪聲像素改變成背景電平像素而執行的。
19.如權利要求14的方法，其中，所述用於接收的步驟是通過連續地接收字幕數據的水平行而執行的，每一個水平行代表所述字幕的像素的各水平行；且所述用於消除的步驟包括如下步驟延遲所接收的字幕數據的水平行以產生字幕數據的第一延遲行，延遲字幕數據的所述第一延遲行以產生字幕數據的第二延遲行，和當所述每個像素的像素值小於背景電平值且在所接收的水平行和第二延遲行中與所述每個像素相對應的多個像素的像素值等於背景電平值時，把在第一延遲行中每個像素的像素值改變成背景電平值。
20.如權利要求14的方法，還包括量化所接收的字幕數據的步驟；其中，所述消除的步驟是通過從量化後的字幕數據中消除噪聲而執行的。
21.一種用於對其中包括有字幕數據的數字視頻數據進行解碼的方法，包括如下步驟接收包括有表示具有多個像素的一個字幕的字幕數據的所述數字視頻數據；從所接收的數字視頻數據中提取所述字幕數據；根據所述字幕各像素和與所述各像素相鄰的像素之間的相關性，從所提取的字幕數據中消除噪聲；和將由其中已經消除了噪聲的字幕數據所表示的所述字幕疊加到由所述數字視頻數據所表示的一個視頻圖像上。
22.如權利要求21的方法，其中，所述用於消除的步驟包括確定所述各像素是否是噪聲像素、並且當相鄰像素是背景電平像素時將所述噪聲像素改變成背景電平像素的步驟。
23.如權利要求22的方法，其中，所述用於確定的步驟是當所述各像素的值小於與背景電平相對應的值時，通過確定所述各像素是噪聲像素而執行的。
24.如權利要求22的方法，其中所述用於改變的步驟是當與所述噪聲像素相鄰並垂直校直的像素是背景電平像素時，通過把所述噪聲像素改變成背景電平像素而執行的。
25.如權利要求22的方法，其中所述用於改變的步驟是當與所述噪聲像素相鄰並水平校直的像素是背景電平像素時，通過把所述的噪聲像素改變成背景電平像素而執行的。
26.如權利要求21的方法，其中，所述用於接收的步驟是通過連續地接收字幕數據的水平行而執行的；每個水平行代表所述字幕的像素的各自水平行，且所述用於消除的步驟包括如下步驟延遲所接收的字幕數據的水平行以產生字幕數據的第一延遲行；延遲字幕數據的所述第一延遲行以產生字幕數據的第二延遲行；和當所述每個像素的像素值小於背景電平值且在所接收的水平行和第二延遲行中與所述每個像素對應像素的像素值等於背景電平值時，將在第一延遲中的每個像素的像素值改變成背景電平值。
27.一種用於從代表具有多個像素的一個字幕的字幕數據中消除噪聲的裝置，包括用於斷定所述字幕中的各像素是否是噪聲像素的裝置；用於確定與所述字幕中各像素相鄰的像素是否是背景電平像素的裝置；和一裝置，用於當所述用於斷定的裝置斷定所述各像素是噪聲像素和所述用於確定的裝置確定相鄰的像素是背景電平像素時將表示所述各像素的字幕數據改變成表示背景電平像素的背景電平。
28.如權利要求27的裝置，其中所述用於斷定的裝置工作以當表示所述各像素的字幕數據小於所述背景電平時，斷定所述的各像素是噪聲像素。
29.如權利要求27的裝置，其中所述用於確定的裝置工作以確定在所述字幕中與所述各像素相鄰並垂直校直的多個像素是否是背景電平像素。
30.一種用於從表示具有多個像素的一個字幕的標題數據中消除噪聲的方法，包括如下步驟斷定在所述字幕中的各像素是否是噪聲像素；確定與所述字幕中所述各像素相鄰的像素是否是背景電平像素；和當所述各像素被斷定為是噪聲像素且相鄰像素被確定是背景電平像素時，將表示所述各像素的字幕數據變成表示背景電平像素的背景電平。
31.如權利要求30的方法，其中，所述用於斷定的步驟是當表示所述各像素的字幕數據小於所述背景電平時，通過斷定所述的各像素是噪聲像素而執行的。
32.如權利要求30的方法，其中，所述用於確定的步驟是通過確定與所述字幕中所述各像素相鄰並垂直校直的像素是否是背景電平像素而執行的。
全文摘要
一種用於對其中包括有字幕數據的數字視頻數據進行編碼和解碼的裝置和方法，利用由字幕數據表示的字幕的像素與該字幕的相鄰像素之間的相關性從該字幕數據中消除噪聲。特別是，當與噪聲像素相鄰並垂直或水平校直的像素是背景電平像素時，表示字幕中噪聲的字幕像素被改變成背景電平像素。在數字視頻數據解碼期間，由已經消除了噪聲的字幕數據表示的字幕被疊加到由該數字視頻數據表示的視頻圖像上。
文檔編號H04N5/445GK1148770SQ96112149
公開日1997年4月30日申請日期1996年8月4日優先權日1995年8月4日
發明者越鬱夫申請人:索尼公司

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

消除字幕數據噪聲的數字視頻數據編碼和解碼裝置及方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法