字幕翻譯引擎的製作方法
2023-05-15 03:25:46 1
專利名稱:字幕翻譯引擎的製作方法
技術領域:
本發明涉及字幕翻譯引擎。
背景技術:
諸如視頻回放機器和計算機的現代電子系統,通常採用只讀光碟(CDROM)介質或DVD介質來存儲大量的數據,例如視頻或音頻數據。在本說明書的其餘部分,縮寫CDROM和DVD將組合到一起,而共同稱為DVD,因為本公開的主題相同地適用於這兩種系統。
DVD是受歡迎的視頻盒式磁帶替代品。DVD相對於視頻盒式磁帶的一個特殊優點是DVD允許在回放期間打開或關閉字幕。而且,DVD可以具有用字幕在電影中進行疊加的多達32個子畫面流。但是,一些語言在DVD上不可用,因為電影製片廠沒有製作。這意味著某些國家的消費者不能以他們的母語來充分欣賞電影。作為替代,消費者嘗試理解外語電影。
DVD電影存儲在DVD盤上標為「VIDEO_TS」的子目錄下的視頻對象文件(VOB文件)。VOB文件是基本的MPEG-2系統流。每個VOB文件是包含復用的MPEG-2視頻、音頻和子畫面(SPC)流的文件。VOB文件一般包含復用的杜比數字音頻和MPEG-2視頻。
字幕被直接編碼到DVD位流自身中,並通常被用戶從DVD菜單來選擇顯示,這與需要外置解碼器的隱藏字幕(Closed Caption)相反。有兩種硬編碼的字幕,開式和閉式的。開式字幕被沒有選擇地播出。也就是說,字幕出現在屏幕上,並且無法通過關閉DVD播放器中的字幕選項來消除。相反,閉式字幕可以通過DVD菜單或遙控設備來打開或者關閉,因此是可以消除的。大多數DVD和一些雷射盤都只使用閉式字幕。
VOB文件中的SPC流通常對應於電影的字幕。SPC流是具有壓縮字幕位流的格式化MPEG流。SPC流包含演示戳(Presentation Stamps,PTS)以及流標識和子流標識,類似於音頻流。在最終的復用期間,該SPC流與視頻和音頻流合併,以形成新的VOB流。SPC流疊加在主視頻流(電影)之上,並可以被打開或關閉。
DVD字幕並不記錄到TV畫面的可視部分中,而是作為單獨的視頻條、圖像或畫面文件而存儲在SPC流中。回放時這些圖像就被混和到電影中。優點是DVD播放器不需要字符生成器來反映這些圖像。而且,字幕的文字總是保持按發行者所希望的相同格式。缺點是這些圖像比純文本文件佔用稍多一些的空間。在有字幕的回放期間,DVD播放器讀取並解碼來自SPC流的字幕並將這些字幕疊加在TV畫面上。
發明內容
在第一優選方面,提供了一種字幕翻譯引擎,用於將來自視頻源的字幕內容翻譯成另一種語言,所述引擎包括字幕提取器,用於從所述視頻源提取第一語言的字幕內容;和翻譯模塊,用於通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
所述視頻源可以是數字多功能光碟(DVD)、超級視頻光碟格式(SVCD)的,或者是其中視頻內容和字幕作為單獨實體存儲的任何格式的。
所述語言詞典可以是查詢表和資料庫中的一種。所述語言詞典能夠被更新。所述語言詞典被用於在多於兩種語言之間的翻譯。所述引擎可以提供用戶接口以允許選擇第二語言。
所述字幕提取器包括光學字符識別(OCR)引擎,所述光學字符識別引擎將圖像格式的字幕內容轉換成文本格式。
所述翻譯模塊在詞對詞或者短語對短語的基礎上翻譯文字。好處在於,因為在上下文中而非孤立地來翻譯更多的文字,所以翻譯變得更準確。
所述第一語言可以是英語、法語、西班牙語、義大利語或者德語中的任何一種。所述第二語言可以是漢語(繁體或簡體字)、日語、朝鮮語、泰語、俄語或者阿拉伯語中的任何一種。
所述字幕翻譯引擎可以是獨立單元,並可以與數字多功能光碟播放器和電視屏幕連接以分別輸入和輸出。
所述字幕翻譯引擎可以包括在數字多功能光碟播放器中,或者作為軟體程序安裝到標準的桌面計算機上。
所述字幕翻譯引擎還可以包括畫面格式確定模塊,用於確定所述視頻源的視頻格式。
在第二方面中,提供了一種方法,用於將來自視頻源的字幕內容翻譯成另一種語言,所述方法包括以下步驟從所述視頻源提取第一語言的字幕內容;以及通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
在第三方面中,提供了一種電腦程式產品,包括用於承載計算機可執行指令的計算機可讀介質,所述計算機可執行指令用於執行所述方法。
在第四方面中,提供了一種經翻譯的字幕流,由所述方法所產生。
在第五方面中,提供了一種視頻流,包括與所述的經翻譯的字幕流復用的運動圖象專家組-2(MPEG-2)視頻流。
現在將參考附圖來描述本發明的例子,所述附圖中圖1是包括根據本發明的字幕翻譯引擎的家庭娛樂系統的框圖;以及圖2是將來自視頻源的字幕內容翻譯成另一種語言的流程圖。
具體實施例方式
參考圖1,字幕翻譯引擎20是包括在典型的家庭娛樂系統10中的獨立單元20。字幕翻譯引擎20將來自DVD電影的字幕內容翻譯成該DVD上沒有的另一種語言。家庭娛樂系統10包括DVD播放器11、諸如電視或監視器12的顯示單元、高保真單元13和揚聲器14。字幕翻譯引擎20連接到DVD播放器11的輸出端和電視12的輸入端。
字幕翻譯引擎20包括字幕提取模塊21和翻譯模塊22。還提供了畫面格式檢測器(未示出),以初始確定視頻格式是DVD,還是對於翻譯可兼容的另一種視頻格式。
參考圖2,在已經檢測(51)到兼容的視頻格式之後,字幕提取模塊21從DVD提取(52)第一語言的字幕內容,例如英語。字幕是從DVD播放器11的SPC流在其與視頻和音頻流復用之前提取的,並被字幕提取模塊21捕捉到。或者,DVD播放器的視頻輸出被解復用成其組成流,並且SPC流被字幕提取模塊21捕捉到。字幕提取模塊21具有光學字符識別(OCR)引擎(未示出),來將圖像格式的字幕內容轉換(53)成文本格式,也就是將嵌在圖像中的文字轉換成ASCII文本。一旦進行了OCR,並且所提取的字幕是文本格式的,那就將其傳遞(54)到翻譯模塊22,以將此英語字幕翻譯成含義相同的例如漢語的第二語言。為了改進OCR過程,預定義了各種字幕顯示風格,並將已預先調整的OCR例程包括在OCR引擎中。
在翻譯模塊22中,使用英語字幕文本作為輸入來在語言詞典上進行查詢。在此例子中,詞典(未示出)是電子英漢詞典,並包含詞對詞的翻譯(56)以及短語對短語的翻譯(55)。如果英語的短語在詞典中不能得到漢語同義語的確定的匹配(57),則對短語進行詞對詞的翻譯。英語字幕被逐漸翻譯成漢語,直到已經將所有可能的英語單詞翻譯(58)成漢語同義語。詞典可以被用戶更新或替換,如果有更新的版本可用的話。詞典經由網際網路下載或者從可安裝的CD-ROM盤來更新。例如在網際網路上的詞典的中央拷貝,可以由一組人員來提供和維護,以提高其準確性或者增強該詞典的短語對短語的能力。
在已經從英語字幕生成漢語字幕之後,生成(59)替代的SPC流以與視頻流復用(60),並輸出(61)到電視12的視頻輸入端。在電影回放期間以漢語輸出所提取的字幕內容,其中來自該字幕翻譯過程的延遲很小或者沒有。對由字幕翻譯引擎20提取的下一個字幕重複此過程本身。
在用戶選擇了要顯示的字幕的語言之後,將字幕從一種語言翻譯到DVD上沒有的另一種語言,對用戶是無縫和透明的。
本發明可以應用到SVCD。SVCD視頻格式疊加了字幕圖形。SVCD視頻流包含多達四個用於不同語言的獨立字幕通道。字幕被實時疊加在視頻圖像之上,並提供在獨立的軌上,它們可以按需要被打開和關閉。
雖然已經參考DVD和SVCD格式描述了本發明,但可以想到分開存儲視頻內容和字幕的其他視頻格式也是可能的。
雖然已經參考獨立單元20描述了本發明,但可以想到安裝有軟體來執行所描述的翻譯方法的標準計算機也是可能的。還可以想到可以改進標準的DVD播放器來進行所描述的翻譯方法。
本領域技術人員將認識到,可以對具體實施例中所示的本發明進行很多改變和/或改進,而不偏離廣泛描述的本發明的範圍和技術構思。因此,這些實施例應在所有方面都認為是說明性的,而非限制性的。
權利要求
1.一種字幕翻譯引擎,用於將來自視頻源的字幕內容翻譯成另一種語言,所述引擎包括字幕提取器,用於從所述視頻源提取第一語言的字幕內容;和翻譯模塊,用於通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
2.如權利要求1所述的引擎,其中所述視頻源是數字多功能光碟、超級視頻光碟格式的,或者是其中視頻內容和字幕作為單獨實體存儲的任何格式的。
3.如權利要求1所述的引擎,其中所述語言詞典是查詢表和資料庫中的一種。
4.如權利要求3所述的引擎,其中所述語言詞典能夠被更新。
5.如權利要求3所述的引擎,其中所述語言詞典被用於在多於兩種語言之間的翻譯。
6.如權利要求1所述的引擎,其中所述字幕提取器包括光學字符識別引擎,以將圖像格式的字幕內容轉換成文本格式。
7.如權利要求1所述的引擎,其中所述翻譯模塊在詞對詞或者短語對短語的基礎上翻譯文字。
8.如權利要求1所述的引擎,其中所述第一語言是英語、法語、西班牙語、義大利語或者德語中的任何一種。
9.如權利要求1所述的引擎,其中所述第二語言是漢語(繁體或簡體字)、日語、朝鮮語、泰語、俄語或者阿拉伯語中的任何一種。
10.如權利要求1所述的引擎,其中所述字幕翻譯引擎是獨立單元,用於與數字多功能光碟播放器和電視屏幕連接以分別輸入和輸出。
11.如權利要求1到9中任何一個所述的引擎,其中所述字幕翻譯引擎包括在數字多功能光碟播放器中。
12.如權利要求1到9中任何一個所述的引擎,其中所述字幕翻譯引擎是將要安裝到計算機上的軟體程序。
13.如權利要求1所述的引擎,還包括畫面格式確定模塊,用於確定所述視頻源的視頻格式。
14.一種方法,用於將來自視頻源的字幕內容翻譯成另一種語言,所述方法包括以下步驟從所述視頻源提取第一語言的字幕內容;以及通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
15.如權利要求14所述的方法,包括初始步驟,在所述初始步驟中檢測所述視頻源的視頻格式以確定所述視頻源對於翻譯是否是可兼容的。
16.如權利要求14所述的方法,其中所述視頻源是數字多功能光碟、超級視頻光碟格式的,或者是其中視頻內容和字幕作為單獨實體存儲的任何格式的。
17.如權利要求14所述的方法,其中所述語言詞典是查詢表和資料庫中的一種。
18.如權利要求17所述的方法,其中所述語言詞典能夠被更新。
19.如權利要求17所述的方法,其中所述語言詞典被用於在多於兩種語言之間的翻譯。
20.如權利要求14所述的方法,其中提供了光學字符識別引擎,用以將圖像格式的字幕內容轉換成文本格式。
21.如權利要求14所述的方法,其中在詞對詞或者短語對短語的基礎上翻譯所述被提取字幕內容的文字。
22.如權利要求14所述的方法,其中所述第一語言是英語、法語、西班牙語、義大利語或者德語中的任何一種。
23.如權利要求14所述的方法,其中所述第二語言是漢語(繁體或簡體字)、日語、朝鮮語、泰語、俄語或者阿拉伯語中的任何一種。
24.一種電腦程式產品,包括用於承載計算機可執行指令的計算機可讀介質,所述計算機可執行指令用於執行如權利要求14所述的方法。
25.一種經翻譯的字幕流,由如權利要求14所述的方法所產生。
26.一種視頻流,包括與如權利要求25所述的經翻譯的字幕流復用的運動圖象專家組-2視頻流。
全文摘要
本發明公開了一種字幕翻譯引擎(20),用於將來自視頻源的字幕內容翻譯成另一種語言,所述引擎(20)包括字幕提取器(21),用於從所述視頻源提取第一語言的字幕內容;和翻譯模塊(22),用於通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
文檔編號G09B19/06GK1697515SQ200410038308
公開日2005年11月16日 申請日期2004年5月14日 優先權日2004年5月14日
發明者萬康, 劉志傑 申請人:創新科技有限公司