新四季網

字幕翻譯引擎的製作方法

2023-05-15 03:25:46

專利名稱:字幕翻譯引擎的製作方法
技術領域:
本發明涉及字幕翻譯引擎。
背景技術:
諸如視頻回放機器和計算機的現代電子系統,通常採用只讀光碟(CDROM)介質或DVD介質來存儲大量的數據,例如視頻或音頻數據。在本說明書的其餘部分,縮寫CDROM和DVD將組合到一起,而共同稱為DVD,因為本公開的主題相同地適用於這兩種系統。
DVD是受歡迎的視頻盒式磁帶替代品。DVD相對於視頻盒式磁帶的一個特殊優點是DVD允許在回放期間打開或關閉字幕。而且,DVD可以具有用字幕在電影中進行疊加的多達32個子畫面流。但是,一些語言在DVD上不可用,因為電影製片廠沒有製作。這意味著某些國家的消費者不能以他們的母語來充分欣賞電影。作為替代,消費者嘗試理解外語電影。
DVD電影存儲在DVD盤上標為「VIDEO_TS」的子目錄下的視頻對象文件(VOB文件)。VOB文件是基本的MPEG-2系統流。每個VOB文件是包含復用的MPEG-2視頻、音頻和子畫面(SPC)流的文件。VOB文件一般包含復用的杜比數字音頻和MPEG-2視頻。
字幕被直接編碼到DVD位流自身中,並通常被用戶從DVD菜單來選擇顯示,這與需要外置解碼器的隱藏字幕(Closed Caption)相反。有兩種硬編碼的字幕,開式和閉式的。開式字幕被沒有選擇地播出。也就是說,字幕出現在屏幕上,並且無法通過關閉DVD播放器中的字幕選項來消除。相反,閉式字幕可以通過DVD菜單或遙控設備來打開或者關閉,因此是可以消除的。大多數DVD和一些雷射盤都只使用閉式字幕。
VOB文件中的SPC流通常對應於電影的字幕。SPC流是具有壓縮字幕位流的格式化MPEG流。SPC流包含演示戳(Presentation Stamps,PTS)以及流標識和子流標識,類似於音頻流。在最終的復用期間,該SPC流與視頻和音頻流合併,以形成新的VOB流。SPC流疊加在主視頻流(電影)之上,並可以被打開或關閉。
DVD字幕並不記錄到TV畫面的可視部分中,而是作為單獨的視頻條、圖像或畫面文件而存儲在SPC流中。回放時這些圖像就被混和到電影中。優點是DVD播放器不需要字符生成器來反映這些圖像。而且,字幕的文字總是保持按發行者所希望的相同格式。缺點是這些圖像比純文本文件佔用稍多一些的空間。在有字幕的回放期間,DVD播放器讀取並解碼來自SPC流的字幕並將這些字幕疊加在TV畫面上。

發明內容
在第一優選方面,提供了一種字幕翻譯引擎,用於將來自視頻源的字幕內容翻譯成另一種語言,所述引擎包括字幕提取器,用於從所述視頻源提取第一語言的字幕內容;和翻譯模塊,用於通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
所述視頻源可以是數字多功能光碟(DVD)、超級視頻光碟格式(SVCD)的,或者是其中視頻內容和字幕作為單獨實體存儲的任何格式的。
所述語言詞典可以是查詢表和資料庫中的一種。所述語言詞典能夠被更新。所述語言詞典被用於在多於兩種語言之間的翻譯。所述引擎可以提供用戶接口以允許選擇第二語言。
所述字幕提取器包括光學字符識別(OCR)引擎,所述光學字符識別引擎將圖像格式的字幕內容轉換成文本格式。
所述翻譯模塊在詞對詞或者短語對短語的基礎上翻譯文字。好處在於,因為在上下文中而非孤立地來翻譯更多的文字,所以翻譯變得更準確。
所述第一語言可以是英語、法語、西班牙語、義大利語或者德語中的任何一種。所述第二語言可以是漢語(繁體或簡體字)、日語、朝鮮語、泰語、俄語或者阿拉伯語中的任何一種。
所述字幕翻譯引擎可以是獨立單元,並可以與數字多功能光碟播放器和電視屏幕連接以分別輸入和輸出。
所述字幕翻譯引擎可以包括在數字多功能光碟播放器中,或者作為軟體程序安裝到標準的桌面計算機上。
所述字幕翻譯引擎還可以包括畫面格式確定模塊,用於確定所述視頻源的視頻格式。
在第二方面中,提供了一種方法,用於將來自視頻源的字幕內容翻譯成另一種語言,所述方法包括以下步驟從所述視頻源提取第一語言的字幕內容;以及通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
在第三方面中,提供了一種電腦程式產品,包括用於承載計算機可執行指令的計算機可讀介質,所述計算機可執行指令用於執行所述方法。
在第四方面中,提供了一種經翻譯的字幕流,由所述方法所產生。
在第五方面中,提供了一種視頻流,包括與所述的經翻譯的字幕流復用的運動圖象專家組-2(MPEG-2)視頻流。


現在將參考附圖來描述本發明的例子,所述附圖中圖1是包括根據本發明的字幕翻譯引擎的家庭娛樂系統的框圖;以及圖2是將來自視頻源的字幕內容翻譯成另一種語言的流程圖。
具體實施例方式
參考圖1,字幕翻譯引擎20是包括在典型的家庭娛樂系統10中的獨立單元20。字幕翻譯引擎20將來自DVD電影的字幕內容翻譯成該DVD上沒有的另一種語言。家庭娛樂系統10包括DVD播放器11、諸如電視或監視器12的顯示單元、高保真單元13和揚聲器14。字幕翻譯引擎20連接到DVD播放器11的輸出端和電視12的輸入端。
字幕翻譯引擎20包括字幕提取模塊21和翻譯模塊22。還提供了畫面格式檢測器(未示出),以初始確定視頻格式是DVD,還是對於翻譯可兼容的另一種視頻格式。
參考圖2,在已經檢測(51)到兼容的視頻格式之後,字幕提取模塊21從DVD提取(52)第一語言的字幕內容,例如英語。字幕是從DVD播放器11的SPC流在其與視頻和音頻流復用之前提取的,並被字幕提取模塊21捕捉到。或者,DVD播放器的視頻輸出被解復用成其組成流,並且SPC流被字幕提取模塊21捕捉到。字幕提取模塊21具有光學字符識別(OCR)引擎(未示出),來將圖像格式的字幕內容轉換(53)成文本格式,也就是將嵌在圖像中的文字轉換成ASCII文本。一旦進行了OCR,並且所提取的字幕是文本格式的,那就將其傳遞(54)到翻譯模塊22,以將此英語字幕翻譯成含義相同的例如漢語的第二語言。為了改進OCR過程,預定義了各種字幕顯示風格,並將已預先調整的OCR例程包括在OCR引擎中。
在翻譯模塊22中,使用英語字幕文本作為輸入來在語言詞典上進行查詢。在此例子中,詞典(未示出)是電子英漢詞典,並包含詞對詞的翻譯(56)以及短語對短語的翻譯(55)。如果英語的短語在詞典中不能得到漢語同義語的確定的匹配(57),則對短語進行詞對詞的翻譯。英語字幕被逐漸翻譯成漢語,直到已經將所有可能的英語單詞翻譯(58)成漢語同義語。詞典可以被用戶更新或替換,如果有更新的版本可用的話。詞典經由網際網路下載或者從可安裝的CD-ROM盤來更新。例如在網際網路上的詞典的中央拷貝,可以由一組人員來提供和維護,以提高其準確性或者增強該詞典的短語對短語的能力。
在已經從英語字幕生成漢語字幕之後,生成(59)替代的SPC流以與視頻流復用(60),並輸出(61)到電視12的視頻輸入端。在電影回放期間以漢語輸出所提取的字幕內容,其中來自該字幕翻譯過程的延遲很小或者沒有。對由字幕翻譯引擎20提取的下一個字幕重複此過程本身。
在用戶選擇了要顯示的字幕的語言之後,將字幕從一種語言翻譯到DVD上沒有的另一種語言,對用戶是無縫和透明的。
本發明可以應用到SVCD。SVCD視頻格式疊加了字幕圖形。SVCD視頻流包含多達四個用於不同語言的獨立字幕通道。字幕被實時疊加在視頻圖像之上,並提供在獨立的軌上,它們可以按需要被打開和關閉。
雖然已經參考DVD和SVCD格式描述了本發明,但可以想到分開存儲視頻內容和字幕的其他視頻格式也是可能的。
雖然已經參考獨立單元20描述了本發明,但可以想到安裝有軟體來執行所描述的翻譯方法的標準計算機也是可能的。還可以想到可以改進標準的DVD播放器來進行所描述的翻譯方法。
本領域技術人員將認識到,可以對具體實施例中所示的本發明進行很多改變和/或改進,而不偏離廣泛描述的本發明的範圍和技術構思。因此,這些實施例應在所有方面都認為是說明性的,而非限制性的。
權利要求
1.一種字幕翻譯引擎,用於將來自視頻源的字幕內容翻譯成另一種語言,所述引擎包括字幕提取器,用於從所述視頻源提取第一語言的字幕內容;和翻譯模塊,用於通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
2.如權利要求1所述的引擎,其中所述視頻源是數字多功能光碟、超級視頻光碟格式的,或者是其中視頻內容和字幕作為單獨實體存儲的任何格式的。
3.如權利要求1所述的引擎,其中所述語言詞典是查詢表和資料庫中的一種。
4.如權利要求3所述的引擎,其中所述語言詞典能夠被更新。
5.如權利要求3所述的引擎,其中所述語言詞典被用於在多於兩種語言之間的翻譯。
6.如權利要求1所述的引擎,其中所述字幕提取器包括光學字符識別引擎,以將圖像格式的字幕內容轉換成文本格式。
7.如權利要求1所述的引擎,其中所述翻譯模塊在詞對詞或者短語對短語的基礎上翻譯文字。
8.如權利要求1所述的引擎,其中所述第一語言是英語、法語、西班牙語、義大利語或者德語中的任何一種。
9.如權利要求1所述的引擎,其中所述第二語言是漢語(繁體或簡體字)、日語、朝鮮語、泰語、俄語或者阿拉伯語中的任何一種。
10.如權利要求1所述的引擎,其中所述字幕翻譯引擎是獨立單元,用於與數字多功能光碟播放器和電視屏幕連接以分別輸入和輸出。
11.如權利要求1到9中任何一個所述的引擎,其中所述字幕翻譯引擎包括在數字多功能光碟播放器中。
12.如權利要求1到9中任何一個所述的引擎,其中所述字幕翻譯引擎是將要安裝到計算機上的軟體程序。
13.如權利要求1所述的引擎,還包括畫面格式確定模塊,用於確定所述視頻源的視頻格式。
14.一種方法,用於將來自視頻源的字幕內容翻譯成另一種語言,所述方法包括以下步驟從所述視頻源提取第一語言的字幕內容;以及通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
15.如權利要求14所述的方法,包括初始步驟,在所述初始步驟中檢測所述視頻源的視頻格式以確定所述視頻源對於翻譯是否是可兼容的。
16.如權利要求14所述的方法,其中所述視頻源是數字多功能光碟、超級視頻光碟格式的,或者是其中視頻內容和字幕作為單獨實體存儲的任何格式的。
17.如權利要求14所述的方法,其中所述語言詞典是查詢表和資料庫中的一種。
18.如權利要求17所述的方法,其中所述語言詞典能夠被更新。
19.如權利要求17所述的方法,其中所述語言詞典被用於在多於兩種語言之間的翻譯。
20.如權利要求14所述的方法,其中提供了光學字符識別引擎,用以將圖像格式的字幕內容轉換成文本格式。
21.如權利要求14所述的方法,其中在詞對詞或者短語對短語的基礎上翻譯所述被提取字幕內容的文字。
22.如權利要求14所述的方法,其中所述第一語言是英語、法語、西班牙語、義大利語或者德語中的任何一種。
23.如權利要求14所述的方法,其中所述第二語言是漢語(繁體或簡體字)、日語、朝鮮語、泰語、俄語或者阿拉伯語中的任何一種。
24.一種電腦程式產品,包括用於承載計算機可執行指令的計算機可讀介質,所述計算機可執行指令用於執行如權利要求14所述的方法。
25.一種經翻譯的字幕流,由如權利要求14所述的方法所產生。
26.一種視頻流,包括與如權利要求25所述的經翻譯的字幕流復用的運動圖象專家組-2視頻流。
全文摘要
本發明公開了一種字幕翻譯引擎(20),用於將來自視頻源的字幕內容翻譯成另一種語言,所述引擎(20)包括字幕提取器(21),用於從所述視頻源提取第一語言的字幕內容;和翻譯模塊(22),用於通過在語言詞典上進行查詢,而將所述第一語言的所述被提取的字幕內容的文字翻譯成有相同含義的第二語言;其中,在回放所述視頻期間,以所述第二語言輸出所述被提取的字幕內容。
文檔編號G09B19/06GK1697515SQ200410038308
公開日2005年11月16日 申請日期2004年5月14日 優先權日2004年5月14日
發明者萬康, 劉志傑 申請人:創新科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀