生成帶有浮動標題的視頻內容的設備的製作方法
2023-06-12 14:11:26 1
專利名稱:生成帶有浮動標題的視頻內容的設備的製作方法
背景技術:
發明領域本發明涉及電視內容生成裝置、發送裝置、回放裝置、提供系統和所使用的數據結構與記錄媒體。更具體地說,本發明涉及生成、發送、回放和提供帶字幕電視內容的裝置與系統及其所應用的數據結構與記錄媒體。
背景技術:
說明通常,為便於理解外語影片的內容,一般把片中角色對話譯成觀眾的母語。在屏幕內沿用母語文本顯示譯文。這樣,即便角色用外語講,但觀眾完全理解對話。近年來,舉一例電視廣播的管理技術,即使角色講觀眾的母語時,仍在屏幕內沿示出角色間的對話原文。另為了描繪場景,屏內沿會示出不是角色對話的原文。屏內沿示出的這類文本都稱為字幕。顯示在圖像上的這類字幕能幫助觀眾理解電視中角色間的對話,還能明白電視內容。
近年來,為便於理解屏上講話者與字幕的關係,提出了各種方案,如女士講話字幕著色成暖色調,男士講話字幕為冷色調。在另一例中,字幕均配上講話者姓名。
在又一例中,為增強在視覺上理解屏上講話者與字幕的關係,字幕放在講話者嘴邊(參照日本國立相PCT待公開報No.9-505671)。該公報揭示的裝置以三維方式計算講話者在屏上的位置、講話者嘴的位置和講話者身體的定向。而且,該裝置還以三維方式計算講話者在屏上講話的朝向,讓二維平面上的講話方向成為一條顯示講話原文的基準線。
一般,即使有字幕,觀眾也要求發出話音,因而根據話音特徵,如音調的高或低,就能知道講話者是誰。因此,在用普通字幕而完全沒有話音時,觀眾就確定不了屏上誰在講話,當屏上同時出現多個講話者時,尤其成問題。
另在常規技術中,可通過改變文本顏色來指示講話者,但這僅是向觀眾提示誰在講話。沒有話音,觀眾不能完全肯定誰在講話。
另外,顯示講話人姓名也能指明誰在講話,但該技術有很大缺點,如字幕字數增多了。
還有,上述公報揭示的從講話者嘴邊沿基準線顯示字幕的方案也有問題,如字幕文本會遮蓋非講話者角色的臉部或重要的結果。
因而在使用字幕的常規電視顯示方案中,不易理解講話者與字幕的關係。另外,即使講話者與字幕的關係很清楚,但觀眾在收看整個屏幕時常常感覺不舒服。
發明內容
因此,本發明的目的是提供電視內容的生成、發送、回放和提供的裝置與系統及所使用的數據結構與記錄媒體,以便容易理解講話者與字幕的關係,便於觀看整個屏幕。
本發明的另一個方面是提供電視內容的生成、發送、回放和提供裝置與系統及所使用的數據結構與記錄媒體,因而即使無話音也容易理解講話者與字幕的關係,易觀看整個屏幕。
為實現上述目的,本發明具有以下特徵。本發明針對一內容生成裝置,用於生成提供帶講話框字幕的電視內容所需的數據。該內容生成裝置包括講話框顯示時間提取裝置、講話框區域確定裝置、講話框圖像確定裝置、字幕文本確定裝置和講話框數據生成裝置。講話框顯示時間提取裝置根據作為原始數據的電視內容數據,提取在電視中顯示講話框的時間。講話框區域確定裝置確定在講話框顯示時間提取裝置所提取的時間適合在電視中顯示講話框的講話框區域。講話框圖像確定裝置確定準備與講話框區域確定裝置所確定的講話框區域相結合的講話框圖像。字幕文本確定裝置確定準備與講話框圖像確定裝置所確定的講話框圖像相結合的字幕文本。講話框數據生成裝置利用信息中至少一段有關講話框顯示時間、講話框區域、講話框圖像和字幕文本的信息,生成講話框數據。由講話框數據生成裝置所生成的講話框數據與電視內容數據一起回放,從而提供有講話框字幕的電視內容。
較佳地,講話框區域確定裝置根據電視內容數據檢測電視裡的色調變化,提取淺的色調裡的淺的部分,把其中所含的一幀取作講話框區域。講話框圖像確定裝置把允許在該幀裡顯示字幕文本的圖像取為講話框圖像。
更佳地,講話框區域確定裝置根據用戶指令改變提取的幀,確定該講話框區域。而且,講話框圖像確定裝置還按用戶指令改變講話框圖像的形狀。另外,字幕文本確定裝置按用戶指令確定字幕文本。
而且,字幕文本確定裝置可判斷單位時間的字幕文本字母數在講話框顯示時間內是否等於或是大於預定數,並在字母數等於或大於預定數時,通知用戶要更改字幕文本。
較佳地,字幕文本確定裝置按用戶指令確定字幕文本的屬性。
再者,內容生成裝置還包括多路復用裝置,用來多路復用電視內容數據和講話框數據生成裝置的講話框數據。另外,內容生成裝置還包括多路復用數據發送裝置,可通過網絡發送多路復用裝置通過多路復用而得到的數據。還有,內容生成裝置還包括封裝媒體存貯裝置,把多路復用裝置通過多路復用得到的數據存入封裝媒體。
另外,內容生成裝置還包括音量確定裝置,可在回放電視內容數據期間確定音量。此時,字幕文本確定裝置可按音量確定裝置確定的音量改變字幕文本的屬性。
再者,內容生成裝置還包括臉大小提取裝置,根據電視內容數據提取電視中人臉的大小。此時,講話框圖像確定裝置可按臉大小提取裝置提取的臉大小,確定講話框圖像的始點。
較佳地,電視內容數據通過MPEG(活動圖片專家組)編碼,講話框數據以XML(可擴充的標記語言)描述。
同時,本發明還針對一內容發送裝置,用於發送提供帶講話框字幕電視內容所需的數據。內容發送裝置包括講話框數據獲取裝置、電視內容數據獲取裝置、多路復用裝置和發送裝置。講話框數據獲取裝置獲取用至少一條以下信息生成的講話框數據根據作為原始數據的電視內容數據在電視中顯示講話框的時間、準備在電視上顯示講話框的區域、區域中講話框的形狀和準備插入講話框的字幕文本。電視內容數據獲取裝置獲取該電視內容數據。多路復用裝置復用講話框數據得到的講話框數據和電視內容數據獲取裝置得到的電視內容數據。發送裝置發送多路復用裝置通過復用得到的數據。
例如,發送裝置向廣播設備發送復用的數據作無線廣播,或向內容回放設備發送復用的數據而回放電視內容數據與講話框數據。
本發明還針對一種內容存貯封裝媒體生成裝置,用於形成一封裝媒體,其內存有帶講話框字幕電視內容所需的數據。內容存貯封裝媒體生成裝置包括講話框數據獲取裝置、電視內容數據獲取裝置、復用裝置與存貯裝置。講話框數據獲取裝置獲取用以下至少一條信息生成的講話框數據根據用作原始數據的電視內容數據在電視中顯示講話框的時間、準備在電視上顯示講話框的區域、該區域內講話框的形狀和準備插入講話框的字幕文本。電視內容數據獲取裝置獲取電視內容數據,多路復用裝置復用講話框數據得到的講話框數據和電視內容數據獲取裝置得到的電視內容數據,存貯裝置在封裝媒體中存貯多路復用裝置通過復用得到的數據。
本發明還針對一內容回放設備,可回放帶講話框字幕的電視內容,它包括講話框數據獲取裝置、電視內容數據獲取裝置、講話框信號生成裝置、字幕文本信號生成裝置、電視信號生成裝置和組合傳遞裝置。講話框數據獲取裝置獲取用以下至少一條信息生成的講話框數據根據用作原始數據的電視內容數據在電視中顯示講話框的時間、準備在電視上顯示講話框的區域、該區域內講話框的形狀和準備插入講話框的字幕文本。電視內容數據獲取裝置獲取電視內容數據,講話框信號生成裝置按講話框數據生成有關講話框圖像的信號,字幕文本信號生成裝置按講話框數據生成有關字幕文本的信號,電視信號生成裝置按電視內容數據生成有關電視的信號。組合傳遞裝置組合講話框信號生成裝置生成的講話框信號、字幕文本信號生成裝置生成的字幕文本信號和電視信號生成裝置生成的電視信號而生成一組合信號,然後把組合信號傳到顯示設備。
再者,內容回放設備還包括組合/不組合命令裝置,它可命令組合傳遞裝置將講話框信號和字幕文本信號同電視信號相組合或不組合。此時,在收到來自組合/不組合命令裝置將講話框信號和字幕文本信號同電視信號相組合的命令後,組合傳遞裝置立刻向顯示設備傳遞組合的信號,但在收到不組合講話框信號、字幕文本信號與電視信號的命令時,組合傳遞裝置向顯示設備只傳遞電視信號。
另外,內容回放設備還包括音量測量裝置和音量閾值確定裝置,前者測量周圍聲音量,後者判斷前者測量的周圍聲音量是否超過閾值。此時,組合/不組合命令裝置根據音量閾值確定裝置的判斷結果,命令組合傳遞裝置將講話框信號和字幕文本信號面電視信號相組合或不組合。
較佳地,當音量閾值確定裝置確定周圍聲音量未超過閾值時,組合/不組合命令裝置就令組合傳遞裝置把講話框信號和字幕文本信號同電視信號相組合,並防止音頻輸出設備輸出音頻。
當音量閾值確定裝置確定周圍聲音量超過閾值時,組合/不組合命令裝置就令組合傳遞裝置把講話框信號和字幕文本信號同電視信號相組合。
再者,內容回放設備還包括移速測量裝置,可測量內容回放設備的移動速度。組合/不組合命令裝置判斷移速測量裝置測出的移速是否超過預定閾值,在移速超過預定閾值時,令組合傳遞裝置把講話框信號和字幕文本信號同電視信號相組合。
而且,組合/不組合命令裝置可按用戶指令命令組合傳遞裝置是否把講話框信號和字幕文本信號同電視信號相組合。
另外,根據用戶指令,字幕文本信號生成裝置可生成正常字幕文本信號,根據講話框數據在屏內沿顯示字幕文本。此時,當字幕文本信號生成裝置生成正常字幕文本信號時,組合傳遞裝置只組合正常字幕文本信號與電視信號而生成組合信號,並把該組合信號傳到顯示設備。
較佳地,組合傳遞裝置對每幀都組合講話框信號、字幕文本信號和電視信號。
更佳地,內容回放設備還包括顯示裝置,根據來自組合傳遞裝置的組合信號,顯示組合後的電視。
本發明還針對一種在其上記錄了數據的計算機可讀記錄媒體,數據結構可讓計算機設備顯示帶講話框字幕的電視內容。記錄媒體上記錄的數據包括存貯根據用作原始數據的電視內容數據顯示電視講話框的時間信息的結構存貯相應於該時間信息準備在電視中顯示講話框的區域信息的結構;存貯相應於時間信息的區域中講話框形狀信息的結構;和存貯要插在相應於時間信息的講話框內的字幕文本信息的結構。
較佳地,存貯時間信息的結構包括存貯指示字幕開始時間信息的結構;和存貯指示字幕持續時間信息的結構。
本發明還針對上述讓計算機設備顯示帶講話框字幕電視內容的數據結構。
本發明還針對一內容提供系統,包括用以下至少一條信息生成講話框數據的講話框數據生成設備根據作為原始數據的電視內容數據在電視中顯示講話框的時間信息、講話框顯示在電視上的區域信息、區域內講話框形狀信息和插入講話框的字幕文本信息;內容提供裝置復用講話框數據生成設備生成的講話框數據和電視內容數據而產生復用的數據,並把復用的數據提供為電視內容;和內容回放設備,根據內容提供裝置提供的復用數據,回放帶講話框字幕的電視內容。
內容提供裝置可通過網絡分布或封裝媒體向內容回放設備發送復用數據。
按本發明,在電視內容中,可將字幕文本插入講話框裡作顯示,這樣能明白講話者與字幕的關係。再者,字幕文本顯示在講話框內,便於觀看整個屏幕。講話框的始點代表講話者,因而即使無聲也能把講話者與字幕文本相互聯繫起來,故能弄清電視內容。這在有些地方尤其有用,諸如禁止發聲的寂靜場合,或者相反,由於周圍聲音大而聽不到揚聲器聲響的地方。而且,若可攜式通信終端引用本發明,用戶不必用耳機等聽音響就能弄清電視內容。
而且,講話框置於淺的色調部分,以免講話框遮掉屏上重要部分。另可按用戶指令改變講話框圖像顯示區,避免重要部分被講話框無意遮蓋。還有,講話框圖像形狀可變,因而可按講話者的話語選擇合適的講話框,如為了表示某種想法,可用雲狀講話框。另可改變字幕文本而予以加強。
在字幕字母數大時,會自動通知用戶,故用戶能建立合適的字幕文本。
把MPEG數據用作電視內容數據而把遵守XML的數據用作講話框數據,增強了數據相似性,有助於標準化。
內容回放設備可按周圍音量控制音頻輸出和字幕文本顯示,故能自動設置符合周圍狀況的輸出。
通過以下結合附圖對本發明的詳述,本發明的種種目的、特徵、方面和優點就更清楚了。
附圖簡介
圖1是本發明一實施例廣播系統整個配置的框圖,用於廣播帶講話框字幕的電視內容;圖2是內容生成設備1功能結構的框圖;圖3示出一例字幕表數據的數據結構;圖4示出一例講話框數據的數據結構;圖5是內容發送設備2的功能結構框圖;圖6是內容回放設備4的功能結構框圖;圖7是內容顯示設備5的功能結構框圖;圖8是內容生成設備1的工作流程圖;圖9A示出內容生成設備1上的顯示;
圖9B示出內容生成設備1上的另一顯示;圖9C示出內容生成設備1上的又一種顯示;圖9D示出內容生成設備1上的再一種顯示;圖10示出一例最終生成的講話框數據;圖11是內容發送設備2的工作流程圖;圖12是內容回放設備4的工作流程圖;圖13A示出一例基於內容回放設備4生成的電視信號的圖像;圖13B示出一例基於內容回放設備4生成的講話框信號的圖像;圖13C示出一例基於內容回放設備4生成的字幕文本信號的圖像;圖13D示出另一例基於內容回放設備4生成的字幕文本信號的圖像;圖14示出內容回放設備4的組合/傳遞部件43的操作;圖15A示出一例內容顯示設備5上的顯示;圖15B示出另一例內容顯示設備5上的顯示;圖16示出經網際網路提供內容數據和講話框數據的整個系統配置;和圖17示出分布DVD等封裝媒體的整個系統配置,媒體內存貯了與內容數據和講話框數據所復用的數據。
較佳實施例的描述下面參照附圖描述本發明一實施例。圖1是本發明一實施例的用講話框廣播帶字幕電視內容的廣播系統整個配置的框圖。圖1中,廣播系統包括內容生成設備1、內容發送設備2、廣播設備3、內容回放設備4和內容顯示設備5。為簡化描述,圖1中對內容生成設備1、內容發送設備2、廣播設備3、內容回放設備4和內容顯示設備5都只示出一臺設備,但每種設備可配置兩臺或更多臺。
內容生成設備1根據預先存貯的內容數據生成指示對應於電視的字幕表的數據(下稱字幕表數據),並用講話框生成講話框數據,用於把基於內容數據的電視與帶字幕電視組合起來。
內容發送設備2獲取內容數據和講話框數據,對它們復用,通過本地線路、公共網、網際網路、電波網等把它們作為復用數據傳輸到廣播設備3。內容生成設備1和內容發送設備3位於例如內容創製者一側,如內容製作公司。這裡經網絡把復用數據發送到廣播設備3,或把復用數據存入DVD等記錄媒體供廣播設備3閱讀。
廣播設備3接收內容發送設備2發出的復用數據,通過天線廣播。廣播設備3位於例如廣播公司,如電視廣播臺。
內容回放設備4接收廣播設備3發出的復用數據作分析,再令內容顯示設備5用講話框顯示帶字幕的電視。按內容回放設備4發出的信號,內容顯示設備5用講話框顯示帶字幕的電視。設備4和5位於例如觀眾房內。
圖2是內容生成設備1的功能結構框圖,設備1包括數據生成控制部11、輸入部12、顯示/輸出部13、計時部14和存貯部15。
輸入部12是一輸入設備,如滑鼠、鍵盤、觸板與操縱杆,用於向數據生成控制部11輸入用戶送入的操作信息。
存貯部15是記錄設備,如硬碟,裡面存有內容數據、字幕表數據、講話框形狀數據和講話框數據。
內容數據是編碼的音視頻流數據,通過編碼諸如MPEG(運動圖片專家組)得到。
字幕表數據裡存有字幕文本和字幕文本顯示時間信息。圖3示出一例字幕表數據的數據結構。如圖3所示,字幕表數據裡記錄了例如字幕開始時間、字幕持續時間和字幕文本。這裡,字幕開始時間指由內容開始計算的時間,用於啟動顯示相應的字幕文本。字幕持續時間指連續顯示相應字幕文本的時段。在圖3的字幕表數據例中,在內容開始持續2分鐘後,在第15幀後從24分30秒開始顯示字幕文本「我同意你的想法」。注意,順序幀位置僅為舉例,不表示限制,而每秒幀數也不表示限制。
講話框形狀數據是限定講話框形狀的數據,如在講話框形狀數據中,講話框形狀名稱與講話框形狀信息相關聯。
圖4示出一例講話框數據的數據結構。如圖4所示,講話框數據描述了例如字幕持續時間、字幕文本展示速度、字幕文本屬性、講話框範圍、講話框始點、講話框形狀與字幕文本,這些項目在各字幕開始時相應於內容數據名稱描述。字幕開始時間和字幕持續時間是講話框顯示時間信息,字幕文本展示速度、字幕文本屬性和字幕文本是字幕文本信息,講話框範圍和講話框始點是電視中適合顯示講話框的講話框區域信息,講話框形狀是組合了講話框區域的講話框圖像信息。講話框數據是以某種數據格式用以下至少一條信息生成的數據講話框顯示時間信息、講話框區域信息、講話框圖像信息和字幕文本信息。例如,講話框數據以無語言描述。這裡的字幕開始時間、字幕持續時間和字幕文本都與字幕表數據裡的類似。字幕文本展示速度指在字幕持續時間內從字幕文本頭部依次顯示字幕文本的速度。字幕文本屬性指字幕文本的字體、顏色、背景與透光度、幀型等。講話框範圍指屏上組合講話框的位置。講話框始點指講話框在屏上開始的位置。講話框形狀指記錄在講話框數據裡的講話框名稱。
如上所述,講話框數據的結構可讓計算機設備用講話框顯示帶字幕的電視內容。該結構包括根據用作原始數據的電視內容數據在電視上存貯講話框顯示時間信息(如上述的字幕開始時間與待續時間)的結構、在電視上存貯與時間相關信息關聯的講話框顯示區域信息(如上述的講話框範圍與講話框始點)的結構、存貯與時間相關信息關聯的區域內講話框形狀信息(如上述的講話框形狀)的結構,和存貯要插入講話框的字幕信息(如上述的字幕文本展示速度,字幕文本屬性與字幕文本)的結構。本例中,存貯時間相關信息的結構包括存貯字幕開始時間指示信息的結構和存貯字幕持續時間指示信息的結構。帶這種結構的數據可存入計算機可讀記錄媒體。
計時部14測量時間。按照來自數據生成控制部11的信號,顯示/輸出部13顯示生成電視與講話框的圖像並產生音響。
為得到字幕的開始與持續時間,數據生成控制部11回放內容數據,檢測音響的開始與結束時間。數據生成控制部11把得到的字幕的開始與持續時間同用戶通過輸入部12送入的字幕文本關聯起來而生成字幕表數據,再將其存入存貯部15。數據生成控制部11參照字幕表數據而檢出音響開始時間,讓顯示/輸出部13在顯示時間內顯示和輸出聲像。數據生成控制部11把講話框形狀與顯示的電視組合,還在講話框形狀內組合字幕文本。若用戶最終批准組合結果,數據生成控制部11就在字幕開始時間生成講話框數據,再將每一字幕開始時間生成的此段講話框數據合在一起而生成最終講話框數據,接著把生成的最終講話框數據存入存貯部15。
圖5是內容發送設備2的功能結構框圖,它包括多路復用控制部21、操作部22、糾錯碼添加部23、數字調製部24和發送部25。
操作部22是滑鼠或鍵盤等輸入設備,按用戶指令向多路復用控制部21提供要播送的內容數據信息。
多路復用控制部21根據來自操作部22的信息,從內容生成設備1的存貯部15中讀用戶所需的內容數據及其相應的講話框數據,然後復用這兩段數據。以下把復用得出的數據稱為復用數據。
糾錯碼添加部23對多路復用控制部21多路復用得到的復用數據加糾錯碼,數字調製部24用對其添加的糾錯碼以數字方法調製復用數據,發送部25向廣播設備3發送數字調製的復用數據。這裡,內容生成設備1可預先復用內容數據與講話框數據,而復用數據發送功能也可包括在內容生成設備裡。
廣播設備3把內容發送設備2發送的復用數據轉換成電波供發射。廣播設備3的內部結構與常規技術裡的相似,故不再詳述。
圖6是內容回放設備4的功能結構框圖,該設備4包括回放控制部41、操作部42、組合傳遞部43、計時部44、講話框形狀存貯部45、接收部46、解調部47和糾錯部48。
接收部46接收廣播設備3廣播的電波,解調部47解調接收部46收到的電波,而糾錯部48參照包含在解調部47解調的復用數據裡的糾錯碼糾錯。
操作部42是用戶控制內容回放設備4操作的輸入設備,例子有遙控器與按鈕開關。計時部44在回放內容數據時計時。如同內容生成設備1的存貯部15一樣,講話框形狀存貯部45裡存有講話框形狀數據。
回放控制部41從被糾錯部48糾錯的復用數據中讀出內容,再對各幀向組合傳遞部43傳送聲像信號(下稱視頻信號與音頻信號);還從被糾錯部48糾錯的復用數據中讀出講話框數據,然後根據包含在講話框數據裡的講話框形狀信息,從講話框形狀存貯部45讀出講話框形狀數據。另外,回放控制部41生成講話框圖像信號(下稱講話框信號),並把它送到組合傳遞部43。注意,雖可對許多幀發送同一講話框信號,但這裡假定回放控制部41對每幀向組合傳遞部43發送講話框信號。回放控制部41為各幀生成準備插入該講話框的字幕文本信號(下稱字幕文本信號),並把它送到組合傳遞部43。注意,接收部46可設置在內容回放設備4的外面。
組合傳遞部43把回放控制部41送來的信號組合後傳到內容顯示設備5。
圖7是內容顯示設備5的功能結構框圖,它包括顯示/輸出設備部51和驅動電路部52,前者由陰極射線管、液晶顯示器、揚聲器等構成,後者根據內容回放設備4發來的組合信號與音頻信號讓前者回放聲像。
圖8是內容生成設備1的操作流程圖,圖9A~9D示出幾例內容生成設備1上的顯示。下面參照圖8和9A~9D描述內容生成設備1操作。
首先,根據通過輸入部12來自用戶的指令,內容生成設備1的數據生成控制部11讀取存在存貯部15裡的所需的內容數據,再令顯示/輸出部13顯示電視並輸出音響(步驟S101)。
接著通過音響識別,數據生成控制部11判斷是否已到音響開始時間(步驟S102),若未到音響開始時間,數據生成控制部11就進入步驟S104的操作;反之,若已到音響開始時間,則數據生成控制部11提醒用戶輸入對應於在音響開始時間(取作為字幕開始時間)算起的一時段內要產生的音響的字幕文本,直到音響結束,而該時段取作為字幕持續時間。然後,數據生成控制部11把字幕開始時間、持續時間和字幕文本存入存貯部15作為字幕表數據一部分(步驟S103),再進入步驟S104的操作。此時,用戶最好在字幕文本的字幕字母之間留一空間。
在步驟S104,數據生成控制部11判斷內容數據回放是否已結束,若未結束,返回步驟S102的操作,生成下一音響開始時間的字幕文本;反之,若已結束,則數據生成控制部11收集在步驟S103生成的幾段字幕表數據而生成內容的最終字幕表數據,並把它存入存貯部15(步驟S105)。然後,數據生成控制部11進到步驟S106的操作。
在步驟S106,數據生成控制部11參照字幕表數據,得出字幕的開始與持續時間。接著參照內容數據,數據生成控制部11對起自字幕開始時間的字幕持續時間令顯示/輸出部13回放聲像(步驟S107)。
接著,數據生成控制部11對起自字幕開始時間的字幕持續時間計算電視裡色彩的深淺度,提取淺色調部分(下稱淺色部分)(步驟S108)。然後,數據生成控制部11設置能配入提取的淺色部分的矩形框(步驟S109)。接著,數據生成控制部11令顯示/輸出部13在字幕開始時間顯示組合了電視的該設置的矩形框,從而用虛線框代表該矩形框(下稱矩形框)(步驟S110)。此時,數據生成控制部11使矩形框四角呈黑圈。圖9A示出一例步驟S110顯示的屏。如圖9A所示,矩形框Sa示成在淺色調的淺色部分Fa具有最大尺寸。這裡的框的形狀可以不是矩形。
接著,數據生成控制部11令顯示/輸出部13顯示圖像,詢問用戶步驟S110顯示的矩形框是否置成要顯示講話框的範圍。根據用戶的糾正指令,數據生成控制部11按指令把另一矩形框置成要顯示講話框的範圍(步驟S111)。此時,數據生成控制部11把該矩形框四角的坐標臨時存入存儲器(未示出)。同時,用戶用輸入部12作框糾正,如用戶先將滑鼠指針置於四邊或四角的任一處,然後拉出邊或角,從而糾正矩形框的尺寸和/或位置。這種方法為圖像軟體領域所共知,故不再描述。
然後,數據生成控制部11識別電視中人的臉部(步驟S112)。識別方法有多種,如數據生成控制部11可按膚色、臉形等識別人臉部,這類方法已為圖像識別領域所共知,故不再描述。
接著,數據生成控制部11找出被識別臉部區域,判斷該區域是否超出預定閾值(步驟S113),若超出,就檢測嘴部,令顯示/輸出部13顯示一條從嘴畫到矩形框對角線交點(該點下稱矩形框中心)的基準線,還在該基準線上示出臨時的講話框始點(步驟S114)。於是,數據生成控制部11進到步驟S116的操作。
反之,若該區域未超出閾值,數據生成控制部11則識別臉中心部,然後令顯示/輸出部13顯示一條從該中心部畫到矩形框中心的基準線,還在該基準線上示出臨時的講話框始點,於是進到步驟S116的操作。在圖9B的例中,在步驟S115示出這種臨時講話框始點。如圖9B所示,在從臉中心到矩形框Sa中心的基準線La上顯示出講話框始點Pa。這樣,數據生成控制部11就按臉的大小確定講話框圖像的始點。
在步驟S116,根據用戶通過輸入部12發來的指令,數據生成控制部11校正講話框始點,把校正的講話框始點的坐標存入存儲器(未示出),再進到步驟S117的操作。若用戶不發校正指令,數據生成控制部11就存貯臨時講話框始點的坐標。
在步驟S117,數據生成控制部11讀出預先置成標準講話框形狀的講話框形狀數據,需要的話改變該講話框形狀的尺寸,使講話框在步驟S111確定的矩形框內具有最大尺寸,然後在矩形框內改變尺寸後,令顯示/輸出部13顯示講話框圖像。圖9C示出一例步驟S117顯示的講話框圖像,如圖所示,講話框圖像Ba被示成適合矩形框Sa。
然後,根據用戶指令,數據生成控制部11校正該講話框圖像(步驟S118)。具體地說,校正講話框的形狀、大小、取向等。例如用戶從代表可能的講話框形狀的對話框裡選擇需要的形狀,就可作這樣的校正,也可在顯示器上拉動講話框來校正大小。還可用其它各種方法作校正。
若用戶完成了校正或用戶不發出校正指令,數據生成控制部11就確定最終講話框圖像(步驟S119),此時數據生成控制部11就把指示講話框圖像形狀的名稱暫時存入存儲器(未示出)。而且,若改變了講話框圖像尺寸,數據生成控制部11就把存在存儲器裡的四角坐標改為最小尺寸矩形框四角的坐標,以圍著尺寸改變的講話框的作為要顯示的講話框範圍。
接下來,數據生成控制部11從字幕表數據裡讀出字幕開始時間的字幕文本,然後把它們插入確定的講話框(步驟S120)。此時,在起自字幕開始時間的字幕持續時間內,數據生成控制部11令顯示/輸出部13開始對各幀顯示字幕文本。同樣在此時,數據生成控制部11還確定字幕文本展示速度。字幕文本展示速度是通過測定一幀內逐段新顯示多少字母而規定的,比如可規定以正常速度在一幀內新顯示6個字母。數據生成控制部11還暫時存貯該字幕文本展示速度。圖9D示出一例插播字幕文本時的顯示,如圖所示,字幕文本Ca顯示在講話框圖像Ba內。
然後按用戶指令,數據生成控制部11校正字幕文本(步驟S121)。這裡假定,可作校正的字幕文本屬性包括字幕文本類型、字幕文本顏色、字幕背景、字幕透光度、字幕邊沿類型和字幕文本加亮。數據生成控制部11還把字幕文本屬性暫時存入存儲器。注意,數據生成控制部11最好還包括音量確定部,用於確定音響在回放電視內容數據期間的音量。此時,內容生成設備1較佳地按音量確定部所確定的音量改變字幕文本屬性,如對大音量,內容生成設備1就放大字幕文本或改變其顏色。
接著,數據生成控制部11讀出暫存在存儲器裡的信息,把字幕持續時間、字幕文本展示速度、字幕文本屬性、講話框範圍(矩形框四角坐標)、講話框始點坐標、講話框形狀和字幕文本存入存貯部15(步驟S122)。
然後,數據生成控制部11判斷是否完成了整個內容的講話框數據生成(步驟S123),若未完成,就對每個字幕開始時間繼續生成講話框數據;若完成了,它就把對每一字幕開始時間生成的諸講話框數據段合起來,生成對應於所需內容數據的最終講話框數據,再將它存入存貯部15(步驟S124)。於是,數據生成控制部11結束操作。
圖10示出一例最終講話框數據,該例為了提供與用於內容數據MPEG數據格式的相似並便於標準化,以遵循XML(可擴充的標記語言)的格式描述該講話框數據。如圖10所示,講話框數據包括字幕文本展示速度、字幕持續時間、字幕範圍、字幕始點、講話框形狀和對各字幕開始時間規定的字幕文本。圖10中,諸字幕文本屬性都用於整個內容,或者對各字幕開始時間不用諸字幕文本屬性。
圖11是內容發送設備2的操作流程圖,下面參照圖描述內容發送設備2的操作。
首先,根據用戶通過操作部22發來的指令,內容發送設備2的多路復用控制部21讀取存在內容生成設備1的存貯部15裡的所需的內容數據(步驟S201),然後從存貯部15中讀取相應於內容數據的講話框數據(步驟S202),接著把讀出的內容數據與講話框數據復用(步驟S203)。這裡可以採用任一種多路復用方法,如嵌入內容數據頭部的講話框數據。
然後,糾錯碼添加部23對復用數據添加糾錯碼(步驟S204),於是數字調製部24用對其添加的糾錯碼數字調製該復用數據(步驟S205)。接著,發送部25向廣播設備3發送數字調製數據(步驟S206),於是結束處理。
圖12是內容回放設備4的操作流程圖。圖13A~13D示出的實例是基於電視信號、講話框信號和內容回放設備4所生成的字幕文本信號的圖像。下面參照圖12和13A~13D描述內容回放設備4的操作。
首先,在內容回放設備4中,接收部36收到的信號被解調部47解調、糾錯部48糾錯,被輸入回放控制部41(步驟S301)。然後,與步驟S303~S312的下述操作同時進行,回放控制部41從糾錯的復用數據裡讀內容數據,再把回放該內容數據所需的視頻信號與音頻信號送到組合傳遞部(步驟S302)。圖13A示出一列基於視頻信號的圖像。如圖13A所示,在步驟S302,除了講話框信息外,只傳遞聲像信息。
然後,回放控制部41從復用數據裡讀取講話框數據,得到字幕的開始與持續時間(步驟S303)。接著根據來自計時部44的信息,回放控制部41判斷是否到了字幕開始時間(步驟S304),若未到,就進到步驟S312的操作。
反之,若到了字幕開始時間,若字幕開始時間到了,則根據講話框數據包含的講話框範圍,回放控制部41在屏上設置插講話框的範圍(步驟S305),然後根據講話框數據包含的講話框形狀從講話框形狀存貯部45中讀出指定講話框形狀的信息,再確定講話框圖像大小,使該講話框適合步驟S305找出的範圍(步驟S306)。接著,回放控制部41生成講話框信號,使確定了尺寸的講話框圖像顯示在設置的範圍內,再把該講話框信號送到組合傳遞部43(步驟S307)。這時,即使講話框形狀在字幕持續時間內不變,在作其它操作的同時,回放控制部41也對各幀送出講話框信號,以便與視頻信號和字幕文本信號同步。圖13B示出一例基於講話框信號的圖像(講話框圖像),如圖所示,該講話框信號只提供講話框圖像信息。
然後根據存在講話框數據裡的字幕持續時間,回放控制部41查出字幕持續時間內的幀數(步驟S308),再把字幕字母數除以步驟S308查出的幀數,得出每幀顯示的字幕字母數,生成每幀顯示字幕文本的字幕文本信號(步驟S309),並將該信號送到組合傳遞部(步驟S310)。圖13C示出一例第一幀內基於該字幕文本信號的圖像,圖13D示出一例第二幀內基於字幕文本信號的圖像。如圖13C和13D所示,根據字幕文本信號,在字幕持續時間內,逐漸出現要顯示的字幕文本。
然後,回放控制部41判斷在字幕持續時間內是否回放了所有的幀(步驟S311),若未完成,就返回步驟S308的操作,生成下一幀所需的字幕文本信號以傳到組合傳遞部43;若完成了,則判斷是否完成了內容回放(步驟S312);若未完成,回放控制部41就返回步驟S304的操作,對下一個字幕開始時間傳遞講話框信號和字幕文本信號;反之若完成了,則結束操作。
圖14示出內容回放設備4的組合傳遞部43的操作,圖15A與15B示出幾例內容顯示設備5上的顯示,下面參照這些圖描述組合傳遞部43的操作。
首先,組合傳遞部43接收回放控制部41發出的每幀視頻信號(步驟S401),然後接收回放控制部41發出的講話框信號和每幀字幕文本信號,並把視頻信號與講話框信號和字幕文本信號組合起來(步驟S402),同音頻信號一起傳到內容顯示設備5(步驟S403)。然後組合傳遞部43返回步驟S401,進入下一幀處理。
從組合傳遞部43收到信號後,內容顯示設備與立即顯示第一幀內的一部分字幕,如圖15A所示,然後與第一幀內顯示的字幕部分一起顯示第二幀內剩餘的字幕部分,如圖15B所示。
這樣,根據本發明該實施例,字幕文本被插入電視內容的講話框部分供顯示,這樣很容易理解講話者與字幕的關係。再者,利用顯示在講話框部分裡的字幕文本,很容易觀看屏幕。
在本實施例的內容回放設備和內容顯示設備中,即使無音響,只要看一下講話框始點就可明白誰在講話,因而在必須不發出音響的環境中,可幫助用戶理解電視內容,這樣用戶不用耳機之類的設備便能欣賞電視內容。
例如,若內容回放設備和內容顯示設置放在要禁聲的地方,諸如圖書館、醫院、公共場所等,用戶能欣賞電視內容而不打擾別人。此時,可在個人計算機上容易地實現內容回放設備和內容顯示設備。另在周圍噪聲大得難以傾聽音響的環境中,當把內容回放設備和內容顯示設備安置成室外廣告設備或公共導向服務設備時,用戶觀看使用講話框的字幕就能欣賞電視內容,不必收聽音響。
本例中,內容回放設備和內容顯示設備分開設置,也可把這些設備合成一臺設備,做成小得可攜帶。有了這種可攜式信息終端,即使在按一般規矩要將音響置成最小的環境中(如火車內、公共汽車內、船上、飛機上、圖書館、醫院裡),用戶也能欣賞電視內容。這樣,能以各種方式有效地使用本發明。
另外,在內容回放設備和內容顯示設備的功能中,某一功能可以包含在另一功能內。而對於內容生成設備和內容發送設備,某一功能也可含在另一功能內。
如上所述,為了以各種方式更有效地應用本發明,內容回放設備(包括裡面配有內容顯示設備)包括下述諸功能則更佳。
例如,較佳地把內容回放設備配置成選擇是否按用戶指令顯示講話框。具體而言,當用戶發出不顯示講話框指令時,內容回放設備的回放控制部就會組合傳遞部只組合視頻與音頻信號。
或者,內容回放設備自動選擇是否顯示講話框。例如,內容回放設備還可包括測量周圍音量的音量測量部,內容回放設備把揚聲器輸出而被音量測量部測得的音量與周圍音量作比較,若周圍音量大於預定閾值,內容回放設備的回放控制部就停止揚聲器的音響輸出,令組合傳遞部切換到組合處理作字幕文本顯示。這樣,在周圍聲音變大時,顯示就自動切換到講話框字幕顯示,因此即使在聲音不易通過的環境中,用戶也能欣賞電視內容。
或者,在周圍音量小於預定閾值時,內容回放設備的回放控制部以某種模式自動處理,停止揚聲器的音響輸出,令組合傳遞部切換到組合處理,作講話框字幕顯示。這樣在用蜂窩電話或PDA等移動終端構成內容回放設備時,該移動終端便自動進入周圍寂靜的工作模式,用戶在這種環境裡欣賞電視內容。
或者,內容回放設備還可包括移速測量部,利用加速度傳感器或考慮到接收電波的都卜勒效應測量移動終端的速度。當移速測量部測出的移動速度快於步行速度時,內容回放設備的回放控制部斷定用戶正在駕車或坐在車內,並令組合傳遞部切換到某種模式的講話框字幕顯示。
或者,根據用戶指令,內容回放設備在常規定幕顯示與講話框字幕顯示之間切換。具體地說,按用戶的常規定幕顯示指令,內容回放設備只參照字幕的開始與持續時間和字幕文本信息,生成字幕文本信號,讓字幕文本在起自字幕開始時間的字幕持續時間內位於屏內沿。然後,組合傳遞部把字幕文本信號與視頻信號組合起來,在內容顯示設備上顯示。這樣,也可作常規字幕顯示。
或者,在生成字幕表數據時,內容生成設備生成的字幕表數據裡記錄了按聲壓電平增亮文本的信息。具體而言,內容生成設備可以包括聲壓檢測設備,用壓電傳感器等檢測聲壓。當聲壓在字幕持續時間內的平均值大於閾值時,就在字幕表數據裡記錄擴大文本的屬性;當平均值小於閾值時,在字幕表數據裡記錄縮減文本的屬性。
這時,當字幕文本因字幕持續時間短而不適合講話框時,內容生成設備令顯示/輸出部顯示一標記等,指示字幕文本不適合該講話框,由此通知了用戶,按此通知,用戶改變講話框或字幕文本的大小。內容生成設備通過判斷單位時間(如每幀)的字幕字母數在字幕持續時間內是否等於或大於預定數,斷定字幕文本是否適合講話框。若字幕字母數等於或大於預定數,內容生成設備就斷定字幕不適合講話框,通知用戶要更改字幕文本。
若字幕字母數很大,則先顯示適合講話框的一部分字幕字母,再新顯示其適合同一講話框的下面剩餘部分。具體而言,內容回放設備在步驟S309生成一指示下面剩餘部分字幕字母的字幕文本信號,很容易實現這一要求。
講話框形狀數據最好實現標準化,但若在內容生成設備與內容回放設備之間使用不同類型的講話框形狀數據,則內容回放設備用按指南預定的標準數據作為講話框形狀數據。
本例中,內容生成設備分別生成字幕表數據和講話框數據,或者與講話框數據一起生成字幕表數據。具體地說,內容生成設備在檢出音頻開始後,可同時記錄講話框形狀和字幕文本。
本例中,字幕表數據在正好生成講話框數據之前生成,或者預先生成,與講話框數據分開。
本例中,內容生成設備先自動選一講話框形狀,需要時再由用戶校正。或者,內容生成設備阻止用戶校正,而是自動生成講話框數據。再或者,以人工方式生成整個講話框數據。
本例中,播發內容數據與講話框數據,但這並不表示限制提供內容的系統。
圖16示出的整個系統配置,用於經網際網路提供內容數據與講話框數據。如圖16所示,內容發送設備2a可經網際網路3a向內容回放設備4a發送復用內容數據與講話框數據所得到的數據,此時應用了上述實施例的內容生成設備1和內容顯示設備5。內容發送設備2a經網際網路按TCP/IP對復用數據作分組傳輸,內容回放設備4a接收經網際網路以分組為單位發送的復用數據。
圖17示出的整個系統配置,用於分布復用內容數據與講話框數據而得到並存入封裝媒體裡的數據。如圖17所示,封裝媒體形成設備2b把復用數據存入DVD之類的記錄媒體而形成封裝媒體,通過分布系統3b供給觀眾。封裝媒體回放設備4b讀取存在封裝媒體裡的復用數據,與講話框字幕一起回放電視內容。
用於生成、發送、回放和提供帶講話框字幕的電視內容的諸設備與系統以及這些設備所使用的數據結構與記錄媒體,可便於理解講話者與字幕的關係,也便於觀看整個屏幕,適用於內容製作等領域。
雖已詳述了本發明,但前面描述在各方面都是示例而非限制。應該理解,可以設想出各種其它修正與變化而不違背本發明的範圍。
權利要求
1.一種生成提供帶講話框字幕電視內容所需的數據的內容生成設備,其特徵在於包括講話框顯示時間提取裝置,可根據用作原始數據的電視內容數據,提取電視中顯示講話框的時間;講話框區域確定裝置,可確定適合在講話框顯示時間提取裝置提取的時間在電視中顯示講話框的講話框區域;講話框圖像確定裝置,可確定準備與講話框區域確定裝置確定的講話框區域組合的講話框圖像;字幕文本確定裝置,可確定準備與講話框圖像確定裝置確定的講話框圖像組合的字幕文本;和講話框數據生成裝置,可用以下至少一條信息生成講話框數據講話框顯示時間,講話框區域,講話框圖像和字幕文本,其中講話框數據生成裝置生成的講話框數據與電視內容數據一起回放,從而提供帶講話框字幕的電視內容。
2.如權利要求1所述的內容生成設備,其中講話框區域確定裝置根據電視內容數據檢測電視中的色調變化,在淺色調中提取淺色部分,並把包含在淺色部分裡的一幀取作講話框區域,而講話框圖像確定裝置把允許字幕文本顯示在該幀內的圖像作為講話框圖像。
3.如權利要求2所述的內容生成設備,其中講話框區域確定裝置按用戶指令通過改變提取的幀來確定講話框區域。
4.如權利要求2所述的內容生成設備,其中講話框圖像確定裝置按用戶指令改變講話框圖像的形狀。
5.如權利要求2所述的內容生成設備,其中字幕文本確定裝置按用戶指令確定字幕文本。
6.如權利要求5所述的內容生成設備,其中字幕文本確定裝置判斷單位時間字幕文本的字幕字母數在講話框顯示時間內是否等於或大於一預定數,在字幕字母數等於或大於該預定數時,通知用戶要更改變字幕文本。
7.如權利要求2所述的內容生成設備,其中字幕文本確定裝置按用戶指令確定字幕文本的屬性。
8.如權利要求1所述的內容生成設備,其特徵在於還包括多路復用裝置,可復用電視內容數據與講話框數據生成裝置生成的講話框數據。
9.如權利要求8所述的內容生成設備,其特徵在於還包括多路復用數據發送裝置,可通過網絡發送復用裝置通過復用得到的數據。
10.如權利要求8所述的內容生成設備,其特徵在於還包括封裝媒體存貯裝置,可在封裝媒體中存貯多路復用裝置通過復用得到的數據。
11.如權利要求1所述的內容生成設備,其特徵在於還包括音量確定裝置,可確定回放電視內容數據期間的音量,其中字幕文本確定裝置按照音量確定裝置確定的音量改變字幕文本的屬性。
12.如權利要求1所述的內容生成設備,其特徵在於還包括臉大小提取裝置,可根據電視內容數據提取電視中人臉的大小,其中講話框圖像確定裝置按照臉大小提取裝置提取的臉大小確定講許框圖像的始點。
13.如權利要求1所述的內容生成設備,其中電視內容數據通過MPEG(運動圖片專家組)編碼,而講話框數據用XML(可擴充的標記語言)描述。
14.一種內容發送設備,用於發送提供帶講話框字幕的電視內容所需的數據,其特徵在於包括講話框數據獲取裝置,可獲取通過用以下至少一條信息產生的講話框數據基於用作原始數據的電視內容數據在電視中顯示講話框的時間、準備在電視上顯示講話框的區域、區域內講話框的形狀和準備插入講話框內的字幕文本;電視內容數據獲取裝置,可獲取電視內容數據;復用裝置,可復用講話框數據獲取裝置得到的講話框數據與電視內容數據獲取裝置得到的電視內容數據;和發送裝置,可發送通過多路復用裝置復用得到的數據。
15.如權利要求14所述的內容發送設備,其中發送裝置向廣播設備發送復用數據以作無線廣播。
16.如權利要求14所述的內容發送設備,其中發送裝置向內容回放設備發送復用數據,以回放電視內容數據和講話框數據。
17.一種存貯內容的封裝媒體生成設備,用於製作內存帶講話框字幕電視內容所需數據的封裝媒體,其特徵在於包括講話框數據獲取裝置,可獲取用以下至少一條信息生成的講話框數據基於用作原始數據的電視內容數據在電視中顯示講話框的時間、電視上準備顯示講話框的區域、區域內講話框的形狀和準備插入講話框的字幕文本;電視內容數據獲取裝置,可獲取電視內容數據;多路復用裝置,可復用講話框數據獲取裝置得到的講話框數據與電視內容數據獲取裝置得到的電視內容數據;和存貯裝置,可在封裝媒體內存貯通過多路復用裝置復用得到的數據。
18.一種回放帶講話框字幕電視內容的內容回放設備,其特徵在於包括講話框數據獲取裝置,可獲取用以下至少一條信息生成的講話框數據基於用作原始數據的電視內容數據在電視中顯示講話框的時間、電視上準備顯示講話框的區域、區域內講話框的形狀和準備插入講話框的字幕文本;電視內容數據獲取裝置,可獲取電視內容數據講話框信號生成裝置,可根據講話框數據生成講話框圖像信號;字幕文本信號生成裝置,可根據講話框數據生成字幕文本信號;視頻信號生成裝置,可根據講話框數據生成字幕文本信號;視頻信號生成裝置,可根據電視內容數據生成電視信號;和組合傳遞裝置,可組合講話框信號生成裝置生成的講話框信號、字幕文本信號生成裝置生成的字幕文本信號和視頻信號生成裝置生成的視頻信號而生成組合信號,並把該組合信號傳到顯示設備。
19.如權利要求18所述的內容回放設備,其特徵在於還包括組合/不組合命令裝置,可令組合傳遞裝置把講話框信號和字幕文本信號同視頻信號相組合或不組合,其中在收到來自組合/不組合命令裝置的把講話框信號和字幕文本信號同視頻信號相組合的指令時,組合傳遞裝置把組合的信號傳到顯示設備,而在收到不組合講話框信號、字幕文本信號和視頻信號的指令時,組合傳遞裝置向顯示設備只傳送視頻信號。
20.如權利要求18所述的內容回放設備,其特徵在於還包括音量測量裝置,可測量周圍的音量;和音量閾值確定裝置,可確定音量測量裝置測出的周圍音量是否超出閾值,其中組合/不組合命令裝置根據音量閾值確定裝置的判斷結果,令組合傳遞裝置把講許框信號和字幕文本信號組合或不組合視頻信號。
21.如權利要求20所述的內容回放設備,其中當音量閾值確定裝置斷定周圍音量不超出閾值時,組合/不組合命令裝置就令組合傳遞裝置把講話框信號和字幕文本信號同視頻信號相組合,並防止音響輸出設備輸出音響。
22.如權利要求20所述的內容回放設備,其中當音量閾值確定裝置斷定周圍音量超出閾值時,組合/不組合命令裝置令組合傳遞裝置把講話框信號和字幕文本信號同視頻信號相組合/
23.如權利要求18所述的內容回放設備,其特徵在於還包括移速測量裝置,可測量內容回放設備的移動速度,其中組合/不組合命令裝置判斷移速測量裝置測出的移速是否超出預定閾值,當移速超預定閾值時,令組合傳遞裝置把講話框信號和字幕文本信號同視頻信號相組合。
24.如權利要求19所述的內容回放設備,其中組合/不組合命令裝置按用戶指令,令組合傳遞裝置把講話框信號和字幕文本信號組合或不組合視頻信號。
25.如權利要求18所述的內容回放設備,其中按用戶指令,字幕文本信號生成裝置根據講話框數據生成正常字幕文本信號,在屏內沿顯示字幕文本,而當字幕文本信號生成裝置生成正常字幕文本信號時,組合傳遞裝置只組合正常字幕文本信號和視頻信號而生成組合信號,並把組合信號傳到顯示設備。
26.如權利要求18所述的內容回放設備,其中組合傳遞裝置對每一幀都組合講話框信號、字幕文本信號與視頻信號。
27.如權利要求18所述的內容回放設備,其特徵在於還包括顯示裝置,可根據組合傳遞裝置傳來的組合信號,在組合後顯示電視。
28.一種在其上記錄了數據的計算機可讀記錄媒體,數據結構使計算機設備顯示帶講話框字幕的電視內容,其特徵在於數據包括根據用作原始數據的電視內容數據,存貯電視中顯示講話框的時間信息的結構;在相應於時間信息的電視中存貯準備顯示講話框的區域信息的結構;在對應於時間信息的區域內存貯講話框形狀信息的結構;和在對應於時間信息的講話框內存貯要插入字幕文本信息的結構。
29.如權利要求28所述的計算機可讀記錄媒體,其中存貯時間信息的結構包括存貯指示字幕開始時間信息的結構;和存貯指示字幕持續時間信息的結構。
30.一種讓計算機設備顯示帶講話框字幕電視內容的數據結構,其特徵在於該數據結構包括根據用作原始數據的電視內容數據存貯電視中顯示講話框的時間信息的結構;在對應於時間信息的電視中存貯準備顯示講話框區域信息的結構;在對應於時間信息的區域中存貯講話框形狀信息的結構;和在對應於時間信息的講話框內存貯準備插字幕文本信息的結構。
31.一種內容提供系統,其特徵在於包括講話框數據生成設備,可用以下至少一條信息生成講話框數據基於用作原始數據的電視內容數據在電視中顯示講話框的時間、準備在電視上顯示講話框的區域、區域內講話框的形狀和準備插入講話框內的字幕文本。內容提供裝置,可復用基於用作原始數據的電視內容數據在電視中顯示講話框的時間、準備在電視上顯示講話框的區域、區域內講話框的形狀和準備插入講話框內的字幕文本數據生成設備生成的基於用作原始數據的電視內容數據在電視中顯示講話框的時間、準備在電視上顯示講話框的區域、區域內講話框的形狀和準備插入講話框內的字幕文本數據和電視內容數據而生成復用數據,並把復用數據作為電視內容提拱;和內容回放設備,可根據內容提供裝置提供的復用數據回放帶講話框字幕的電視內容。
32.如權利要求31所述的內容提供系統,其中內容提供裝置通過無線廣播向內容回放設備發送復用數據。
33.如權利要求31所述的內容提供系統,其中內容提供裝置通過網絡分布向內容回放設備發送復用數據。
34.如權利要求31所述的內容提供系統,其中內容提供裝置通過封裝媒體向內容回放設備發送復用數據。
全文摘要
一種內容生成設備,可為提供帶講話框字幕的電視內容生成所需的講話框數據。講話框數據包括以下至少一條信息講話框顯示時間、準備顯示講話框的區域、講話框形狀和準備插入講話框的字幕文本。內容發送設備復用講話框數據與內容數據,讓廣播設備播發復用數據。內容回放設備分析講話框數據以生成講話框圖像信號和字幕文本信號,把這些信號與電視圖像信號相組合,再讓內容顯示設備顯示帶講話框字幕的電視。
文檔編號H04N7/24GK1602051SQ200410012099
公開日2005年3月30日 申請日期2004年9月27日 優先權日2003年9月26日
發明者小林浩二 申請人:松下電器產業株式會社