新四季網

視頻通話中視頻錄製的方法及裝置的製作方法

2023-06-15 09:08:01

專利名稱:視頻通話中視頻錄製的方法及裝置的製作方法
技術領域:
本發明涉及通信技術領域,更具體地,涉及一種視頻通話中視頻錄製的方法及裝置。
背景技術:
隨著移動多媒體業務的迅速發展,以及第三代移動通信(簡稱3G)技術的逐步商 用,可視電話業務成為3G的標誌性業務,已經在個人通信領域迅速發展應用起來。可視電 話業務是一種點到點的視頻通信業務,它能利用電話網雙向實時傳輸通話雙方的圖像和語 音信號。可視終端能收到面對面交流的效果,實現人們通話時「既聞其聲,又見其人」的夢
術g
;ο在視頻通話過程中,用戶為了記錄關鍵信息,或者分享和娛樂,常常需要對通話過 程中的視頻進行錄製。現有的錄製包括三種方式錄製近端視頻、錄製遠端視頻、錄製雙向 視頻。其中,前兩種方式僅能錄製單向視頻。而現有的雙向視頻包括兩種類型一種是錄製 兩個獨立的視頻文件,這種方法需要保存兩個獨立的文件;一種是僅錄製一個,但遠端和近 端的圖像都需經過截取後放在一個屏幕的預設位置,由於在同一個屏幕上放置多個視頻, 圖像可能不清晰,對終端的顯示要求也較高。此外,如果聲音來自於外界或通話中使用了替 代圖像,在觀看視頻時,則無法區分出是從哪一端發出的。綜上所述,現有技術中存在如下問題在現有視頻通話錄製技術中,聲音和圖像不 能對應顯示的問題。具體地說,就是在錄製視頻時不能根據其中一端發言顯示這一端圖像。

發明內容
本發明解決的技術問題是提供一種視頻通話中視頻錄製的方法及裝置,解決視頻 通話錄製時聲音和圖像不能對應顯示的問題。為解決上述技術問題,本發明提供了一種視頻通話中視頻錄製的方法,所述方法 包括判斷視頻通話的關鍵音輸入端,並獲取所述關鍵音輸入端的圖像;存儲所述視頻通話的音頻數據,將獲取的所述圖像與所述音頻合成後,寫入錄製 的視頻文件中。其中,通過語音輸入來源、和/或終端收到的發言控制指令判斷所述視頻通話的 關鍵音輸入端。其中,通過如下方式中的一種或其任意組合判斷所述關鍵音輸入端根據麥克中有無語音輸入進行判斷,如果麥克中接收到語音輸入,則該麥克對應 的終端為關鍵音輸入端;根據音頻信號的強弱進行判斷,如果同時有多個語音輸入,則以音頻信號較強的 一方作為關鍵音輸入端;根據收到的發言控制指令進行判斷,收到終端發起的開始發言指令後,則將發起該開始發言指令的一方作為關鍵音輸入端。其中,所述方法還包括獲知所述視頻通話的關鍵音輸入端發生變化時,獲取新的關鍵音輸入端的圖像。其中,根據收到的終端發起的切換指令,和/或實時判斷關鍵音輸入端,獲知所述 視頻通話的關鍵音輸入端發生變化。其中,所述發言控制指令及所述切換指令是通過終端的特定按鍵或功能菜單發 起。本發明還提供了一種視頻通話中視頻錄製裝置,所述裝置包括判斷模塊,用於判斷關鍵音輸入端;圖像寫入模塊,用於獲取關鍵音輸入端的圖像並存儲;音頻寫入模塊,用於存儲視頻通話的音頻數據;合成模塊,用於將圖像寫入模塊獲取的圖像和音頻寫入模塊的音頻合成,寫入錄 制的視頻文件中;存儲模塊,用於保存視頻文件。其中,所述判斷模塊進一步用於,通過如下方式中的一種或其任意組合判斷所述 關鍵音輸入端根據麥克中有無語音輸入進行判斷,如果麥克中接收到語音輸入,則該麥克對應 的終端為關鍵音輸入端;根據音頻信號的強弱進行判斷,如果同時有多個語音輸入,則以音頻信號較強的 一方作為關鍵音輸入端;根據收到的發言控制指令進行判斷,收到終端發起的開始發言指令後,則將發起 該開始發言指令的一方作為關鍵音輸入端。其中,所述裝置還包括監測模塊,所述監測模塊用於,監測關鍵音輸入端是否發生變化,並在變化時通知圖像寫入 模塊;所述圖像寫入模塊還用於,收到所述監測模塊的通知後,發起切換操作,獲取新的 關鍵音輸入端的圖像並存儲。其中,所述監測模塊進一步用於,根據所述判斷模塊的判斷結果,監測關鍵音輸入 端是否發生變化。本發明通過判斷關鍵音的來源,獲取關鍵音對應的圖像並與錄製的音頻進行合 成,解決了現有視頻通話方法不能靈活錄製的缺陷,在哪端發言時對哪端進行錄製,最後得 到的視頻類似於電視採訪的形式,使得錄製的視頻更有保存和回放價值,提高了用戶體驗 度,也使得可視電話能夠更好地推廣和應用。此外,本發明只需要對移動終端做較小的改動就可以達到預期的效果,不需要做 大規模的軟體和硬體變更。


此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發 明的示意性實施例及其說明用於解釋本發明,並不構成對本發明的不當限定。在附圖中
圖1是根據本發明實施例的視頻通話中視頻錄製裝置的結構示意圖;圖2是根據本發明實施例的視頻通話中視頻錄製的流程圖;圖3是本發明實施例的關鍵音輸入端發生變化時的切換流程圖。
具體實施例方式本發明的核心思想是,通過判斷關鍵音頻輸入來源,並將截取的關鍵音輸入端的 圖像幀與對應的音頻進行合成,生成錄製視頻。從而使得錄製視頻中的聲音和圖像能夠對 應顯示,且由於只顯示通話中關鍵音輸入端的圖像,使得錄製的視頻圖像更為清晰。基於上述核心思想,根據本發明的一個方面,本發明提供了一種視頻通話中視頻 錄製的方法,具體採用如下技術方案判斷視頻通話的關鍵音輸入端,並獲取所述關鍵音輸入端的圖像;存儲所述視頻通話的音頻數據,將獲取的所述圖像與所述音頻合成後,寫入錄製 的視頻文件中。進一步地,通過語音輸入來源、和/或終端收到的發言控制指令判斷所述視頻通 話的關鍵音輸入端。具體的判斷方法可採用如下方式中的一種或其任意組合根據MIC (麥克)中有無語音輸入進行判斷,如果MIC中接收到語音輸入,則該MIC 對應的終端為關鍵音輸入端;根據音頻信號的強弱進行判斷,如果同時有多個語音輸入,則以音頻信號較強的 一方作為關鍵音輸入端;根據收到的發言控制指令進行判斷,收到終端發起的開始發言指令後,則將發起 該開始發言指令的一方作為關鍵音輸入端。需要說明的是,上述方法既可應用於雙方通話,也可應用於多方通話。優選地,對於雙方通話,終端收到視頻錄製指令後,可根據MIC有無音頻輸入或音 頻信號的強弱判斷語音是來自遠端還是近端,如果在近端,則直接獲取本終端的圖像;反 之,則獲取遠端圖像。進一步地,所述方法還包括獲知所述視頻通話的關鍵音輸入端發生變化時,獲取 新的關鍵音輸入端的圖像。進一步地,根據收到的終端發起的切換指令,和/或實時判斷關鍵音輸入端,獲知 所述視頻通話的關鍵音輸入端發生變化。其中,所述發言控制指令和切換指令可以通過終端的特定按鍵或功能菜單發起。進一步地,存儲的所述音頻數據至少包括關鍵音輸入端的音頻數據,但較為簡單 的一種實現是,存儲所述視頻通話中的所有參與終端的語音數據,還可以包括環境中的背 景音或者終端之間共享的音頻等。進一步地,所述獲取的圖像包括但不限於前向攝像頭採集的圖像,後向攝像頭採 集的圖像,替代圖片或視頻終端LCD上分享的圖片等。根據本發明的另一方面,本發明還提供了一種視頻通話中視頻錄製裝置,主要包 括判斷模塊,用於根據有無音頻信號,信號大小或發言控制指令,判斷關鍵音來源,即關鍵音輸入端;監測模塊,主要用於監測關鍵音來源是否有變化,並在變化時通知圖像寫入模 塊;圖像寫入模塊,用於截取關鍵音輸入端(遠端或近端)的圖像幀並存儲;音頻寫入模塊,用於存儲通話中的關鍵音;合成模塊,用於將圖像寫入模塊獲取的圖像和音頻寫入模塊的音頻合成;存儲模塊,用於保存合成後的視頻。以下將參考附圖並結合實施例來詳細說明本發明。需要說明的是,在不衝突的情 況下,本申請中的實施例及實施例中的特徵可以相互組合。圖1根據本發明實施例的視頻通話中視頻錄製裝置的結構示意圖,該裝置可應用 於支持視頻通話的移動或固定終端,如圖1所示,其包括判斷模塊102,用於根據通話中各個終端的情況,判斷關鍵音頻的來源,判斷的方 法包括音頻信號大小和指令控制兩種方式;監測模塊104,監測模塊不斷獲取判斷模塊的結果,並監測關鍵音頻來源是否有變 化,如果有變化,則記錄對應的號碼或終端,通知圖片寫入模塊;圖像寫入模塊106,用於截取遠端或近端的圖像幀並存儲,截取的對象由判斷模塊 和監測模塊決定,音頻寫入模塊108,用於存儲通話中的聲音;合成模塊110,用於將判斷模塊選擇的圖像和音頻合成;存儲模塊112,用於將圖像和音頻寫入模塊的圖片和音頻合成後保存。其中圖像和 音頻的合成為現有技術,此處不再贅述。其中,圖像寫入模塊106進一步可以分為圖像截取單元和圖像寫入單元,圖像截 取單元用於根據監測模塊通知的關鍵音輸入端,截取關鍵音輸入端的圖像幀;圖像寫入單 元則用於保存截取的圖像幀。具體地,判斷模塊102通過如下方式中的一種或其任意組合判斷所述關鍵音輸入 端根據麥克中有無語音輸入進行判斷,如果麥克中接收到語音輸入,則該麥克對應 的終端為關鍵音輸入端;根據音頻信號的強弱進行判斷,如果同時有多個語音輸入,則以音頻信號較強的 一方作為關鍵音輸入端;根據收到的發言控制指令進行判斷,收到終端發起的開始發言指令後,則將發起 該開始發言指令的一方作為關鍵音輸入端。圖2是根據本發明實施例的視頻通話中視頻錄製的方法流程圖,本實施例流程主 要包括如下步驟步驟S201,用戶發起視頻錄製操作,終端收到視頻錄製指令後準備錄製;步驟S202,終端向監測模塊查詢當前關鍵音的來源;步驟S203,根據S202的查詢結果,判斷關鍵音來自本終端還是遠端,如果關鍵音 來自本端,執行步驟S204,反之,執行步驟S205 ;步驟S204,圖像截取單元按照預設的頻率截取本終端圖像,並保存至圖像寫入單
7兀;步驟S205,圖像截取單元按照預設的頻率截取遠端圖像,並保存至圖像寫入單元, 其中遠端圖像的截取對象為關鍵音輸入端;步驟S206,將音頻寫入模塊的音頻和圖像寫入模塊的圖像合成為視頻;步驟S207,將視頻保存至存儲設備。圖3是本發明實施例關鍵音輸入端變化時的切換流程圖,本實施例流程主要包括 如下步驟步驟S301,監測單元監測到關鍵音來源有變化,向圖像寫入單元發起切換指令;步驟S302,圖像寫入模塊發起切換操作,圖像截取的對象為新的關鍵音來源對應 終端;步驟S303,圖像截取單元按照預設的頻率,截取切換後圖像並保存;步驟S304,將音頻寫入模塊的音頻和圖像寫入模塊的圖像合成為視頻;步驟S305,將視頻保存至存儲設備。以上僅為本發明的優選實施案例而已,並不用於限制本發明,本發明還可有其他 多種實施例,在不背離本發明精神及其實質的情況下,熟悉本領域的技術人員可根據本發 明做出各種相應的改變和變形,但這些相應的改變和變形都應屬於本發明所附的權利要求 的保護範圍。本領域普通技術人員可以理解上述方法中的全部或部分步驟可通過程序來指令 相關硬體完成,所述程序可以存儲於計算機可讀存儲介質中,如只讀存儲器、磁碟或光碟 等。可選地,上述實施例的全部或部分步驟也可以使用一個或多個集成電路來實現。相應 地,上述實施例中的各模塊/單元可以採用硬體的形式實現,也可以採用軟體功能模塊的 形式實現。本發明不限制於任何特定形式的硬體和軟體的結合。
權利要求
一種視頻通話中視頻錄製的方法,其特徵在於,所述方法包括判斷視頻通話的關鍵音輸入端,並獲取所述關鍵音輸入端的圖像;存儲所述視頻通話的音頻數據,將獲取的所述圖像與所述音頻合成後,寫入錄製的視頻文件中。
2.如權利要求1所述的方法,其特徵在於,通過語音輸入來源、和/或終端收到的發言控制指令判斷所述視頻通話的關鍵音輸入端。
3.如權利要求2所述的方法,其特徵在於,通過如下方式中的一種或其任意組合判斷所述關鍵音輸入端 根據麥克中有無語音輸入進行判斷,如果麥克中接收到語音輸入,則該麥克對應的終 端為關鍵音輸入端;根據音頻信號的強弱進行判斷,如果同時有多個語音輸入,則以音頻信號較強的一方 作為關鍵音輸入端;根據收到的發言控制指令進行判斷,收到終端發起的開始發言指令後,則將發起該開 始發言指令的一方作為關鍵音輸入端。
4.如權利要求3所述的方法,其特徵在於,所述方法還包括獲知所述視頻通話的關鍵音輸入端發生變化時,獲取新的關鍵音輸入端的圖像。
5.如權利要求4所述的方法,其特徵在於,根據收到的終端發起的切換指令,和/或實時判斷關鍵音輸入端,獲知所述視頻通話 的關鍵音輸入端發生變化。
6.如權利要求3或5所述的方法,其特徵在於,所述發言控制指令及所述切換指令是通過終端的特定按鍵或功能菜單發起。
7.一種視頻通話中視頻錄製裝置,其特徵在於,所述裝置包括 判斷模塊,用於判斷關鍵音輸入端;圖像寫入模塊,用於獲取關鍵音輸入端的圖像並存儲; 音頻寫入模塊,用於存儲視頻通話的音頻數據;合成模塊,用於將圖像寫入模塊獲取的圖像和音頻寫入模塊的音頻合成,寫入錄製的 視頻文件中;存儲模塊,用於保存視頻文件。
8.如權利要求7所述的裝置,其特徵在於,所述判斷模塊進一步用於,通過如下方式中的一種或其任意組合判斷所述關鍵音輸入端根據麥克中有無語音輸入進行判斷,如果麥克中接收到語音輸入,則該麥克對應的終 端為關鍵音輸入端;根據音頻信號的強弱進行判斷,如果同時有多個語音輸入,則以音頻信號較強的一方 作為關鍵音輸入端;根據收到的發言控制指令進行判斷,收到終端發起的開始發言指令後,則將發起該開 始發言指令的一方作為關鍵音輸入端。
9.如權利要求7或8所述的裝置,其特徵在於,所述裝置還包括監測模塊,所述監測模塊用於,監測關鍵音輸入端是否發生變化,並在變化時通知圖像寫入模塊;所述圖像寫入模塊還用於,收到所述監測模塊的通知後,發起切換操作,獲取新的關鍵 音輸入端的圖像並存儲。
10.如權利要求9所述的裝置,其特徵在於,所述監測模塊進一步用於,根據所述判斷模塊的判斷結果,監測關鍵音輸入端是否發生變化。
全文摘要
本發明公開了一種視頻通話中視頻錄製的方法及裝置,所述方法包括判斷視頻通話的關鍵音輸入端,並獲取所述關鍵音輸入端的圖像;存儲所述視頻通話的音頻數據,將獲取的所述圖像與所述音頻合成後,寫入錄製的視頻文件中。本發明通過判斷關鍵音的來源,獲取關鍵音對應的圖像並與錄製的音頻進行合成,解決了現有視頻通話方法不能靈活錄製的缺陷,使得錄製視頻中的聲音和圖像能夠對應顯示,且由於只顯示通話中關鍵音輸入端的圖像,使得錄製的視頻圖像更為清晰。
文檔編號H04N5/76GK101951492SQ201010290999
公開日2011年1月19日 申請日期2010年9月15日 優先權日2010年9月15日
發明者劉揚, 黃連芳 申請人:中興通訊股份有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀