一種教學錄播數據修正裝置的製作方法
2023-11-06 01:59:47
本發明涉及一種網絡教學錄播技術,可以用於基於網絡教學或者在線會議等的教學活動或會議過程的錄製和播放,特別是涉及一種能夠對錄製的教學語音數據進行修正的裝置。
背景技術:
近些年來,由於傳統教學模式已經越來越不能滿足用戶對於多媒體、信息化、便於回放等新型教學方式的需求,隨著網際網路技術,特別是移動網際網路技術的快速發展和普及,各種網絡教學錄播系統蓬勃發展。在網絡教學中,通過課堂錄製將教學過程錄製下來,可以在網際網路上共享教學資源,用戶可以使用終端在線訪問這些教學資源,可以滿足用戶遠程學習和回顧的需求。
教學錄播方面早期的技術,比如cn101141271a(公開日2008年3月12日)公開了一種網絡教學的錄播系統,包括:錄製器、處理器、第一網絡、第二網絡,伺服器、資料庫及三個客戶端。其中,錄製器主要包括攝像頭及無線數字話筒以錄製課件的視頻信息及語音數據。第一網絡於將所述課件信息傳送至伺服器。伺服器一方面用於進一步處理所述課件信息,產生課件數據,另一方面用於在資料庫中搜尋並調用所述課件數據,進而將所述課件數據轉換回所述課件信息。資料庫用於存儲所述課件數據。第二網絡用於連接客戶端與伺服器。客戶端用於方便用戶查詢課件信息及調用課件信息。所述專利申請公開了一種比較典型的流媒體格式錄製課程的技術,現在看其主要缺點在於錄製後形成的文件比較大,上傳下載速度慢,需要的存儲空間大等。
教學錄播方面近期的技術,比如cn105306861a(公開日2016年2月3日)公開了一種有效的課堂教學錄播方法和系統,在網絡教學或在線會議過程中,可以實現對於用戶使用多媒體白板的功能操作、講話/說話語音、與其他用戶的交流和/或輔導等的交流語音進行錄製,分別形成不同的數據流,並且由網絡教學的錄播系統產生統一的時間戳對各種數據流進行標記,而不是完全以流媒體的格式將整個事件記錄下來,使得網絡用戶可隨時隨地方便的通過網絡從雲端伺服器或區域網伺服器下載各種需要播放的數據流,獲取數據流後用戶終端的客戶端根據時間戳再現獲得數據流,有機組合播放出來給用戶進行展示,從而完成點播瀏覽。所述專利申請公開了一種根據時間戳以三種數據流格式分別存儲和記錄課堂教學數據的課堂錄播方法。
隨著對錄製課程品質的追求越來越高,越來越多的教學錄播系統採用了語音識別技術,通常需要將語音轉換成文字,在屏幕上以字幕方式顯示或者保存為文本格式。現有技術中,關於語音識別,特別是將語音轉換為文字或者將文字轉換為語音的專利申請不在少數,比如:
cn101354748a(公開日2009年1月28日)公開了一種文字識別裝置,包括攝像裝置、字符識別裝置、語音轉換裝置、及語音輸出裝置,所述攝像裝置,用於攝入文字信息,將攝入的文字信息以圖片形式發送到所述字符識別裝置;所述字符識別裝置,用於在上述圖片中識別出上述文字信息,發送到所述語音轉換裝置;所述語音轉換裝置,用於將上述文字信息轉換為語音數據,發送到所述語音輸出裝置;所述語音輸出裝置,用於播放上述語音數據。所述專利申請公開了一種採集和識別圖像信息中的文字符號,然後將文字符號轉換成語音的技術。
cn102956231a(公開日2013年3月6日)公開了一種語音識別技術領域的基於半自動校正的語音關鍵信息記錄裝置及方法,所述裝置包括:關鍵信息提取單元和與之相連的信息校正單元,其中:關鍵信息提取單元獲取未經校正的文本數據並提取出關鍵信息後輸出至信息校正單元,信息校正單元輸出用戶反饋確認後的文本數據。本發明通過半自動的信息校正單元,降低了人工校正的工作量;利用資料庫對特殊名詞如地名、專業工具名稱進行校正,降低了人工校正中操作員的知識量限制所造成的影響;提取語音數據中的關鍵信息,從而提高所記錄信息的有效信息量。所述專利申請旨在解決語音轉換成文本之後,對文本數據進行半自動校正的問題。
cn105159870a(公開日2015年12月16日)公開了一種精確完成連續自然語音文本化的處理系統,所述處理系統包括雲端語音識別引擎及語音識別後修正平臺,所述語音識別後修正平臺與所述雲端語音識別引擎連接,所述語音識別後修正平臺包括顯示單元、修正操作單元、控制單元及三維一體生成單元,所述修正操作單元包括語音修正、鍵盤修正、滑鼠修正及鍵盤加滑鼠的修正操作方式,其中公開了可以對於待識別的語音文件進行精細切分,實現精準識別。
cn105808197a(公開日2016年7月27日)公開了一種信息處理方法,應用於具有語音識別模塊的電子設備,所述方法包括:接收輸入語音數據;在依據預設的語音識別模型對所述輸入語音數據進行識別得到識別結果後,當所述識別結果中的第一信息為需要修正的內容時,所述第一信息為所述識別結果中的至少一個字符,採用通過操作體輸入的方式對所述識別結果中的第一信息進行修正,所述用操作體輸入的方式對識別結果中的第一信息進行修正,只需對目的修正的部分進行修正,而無需用戶再次輸入語音數據即可得到目的結果,操作過程簡單,提高了信息輸入的整體速度。所述專利申請公開了可以只需要通過對語音識別後的第一處需要修正的內容進行修正,從而提高了修正的速度,但是這樣的修正只是針對識別後的文本數據,其中在語音識別的過程中,使用了將待識別信息與標準語音數據進行比對,進而提高識別準確率的方式。
cn106328145a(公開日2017年1月11日)公開了一種語音修正方法及裝置,包括:獲取用戶輸入的語音數據;對所述語音數據進行識別,以得到所述語音數據對應的文本內容;當所述文本內容中包含第一預設關鍵詞時,根據所述第一預設關鍵詞將所述文本內容劃分為原始文本和編輯文本,其中,所述編輯文本用於對所述原始文本進行修正;根據所述編輯文本從所述原始文本中提取出待修正文本;根據所述編輯文本和所述待修正文本修正所述原始文本,以得到修正後的文本。所述專利申請公開了,可以通過關鍵字識別的方式獲得原始文本中需要編輯的文本即編輯文本,針對性的進行修正。
cn102215233a(公開日2011年10月12日)公開了一種信息系統客戶端,安裝於用戶的終端設備中,可以應用於微博、博客、論壇或個人空間等,包括:用戶交互模塊以及連接所述用戶交互模塊的語音模塊,優選的,還包括反饋模塊,轉換模塊,所述語音模塊包括語音採集單元、語音識別單元、語音合成單元,語音採集單元用於採集用戶的語音;語音識別單元將語音採集單元採集的語音識別為文字輸出至所述用戶交互模塊;語音合成單元將所述用戶交互模塊從所述信息系統伺服器上獲取的文字轉換為語音向用戶輸出;所述反饋模塊,連接所述語音識別單元,用於確認所述語音識別為文字是否正確,若正確,所述反饋模塊將所述文字輸出至所述用戶交互模塊,若不正確,所述反饋模塊使所述語音採集單元重新採集用戶的語音或者所述語音識別單元修正所述文字直至確認正確。所述專利申請公開了一種可以進行語音和文字分別互相轉換的技術,旨在將一種格式的信息轉換成另一種格式的信息,所述反饋模塊如果輸出的文字信息不正確,就重新採集用戶語音,或者直接修正所述輸出的文字信息。
cn106486113a(2017年3月8日)公開了一種會議記錄方法,包括:獲取語音信號;由語音轉化軟體將所述語音信號轉化成對應的文字信息,並在文檔中予以顯示,其中,所述文字信息包括正確文字信息和錯誤文字信息;對文檔中的錯誤文字信息進行標記,並將標記的所述錯誤文字信息與對應所述錯誤文字信息的語音信號進行關聯連結;點擊所述錯誤文字信息時,採用所述語音轉化軟體對與所述錯誤文字信息關聯連結的語音信號進行二次識別,並在文檔中對二次識別出來的文字信息進行可編輯顯示;通過可編輯顯示中對錯誤文字信息進行更正編輯,以得到更正的文字信息,並用所述更正的文字信息替換所述錯誤文字信息。
綜上可見,在現有技術中,無論是教學錄播領域,還是語音識別轉換領域,都沒有涉及對於待識別語音本身的修正構思,大家關心的都是語音識別轉換特別是語音轉換成文字的準確率的問題。然而,在各種教學或者會議過程中,對於任何說話者來說,都可能存在錯說、漏說或者發音不標準,甚至表達不標準的情況,對於這些問題,通常是採用在語音識別時,也就是轉換成文字時(比如以字幕呈現),加上文字標註(比如以括號中解釋的方式)的方式進行標識。
特別地,對於教學錄播系統,由於講授的課程要進行錄製並且通過網絡重現給用戶,錯說、漏說、表達不標準等問題帶來的影響因為語言數據被壓縮而變得突出而且影響很大,一方面,因為用戶通常難以識別出這些錯誤,而且即使以字幕方式進行標識,另一方面,因為使用環境的原因,用戶可能不方便看字幕,僅能以語音的形式收聽,語音表達不清楚,進一步影響了用戶學習的效果。
針對現有技術中存在的問題,本發明旨在提供一種教學錄播數據修正裝置,在對語音轉換成的文本進行修正的基礎上,對於具體修正的文字,使用標準的語音數據替換所述修正的文字內容所對應的在原始錄播語音數據中的相應的語音片段,形成標準的語音數據和對應的文本,使得在事後點播回顧錄播數據的時候,可以播放不同於原始錄製語音數據的正確語音,以及顯示對應的正確字幕信息。
技術實現要素:
本發明旨在提供一種具備語音修正功能的教學錄播數據修正裝置,包括使用錄音設備將在網絡教學或在線會議過程中的語音信號轉換成帶有時間戳的原始語音數據,使用語音識別模型將所述原始語音數據識別轉換成原始文本數據,對所述原始文本數據進行校對,使用新文本內容替換需要修正的舊文本內容,實現對原始文本數據的修正形成修正文本數據,使用時間戳進行定位,將新文本內容的標準語音數據替換舊文本內容的相應語音數據片段,形成修正語音數據。
應該理解的是,儘管說明書中主要以網絡教學的錄播系統或者網絡會議系統的名義描述了本發明的實施例,但是可以理解的是,本發明的裝置還可以用於其他網絡在線交流過程的錄製和播放。也就是說,本發明涉及給予網絡教學、在線培訓、應急指揮(地圖標註和語音錄製)、金融系統或者在線會議登系統的教學活動或者會議過程錄製及播放的方法、系統以及電腦程式產品,在網絡教學、在線培訓、應急指揮(地圖標註及語音錄製)、金融系統(操盤講解)或者在線會議的過程中,只要涉及錄製語音數據的,通過對所述語音數據識別轉換後形成的文本數據的修正,將修正的文本內容的標準語音數據替換原始錄製的相應語音數據,可以實現對於錄製語音數據的修正。
本發明提供一種教學錄播數據修正裝置,在對多媒體課堂(或網絡課堂)或類似場景的錄製和點播回顧過程中,特別是在對多媒體課堂進行錄製時,包括將語音數據、多媒體白板上的動作數據(電子白板板書)、用戶終端屏幕上的操作數據、錄像設備錄製的視頻數據等以數據流格式添加時間戳後分別保存,形成錄製數據,用戶登錄網絡教學錄播系統之後,使用有線或無線局域或廣域網絡,獲得所述錄製數據,藉助時間戳在用戶終端上實現重現或模擬重現課堂的授課過程,從而實現對錄製課堂的回顧播放或點播播放。
本發明的教學錄播數據修正裝置,包括文件標識生成單元、語音數據採集單元、語音數據修正單元、其他數據採集單元、錄製數據播放單元和錯誤信息反饋單元,其中,
文件標識生成單元,用於在開始錄製教學過程時,生成文件標識id;
語音數據採集單元,用於使用音頻採集設備將語音信號轉換成原始語音數據,以語音數據流格式保存;
語音數據修正單元,用於修正所述原始語音數據需要修正的語音數據,形成修正語音數據;
其他數據採集單元,用於採集以下數據中的至少一種:多媒體白板上的動作數據、用戶終端屏幕上的操作數據、錄像設備的視頻數據,對於採集的每種數據添加所述時間戳,均以數據流格式分別保存,與所述修正語音數據流和所述修正文本數據共同形成可以播放的錄製數據;
錄製數據播放單元,用戶使用終端通過網絡獲取所述錄製數據,根據所述時間戳組合不同數據流,從而在所述終端上播放所述錄製數據,重現和/或模擬重現教學過程,實現對教學過程的學習和/或複習;
錯誤信息反饋單元,用戶使用所述終端播放所述錄製數據時,可以將發現的所述修正文本數據中的錯誤文字內容選定並提交反饋,反饋的內容經由管理員確認之後,更新所述修正文本數據,並重複所述語音數據替換單元,更新所述修正語音數據。
所述語音數據修正單元進一步包括語音數據識別單元、文本數據修正單元和語音數據替換單元,其中:
語音數據識別單元,用於將所述原始語音數據識別轉換成原始文本數據;
文本數據修正單元,用於對所述原始文本數據進行校對,將其中需要修正的舊文字內容,修正為準確的新文字內容,形成修正文本數據;
語音數據替換單元,用於使用所述新文字內容的標準語音數據替換在所述原始語音數據中的所述舊文字內容的語音數據流片段,形成修正語音數據流。
所述語音數據採集單元,用於從至少一個語音源採集至少一個語音數據,並添加時間戳,以語音數據流格式保存;
所述語音數據識別單元,用於將所述語音數據流識別轉換成文本數據,所述文本數據包含所述時間戳,根據所述時間戳可以確定所述文本數據中的每個文字內容的時間坐標。
所述語音數據替換單元,用於從標準語音資料庫中,調取所述新文字內容的標準語音數據,根據所述時間戳,使用所述標準語音數據替換所述原始語音數據中的所述舊文字內容對應的語音數據流片段,從而形成修正語音數據流。
所述修正文本數據,根據所述時間戳,以字幕方式顯示在所述終端的屏幕上,優選的是,顯示在在播放視頻數據的屏幕區域,更優選的是,所述文本數據以可編輯的方式如可選定的方式,顯示在所述終端的特定區域。
在對文本數據和語音數據進行修正或更新時,形成修正歷史記錄,所述修正歷史記錄可以包括修正時間、修正內容、修正操作人、問題發現人等等。
所述語音數據替換單元,用於根據被替換的舊文字內容在所述原始語音數據中的發音時間以及新文字內容的標準語音數據的發音時間,計算出平滑係數,再根據所述平滑係數,調整所述新文字內容的發音時間,由此使得替換前後語音數據的平滑和同步。
所述舊文字內容可以為空內容,也就是,替換所述空內容的新文字內容是遺漏的,現在需要添加的文字內容。
所述新文字內容可以為空內容,也就是,被替換的所述舊文字內容是多餘的,現在需要刪除的文字內容。
通過本發明的方法,提高了課堂錄製的水平,藉助時間戳的標識,分別保存各種數據,通過對語音數據的識別轉換和文本數據的修正,並根據修正的文本內容修正語音數據,修正了原始錄製語音數據中需要修正的內容,克服了課堂上「少說、錯說和漏說」等帶來的問題,可以獲得雙修正後的語音數據和文本數據(字幕信息)。
本發明的上述和進一步的目的以及特徵,根據結合附圖的以下詳細說明就會更加清楚和完整。
附圖說明
圖1是根據本發明的錄播系統架構圖;
圖2是根據本發明的錄播步驟流程圖;和
圖3是根據本發明的語音修正流程圖。
具體實施方式
以下,將結合附圖對本發明的具體實施方式進行進一步詳細的描述。
本發明中網絡教學不局限於學生和教師的課堂教學形式,其可以包括以教師和學生、或培訓人為參與主體的在線網絡教學、遠程網絡教學、本地網絡教學,和以企事業單位員工等為參與主體的在線網絡會議、遠程網絡會議、本地網絡會議,以及其他的利用網絡進行在線交流和/或文件內容展示的交流/交互形式,比如遠程協同工作。
如圖1所示,教師1、學生2分別使用安裝有網絡教學錄播系統客戶端的終端設備,通過網際網路連接至教學伺服器3,由此實現多媒體課堂的網絡授課/聽課/錄製/點播/回顧等。
所述終端設備包括:處理器、網絡模塊、控制模塊、顯示模塊以及智能作業系統,可以智慧型手機、pad、筆記本電腦、桌上型電腦等。所述終端上可以設有通過數據總線連接各種拓展類設備和配件的多種數據接口。所述智能作業系統包括windows、android及其改進、ios,在其上可以安裝、運行應用軟體,實現在智能作業系統下的各種應用軟體、服務和應用程式商店/平臺的功能。
終端設備可以通過rj45/wi-fi/藍牙/2g/3g/4g/g.hn/zigbee/z-ware/rfid等連接方式連接到網際網路,並藉助網際網路連接到其它的終端或其它電腦及設備,通過1394/usb/串行/sata/scsi/pci-e/thunderbolt/數據卡接口等多種數據接口或者總線方式,通過hdmi/ypbpr/spdif/av/dvi/vga/trs/scart/displayport等音視頻接口等連接方式,來連接各種拓展類設備和配件,組成了一個會議/教學設備互動系統。帶有軟體形式的聲音捕捉控制模塊和動作捕捉控制模塊,或通過數據總線板載硬體形式的聲音捕捉控制模塊和動作捕捉控制模塊,來實現聲控和形控功能;通過音視頻接口連接顯示/投影模塊、麥克風、音響設備和其它音視頻設備,來實現顯示、投影、聲音接入、音視頻播放,以及數字或模擬的音視頻輸入和輸出功能;通過數據接口連接攝像頭、麥克風、電子白板、rfid讀取設備,實現影像接入、聲音接入、電子白板的使用控制和錄屏,rfid讀取功能,並通過相應的接口可接入和管控移動存儲設備、數字設備和其它設備;通過dlna/igrs技術和網際網路技術,來實現的包括多屏設備之間的操控、互動和甩屏等功能。
本發明中,處理器定義為包括但不限於:指令執行系統,如基於計算機/處理器的系統、專用集成電路(asic)、計算設備、或能夠從非暫時性存儲介質或非暫時性計算機可讀存儲介質取得或獲取邏輯並執行非暫時性存儲介質或非暫時性計算機可讀存儲介質中包含的指令的硬體和/或軟體系統。所述處理器還可以包括任意控制器,狀態機,微處理器,基於網際網路的實體、服務或特徵,或它們的任意其它模擬的、數字的和/或機械的實現方式。
本發明中,網際網路可以包括區域網和廣域網際網路,可以是有線網際網路,也可以是無線網際網路,或者這些網絡的任意組合。
如圖2所示,根據本發明的網絡教學錄播的主要步驟:
s100:啟動錄播系統:用戶使用終端登錄,智能電子白板、教師終端屏幕操作動作捕捉程序、攝像機、麥克風等多媒體教學設備進入工作狀態,所述攝像機可以不止一個,所述麥克風包括至少一個,分別用於捕捉教師的語音和用於捕捉學生的語音,錄播系統的教學伺服器可以用於產生數字時間戳。
s200:開始網絡教學:教師開始課堂教學,錄播系統生成一個教學文件id,在教學過程中,比如教師使用智能電子白板進行展示(作為授課板書或者講解題板)、使用實時語音進行講解、使用實時交互語音進行交流、還可以在教師終端上使用電子文檔比如ppt文檔進行展示和說明,從而進行多媒體授課及與學生互動問答交流。
s300:錄製數據保存:在錄製過程中,智能電子白板上的動作以「動作數據流+時間戳」的方式傳輸和保存,授課及互動過程中的語音以「語音數據流+時間戳」的方式傳輸和保存,教師終端上涉及的電子文檔如ppt文檔的操作動作以「電子文檔操作數據流+時間戳」的方式傳輸和保存,採集的視頻數據以「視頻數據流+時間戳」的方式傳輸和保存。整個授課過程中的所有這些數據流與教學文件id綁定實現對應錄製課程的標識。這些數據,可以根據需要進行添加或刪減,一種典型的情況是所錄製數據包括語音數據、視頻數據和ppt文檔演示數據,而ppt文檔演示數據通常也可以以視頻數據的方式進行展示,不一定非要使用動作操作進行重現。在現有技術中,分類錄製分屏展示是比較成熟的技術。錄製得到的各種數據可以先保存到本地資料庫或者終端資料庫,再由這些資料庫通過網絡上傳到遠程教學伺服器,也可直接保存到遠程教學伺服器。
在一個示例中,對於語音數據的採集,可以使用語音採集設備比如各種可用的麥克風採集語音信號,將語音信號轉換成語音數據,以數據流格式保存。對於單一語音源的情況,可以標記出語音源的性別,這樣在進行後續語音修正(替換)操作時,可以選擇相應性別的標準語音。對於多個語音源的情況,可以分別識別出語音源的性別,這些多個語音源可以識別出來,添加時間戳後分別進行保存,將多個語音源分別識別出來的方法可以使用現有技術,在此不再贅述。
s400:語音數據轉換:對於錄製的原始語音數據,首先通過語音模型進行識別轉換形成原始文本數據,再對所述原始文本數據進行校對修正。在形成原始文本數據時,將原始語音數據的時間戳添加到文本數據中,使得可以對文本數據中的文字內容進行時間定位。所述文字內容可以是文本數據中的至少一個字、詞、句或段。通過所述時間定位獲取可以標記音頻數據的時間維度的時鐘數據,也就是可以相對定位一個音頻數據中某個數據片段的時間點的時鐘參數。
在進行識別轉換時,可以使用各種可用的語音模型將原始語音數據識別轉換為原始文本數據,在進行語音數據識別轉換時,首先識別語音源的性別,並且將性別信息添加到所述文本數據中。對於文本數據的校對修正包括人工校對、半自動校對、語音校對等。
s500:語音數據修正:使用語音修正指令即使用語音校對方式(cn106406807a)對原始文本數據進行修正,但是本發明不限於此。語音校對單元包括,接受語音修正指令,在待修正的文本數據中識別與所述語音修正指令讀音相同的所有文字以及這些文字內容的時間戳,確定識別出的所有文字中的待修正文字,顯示所述待修正文字對應的備選文字列表,接受備選文字選定指令,進行替換操作,形成修正文本數據,從而完成文本修正。
完成文本修正的過程中,從標準語音資料庫中調取修正文字的標準發音信息,根據被修正的文字的時間戳,用標準發音信息替換對應的語音數據片段,形成修正語音數據。所述標準語音資料庫可以包括女生標準語音資料庫、男生標準語音資料庫和/或個性化標準語音資料庫。所述個性化標準語音資料庫是,通過對於特定發音人錄製形成的標準語音資料庫,或者通過語料訓練,形成的特定發音人的語音模型,可以用於語音識別,還可以用於生成個性化標準語音資料庫。
在從標準語音數據中調取標準發音信息時,根據所述原始文本數據的語音源性別信息,或者其他個性化信息,選擇相應的標準語音。作為一種選擇,所述舊文字內容可以為空內容,也就是,替換所述空內容的新文字內容是遺漏的,現在需要添加的文字內容。所述新文字內容可以為空內容,也就是,被替換的所述舊文字內容是多餘的,現在需要刪除的文字內容。
如圖3所示,在一個示例中,語音修正的具體步驟如下:
s11:接收指令
當識別的文本數據發現問題時,如需要修正的文字為「胡建」,接收語音修正指令,如用戶可以通過此單元發出「選中胡建」的語音指令,發起修正問題文字「胡建」的指令。
s12:查找文字
在原始文本數據中識別與所述語音修正指令指定讀音相同的所有文字。
s13:確定文字
確定識別出的文本數據中的所有待修正文字。
其中,當在文本數據中出現多個與語音修正指令指定讀音相同的文字時,用戶可以通過進一步的語音指令明確哪個文字需要修正。例如,在待修正文本數據中從前往後識別出讀音為「hujian」的文字依次有:「胡建」、「互見」、「護肩」...等,用戶當前想要將識別出的第一個文字進行修正,則可發出「第一個」的語音來將識別出的第一個文字確定為當前待修正的文字。
s14:備選列表
顯示所述待修正的文字對應的備選文字列表;所述備選文字與所述待修正的文字同音。
其中,當選定了待修正的文字後,在所述文字的附近顯示同音的備選文字列表,便於用戶後續選擇備選文字。例如:若將文本數據中的第一個發音為「hujian」的文字「胡建」確定為待修正文字,則此步驟中在文本數據中的第一個發音為「hujian」的文字「胡建」附近顯示備選文字列表:1、福建;2、附件;3、護肩;4、互見,...
s15:選定指令
接收備選文字選定指令。
其中,用戶可以通過語音說出備選文字在備選文字列表中的位置,完成備選文字選中的工作。比如使用福建替換胡建。
s16:修正文字
將所述待修正文字修正為所述備選文字選定指令所指定的備選文字。在進行修正替換的過程中,將待修正文字的時間位置信息,以時間戳進行標記,從而準確定位被修正文字所對應的語音數據的時間位置信息。優選的是,在修正文本數據和語音數據流的過程中,形成修正歷史記錄,所述修正歷史記錄包括修正時間、修正內容、修正操作人等等。
s17:語音片段
從標準語音庫中,根據備選文字搜索其標準語音數據,如果多字詞或句子,就組合形成一段新的語音數據片段。優選的是,文本數據中包含有語音源的性別信息,在進行所述搜索時,就可以根據性別信息獲得女生發音或男生發音,或者各種高音、低音等不同的語音數據。
s18:語音替換
根據之前所述的時間位置信息,將所述新的語音數據片段替換原始語音數據中的相應語音數據片段,形成新的語音數據。優選的是,由於標準語音的發音時間和被替換的語音的發音時間,即使文字內容完全相同,發音時間也不一定相同,為了平滑的無縫替換,可以先根據兩個語音片段的發音時間計算出平滑係數,根據所述平滑係數,加快或減慢所述標準發音時間,使得替換後和替換前同樣文字內容的發音持續時間保持一致。
用戶使用終端通過網際網路登錄錄播系統,可以實現對錄製課堂的回顧播放或點播播放。當然,對於某些用戶比如網絡在線會議用戶,這些錄製課堂可以是網絡在線會議的過程記錄文件,錄播系統會把用戶請求回顧或點播的教學文件id通過socket加密信道發送給教學伺服器,通過教學文件id獲取此課程的帶有時間戳的動作數據流、語音數據流、電子文檔操作數據流、視頻數據流以及文本數據等發送給請求相應教學文件id的用戶終端,用戶終端在本地根據時間戳還原(重現或者模擬重現)整個課堂教學過程。這些數據流可以在用戶終端的各個功能區分別進行顯示或者切換式顯示。對於視頻一般可以在用戶終端上進行重現,但是對於電子白板的操作,通過電子白板的模擬程序,可以實現模擬重現。
當然,用戶可以選擇只播放這些數據流的至少一種,比如可以只聽語音。對於文本數據,可以以字幕的方式顯示在用戶終端的特定區域,比如視頻展示區內。
在一個示例中,起到字幕作用的文本數據可以顯示在特定的可編輯區域,使得用戶可以進行選定操作等,這樣對於發現的不標準的語音數據或者文字信息,只需要選定相應的文字信息即可進行反饋。錄播系統的管理員在接到用戶的反饋之後,進行核實,如果發現確實存在錯誤,就重複前面的文本數據和語音數據流的修正步驟,使得文本數據和語音數據能夠得到不斷的完善和改進。
在上述實施例中,終端和伺服器是可以由與包含網際網路在內的通信網絡進行連接的構成,所以也可以是以經由通信網絡下載程序代碼的方式流動地承載程序代碼的媒體。在這樣從通信網絡下載程序代碼的情況下,也可以是所述下載用的程序預先保存在主體裝置中或者從別的記錄媒體進行安裝的構成。此外,本發明可以通過上述程序代碼以電子傳輸所體現的、被嵌入於載波中的計算機數據信號的形態而得以實現。以上介紹了本發明的較佳實施方式,旨在使得本發明的精神更加清楚和便於理解,並不是為了限制本發明,凡在本發明的精神和原則之內,所做的修正、替換、改進,均應包含在本發明所附的權利要求概況的保護範圍之內。