標籤保護方法
2023-09-23 13:35:15 1
專利名稱:標籤保護方法
技術領域:
本發明涉及一種文字處理技術,具體說,涉及一種標籤保護方法。
背景技術:
HTML (Hypertext Markup Language,文本標記語言)是用於描述網頁文檔的一種標記語言。XML(Extensible Markup Language,可擴展標記語言),它與HTML—樣,都是 SGML (Standard Generalized Markup Language,標準通用標記語言);Xml 是 Internet 環境中跨平臺的,依賴於內容的技術,是當前處理結構化文檔信息的有力工具。在使用計算機輔助翻譯的過程中,有一個環節是修改譯文,這就要求準確無誤。特別是在攜帶了標籤的譯文翻譯中極其容易修改到標籤和標籤裡面的內容。目前解決該技術問題的方案大都採取高亮警示或隱藏標籤的處理方式,有著多種弊端。高亮警示方式無法避免疲勞刪除和誤刪,隱藏標籤徹底排除了標籤的同時也破壞了原譯文格式的完整性。
發明內容
有鑑於現有技術無法避免高效地翻譯過程中譯文被誤修改或者無法看到整個譯文造成翻譯失誤的問題,本發明提供了一種標籤保護方法,徹底消除人為誤修改造成翻譯譯稿質量低下的問題。技術方案如下一種標籤保護方法,包括編制識別規則,所述識別規則用於識別網頁內容中包含有標籤的一段文本內容;讀取文本,根據所述識別規則識別輸入文本中的標籤;獲取所述輸入文本中所有標籤在文本框內的起始索引和長度,所述起始索引和長度記錄有保護內容在文本裡的地址信息;根據起始索引和長度,對識別出的有效標籤進行標記並實現保護。進一步所述標籤包括html標籤、xml標籤或者類似 標籤。進一步根據識別規則識別輸入文本中的標籤過程中,判定為含標籤文本後,以從頭到尾的順序找到標籤,並記錄下每個標籤在文本裡的起始索引和該標籤的長度。進一步採用染色或者高亮顯示的方式對有效標籤進行標記。技術效果包括1、利用本發明,在翻譯譯文的過程中能夠保證譯文格式完整性的同時,高亮標籤界定出標籤的保護範圍,實現高亮保護色塊,徹底消除人為誤修改造成翻譯譯稿質量低下的問題。2、使用本發明標籤保護,可以兼顧譯文內容的完整與翻譯的有的放矢,避免誤修改,達到提高翻譯效率和稿件質量的效果。
圖1是本發明中標籤保護方法的流程圖;圖2是本發明中標籤保護方法實現的用戶界面(User Interface, UI)界面圖,其中顏色高亮部分為標籤保護範圍。
具體實施例方式下面參考附圖和優選實施例,對本發明技術方案作詳細描述。步驟1 編制識別規則,識別規則用於識別網頁內容中包含標籤的一段文本內容;本發明所提供的標籤保護涉及到的標籤包括html標籤、xml標籤及類似 標籤。Uhtml標籤識別規則用於識別網頁內容和凡包含了 html標籤的一段文本內容。以html標籤為例,讀取了一段文本後,使用正則表達式識別html標籤。關於要保護的html標籤的識別規則見下表表Ihtml標籤識別規則
權利要求
1.一種標籤保護方法,包括編制識別規則,所述識別規則用於識別網頁內容中包含有標籤的一段文本內容; 讀取文本,根據所述識別規則識別輸入文本中的標籤;獲取所述輸入文本中所有標籤在文本框內的起始索引和長度,所述起始索引和長度記錄有保護內容在文本裡的地址信息;根據起始索引和長度,對識別出的有效標籤進行標記並實現保護。
2.如權利要求1所述的標籤保護方法,其特徵在於所述標籤包括html標籤、xml標籤或者類似 標籤。
3.如權利要求2所述的標籤保護方法,其特徵在於根據識別規則識別輸入文本中的標籤過程中,判定為含標籤文本後,以從頭到尾的順序找到標籤,並記錄下每個標籤在文本裡的起始索引和該標籤的長度。
4.如權利要求1至3任一項所述的標籤保護方法,其特徵在於採用染色或者高亮顯示的方式對有效標籤進行標記。
全文摘要
本發明公開了一種標籤保護方法,包括編制識別規則,所述識別規則用於識別網頁內容中包含有標籤的一段文本內容;讀取文本,根據所述識別規則識別輸入文本中的標籤;獲取所述輸入文本中所有標籤在文本框內的起始索引和長度,所述起始索引和長度記錄有保護內容在文本裡的地址信息;根據起始索引和長度對識別出的有效標籤進行標記並實現保護。本發明技術方案徹底消除了人為誤修改所造成翻譯譯稿質量低下的問題。
文檔編號G06F17/28GK102495835SQ20111032164
公開日2012年6月13日 申請日期2011年10月21日 優先權日2011年10月21日
發明者江潮 申請人:傳神聯合(北京)信息技術有限公司