新四季網

標點符號轉換方法及裝置製造方法

2023-05-01 05:01:31

標點符號轉換方法及裝置製造方法
【專利摘要】本發明涉及一種標點符號轉換方法,應用於將文本中以第一語言和/或第二語言輸入的標點符號轉換成以第三語言輸出的標點符號的轉換過程中,所述方法包括以下步驟:S1.查找所述文本中以第一語言和/或第二語言輸入的標點符號;S2.判斷查找到的所述標點符號是否需要轉換;以及S3.根據預設的標點符號映射表,將需要轉換的所述標點符號轉換成以第三語言輸出的標點符號,並保持不需要轉換的標點符號不變。本發明能夠實現在多語言混合情況下對標點符號的簡繁轉換,解決了混合文本中標點符號被誤轉的問題,提高了轉換效率,同時方便用戶對比轉換和結果。
【專利說明】標點符號轉換方法及裝置
【技術領域】
[0001]本發明涉及標點符號處理技術,尤其涉及一種標點符號轉換方法及裝置。
【背景技術】
[0002]眾所周知,目前使用的中文字體有兩種,一種是在中國大陸和新加坡等地區使用的簡體中文,另一種是在臺灣、香港和澳門等地區使用的繁體中文。然而,由於簡體中文和繁體中文之間的差異很大,因此,造成了使用這兩種文字的用戶在信息交流上的隔閡。為了消除這種隔閡,已經研製開發了一些簡繁轉換工具。通過這些簡繁轉換工具,可以很容易地實現簡體中文和繁體中文之間的轉換。此外,隨著計算機技術的發展,在一些網站(例如,Google)或文字編輯軟體(例如,微軟的Microsoft Word)中都會附有這類的簡繁轉換工具。
[0003]雖然現有的簡繁轉換工具已經能夠較為準確地實現文字間的簡繁轉換,但目前還沒有一款軟體能夠實現對文本中較複雜的標點符號(例如,雙引號)的簡繁轉換。此外,由於簡體中文和繁體中文對標點符號的設置不同,導致了在進行簡繁轉換時,存在一些標點符號無法被轉換或者被轉換成亂碼的情況,因此,仍需要用戶重新對轉換後的文本中的標點符號進行查找和判斷並做出正確的轉換。
[0004]另外,現有的簡繁轉換工具也無法實現對中文-非中文混合文本中的標點符號進行轉換。因為在中文-非中文混合文本中,非中文文本(例如,英文文本)通常使用與中文文本(簡體中文或繁體中文)不同的標點符號編碼,因此,在轉換過程中也同樣會出現如上所述的無法轉換或轉換成亂碼的情況,因此,為了保證整體的一致性,同樣需要用戶重新對轉換後的文件中的標點符號進行查找和判斷並做出正確的轉換。
[0005]綜上所述,由於現有技術還無法實現對標點符號的簡繁轉換,因此,用戶仍需花費大量的時間對轉換後的文件中的標點符號進行查找和判斷並做出正確的轉換,因此,有必要提出改進的技術手段以解決此問題。

【發明內容】

[0006]鑑於上述現有技術的缺陷,本發明的主要目的在於提供一種標點符號轉換方法及裝置,以解決現有技術存在的上述問題。
[0007]本發明針對現有技術中存在的問題,提供一種標點符號轉換方法及裝置,能夠在中文文本和中文-非中文混合文本中實現對標點符號的簡繁轉換,從而提高了轉換效率。
[0008]為實現上述目的,本發明的實施例提供了一種標點符號轉換方法,應用於將文本中以第一語言和/或第二語言輸入的標點符號轉換成以第三語言輸出的標點符號的轉換過程中,其中所述文本為選自中文文本和中文-非中文混合文本中的一種,所述第一語言和所述第三語言分別為選自簡體中文和繁體中文中的一種,所述第二語言為選自非中文語言中的一種,所述方法包括以下步驟:S1.查找所述文本中以第一語言和/或第二語言輸入的標點符號;S2.判斷查找到的所述標點符號是否需要轉換;以及S3.根據預設的標點符號映射表,將需要轉換的所述標點符號轉換成以第三語言輸出的標點符號,並保持不需要轉換的標點符號不變。
[0009]本發明的實施例還提供了一種標點符號轉換裝置,應用於將文本中以第一語言和/或第二語言輸入的標點符號轉換成以第三語言輸出的標點符號的轉換過程中,其中所述文本為選自中文文本和中文-非中文混合文本中的一種,所述第一語言和所述第三語言分別為選自簡體中文和繁體中文中的一種,所述第二語言為選自非中文語言中的一種,所述裝置包括:查找模塊,用於查找所述文本中以第一語言和/或第二語言輸入的標點符號;判斷模塊,用於判斷查找到的所述標點符號是否需要轉換;以及轉換模塊,用於根據預設的標點符號映射表,將需要轉換的所述標點符號轉換成以第三語言輸出的標點符號,並保持不需要轉換的標點符號不變。
[0010]綜上所述,本發明的標點符號轉換方法及裝置能夠實現在多種語言的混合情況下對標點符號的簡繁轉換,從而解決在混合文本中標點符號被誤轉的問題,並提高了轉換效率;此外,還能夠對文本中的標點符號加以突出顯示,從而便於用戶進行對比轉換以及校驗轉換後的結果。
【專利附圖】

【附圖說明】
[0011]圖1為本發明標點符號轉換方法的實施例流程圖;
[0012]圖2為本發明標點符號轉換裝置的實施例結構框圖。
【具體實施方式】
[0013]下面將詳細描述本發明的實施例。應當注意,這裡描述的實施例只用於舉例說明,並不用於限制本發明。
[0014]圖1為本發明標點符號轉換方法的實施例流程圖。本實施例的標點符號轉換方法應用於將文本中以第一語言和/或第二語言輸入的標點符號轉換成以第三語言輸出的標點符號的轉換過程中,其中所述文本為選自中文文本和中文-非中文混合文本中的一種,所述第一語言和所述第三語言分別為選自簡體中文和繁體中文中的一種,所述第二語言為選自非中文語言中的一種。如圖所示,所述方法包括以下步驟S1、S2和S3。
[0015]S1.查找文本中以第一語言和/或第二語言輸入的標點符號。
[0016]在一個實施例中,根據預設的規則,在文本中對以第一語言和/或第二語言輸入的標點符號進行查找。這裡,預設的規則是指第一語言和第二語言中所有標點符號對應的編碼表,文本可以是中文文本(例如,簡體中文文本或繁體中文文本),也可以是中文-非中文混合文本(例如,簡體中文-英文、簡體中文-德文、繁體中文-法文等);第一語言為選自簡體中文和繁體中文中的一種,而第二語言為選自非中文語言(例如,英文、德文、法文等)中的一種。
[0017]在一個實施例中,在所述步驟S I之後、所述步驟S2之前還包括步驟Sll.對查找到的所述標點符號加以突出顯示。具體而言,在一個實施例中,當查找到文本中以第一語言和/或第二語言輸入的標點符號時,會通過例如彈出對話框的方式提示用戶是否對查找到的標點符號加以突出顯示,如果用戶選擇是,則自動將查找到的標點符號標識出顏色,所述顏色可以是例如紅色、黃色、藍色等。需要注意的是,對所查找到的標點符號加以突出顯示的過程不僅限於「顏色」標識,也可以使用類似微軟的Microsoft Word中的「批註」模式來進行。通過上述突出顯示,能夠很容易地將文本中的標點符號與文字字符進行區分,使得標點符號能夠很清楚地被顯示,從而便於後續的判斷、轉換和校對。此外,突出顯示不僅限於對查找到的標點符號來進行,參考上述內容,在一個實施例中,也可以在轉換後的輸出文本中對標點符號加以突出顯示。
[0018]S2.判斷查找到的標點符號是否需要轉換。
[0019]在一個實施例中,步驟S2具體包括S21.判斷以第一語言和/或第二語言輸入的標點符號是否全部為中文標點符號,如果是則轉步驟S3,否則繼續步驟S22 ;S22.判斷非中文標點符號間是否包含中文字符或中文-非中文混合字符,如果是則轉步驟S3,否則僅轉換中文標點符號,而保持非中文標點符號不變。
[0020]參考上述內容,在一個實施例中,可通過以下步驟對所查找到的標點符號進行判斷,以確定是否需要進行轉換。首先,判斷所查找到的標點符號是否全部為中文標點符號(即,簡體標點符號或繁體標點符號),如果是,則根據預設的規則將上述以第一語言和/或第二語言輸入的中文標點符號轉換成以第三語言輸出的中文標點符號;如果同時包含中文標點符號和非中文標點符號,則保持其中的非中文標點符號不變,而將中文標點符號轉換成以第三語言輸出的中文標點符號。這裡,第三語言為選自簡體中文和繁體中文中的一種。接續,對上述未被轉換的非中文標點符號進行判斷,如果非中文標點符號中僅包含中文字符(例如,簡體或繁體中文的單字、詞組或句子等),則將非中文標點符號轉換成以第三語言輸出的中文標點符號;如果非中文標點符號中僅包含非中文字符(例如,英文單詞、詞組或句子等),則不需要對其進行轉換,即保持非中文標點符號不變;如果非中文標點符號中同時包含有中文字符和非中文字符,則與上述僅包含中文字符的情況一樣,將非中文標點符號轉換成以第三語言輸出的中文標點符號。也就是說,只有當非中文標點符號中僅包含非中文字符時才保持所述非中文標點符號不變,除此之外的其他情況下都需要將非中文標點符號轉換成中文標點符號。此外,在一個實施例中,用戶也可以直接選擇轉換所有標點符號。
[0021]S3.根據預設的標點符號映射表,將待轉換的標點符號轉換成以第三語言輸出的標點符號,並保持不需要轉換的標點符號不變。
[0022]在一個實施例中,根據預設的標點符號映射表,對待轉換的標點符號進行轉換。這裡所說的標點符號映射表是一張存儲有文本中以第一語言和/或第二語言輸入的標點符號與以第三語言輸出的標點符號 對應的映射關係的表,使得以第一語言和/或第二語言輸入的標點符號與以第三語言輸出的標點符號相關聯;從而能夠根據所述映射關係實現對所述標點符號的轉換。具體而言,在一個實施例中,簡體中文和/或非中文與繁體中文標點符號一一對應的映射關係可以如下表I所示(其中包括了簡體繁體中文轉換中單引號與雙引號的互相轉換),表I中的內容僅用於舉例說明,而並非用於限制本發明。
[0023]表I[0024]
【權利要求】
1.一種標點符號轉換方法,應用於將文本中以第一語言和/或第二語言輸入的標點符號轉換成以第三語言輸出的標點符號的轉換過程中,其中所述文本為選自中文文本和中文-非中文混合文本中的一種,所述第一語言和所述第三語言分別為選自簡體中文和繁體中文中的一種,所述第二語言為選自非中文語言中的一種,所述方法包括以下步驟:S1.查找所述文本中以第一語言和/或第二語言輸入的標點符號;S2.判斷查找到的所述標點符號是否需要轉換;以及S3.根據預設的標點符號映射表,將需要轉換的所述標點符號轉換成以第三語言輸出的標點符號,並保持不需要轉換的標點符號不變。
2.根據權利要求1所述的標點符號轉換方法,其中,所述步驟S2具體包括:S21.判斷所述以第一語言和/或第二語言輸入的標點符號是否全部為中文標點符號,如果是則轉步驟S3,否則繼續步驟S22 ;S22.判斷所述非中文標點符號間是否包含中文字符或中文-非中文混合字符,如果是則轉步驟S3,否則僅轉換所述中文標點符號,而保持所述非中文標點符號不變。
3.根據權利要求1所述的標點符號轉換方法,其中,所述步驟SI之後、所述步驟S2之前還包括:Sll.對查找到的所述標點符號加以突出顯示。
4.根據權利要求3所述的方法,其中,所述步驟S3之後還包括:S4.在所述轉換過程完成之後,判斷是否對所述以第三語言輸出的標點符號進行了修改且修改是否正確,如果是則確定是否清除所述突出顯示。
5.根據權利要求1所述的方法,其中,所述預設的標點符號映射表用於存儲所述文本中以第一語言和/或第二語言輸入的標點符號與以第三語言輸出的標點符號對應的映射關係,使所述以第一語言和/或第二語言輸入的標點符號與所述以第三語言輸出的標點符號相關聯;則所述步驟S3根據所述映射關係實現對所述標點符號的轉換。
6.一種標點符號轉換裝置,應用於將文本中以第一語言和/或第二語言輸入的標點符號轉換成以第三語言輸出的標點符號的轉換過程中,其中所述文本為選自中文文本和中文-非中文混合文本中的一種,所述第一語言和所述第三語言分別為選自簡體中文和繁體中文中的一種,所述第二語言為選自非中文語言中的一種,所述裝置包括:查找模塊,用於查找所述文本中以第一語言和/或第二語言輸入的標點符號;判斷模塊,用於判斷查找到的所述標點符號是否需要轉換;以及轉換模塊,用於根據預設的標點符號映射表,將需要轉換的所述標點符號轉換成以第三語言輸出的標點符號,並保持不需要轉換的標點符號不變。
7.根據權利要求6所述的標點符號轉換裝置,其中,所述判斷模塊包括:標點判斷單元,用於判斷所述以第一語言和/或第二語言輸入的標點符號是否全部為中文標點符號,如果是則通過所述轉換模塊進行轉換;字符判斷單元,用於判斷非中文標點符號間是否包含中文字符或中文-非中文混合字符,如果是則通過所述轉換模塊進行轉換。
8.根據權利要求6所述的標點符號轉換裝置,其中,所述裝置還包括:標識模塊,用於對查找到的所述標點符號加以突出顯示。
9.根據權利要求8所述的標點符號轉換裝置,其中,所述裝置還包括:清除模塊,用於在所述轉換過程完成之後,判斷是否對所述以第三語言輸出的標點符號進行了修改且修改是否正確,如果是則確定是否清除所述突出顯示。
10.根據權利要求6所述的標點符號轉換裝置,其中,所述預設的標點符號映射表用於存儲所述文本中以第一語言和/或第二語言輸入的標點符號與以第三語言輸出的標點符號一一對應的映射關係,使所述以第一語言和/或第二語言輸入的標點符號與所述以第三語言輸出的標點符號相關聯;則所述轉換模塊根據所述映射關係實現對所述標點符號的轉換。
【文檔編號】G06F17/22GK103514145SQ201210200998
【公開日】2014年1月15日 申請日期:2012年6月18日 優先權日:2012年6月18日
【發明者】朱純深, 郝天永 申請人:香港城市大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀