新四季網

一種通用的文件自動化解析處理系統的製作方法

2023-06-06 11:35:51 2

專利名稱:一種通用的文件自動化解析處理系統的製作方法
技術領域:
本發明涉及一種通用的文件自動化解析處理系統,屬於文件自動化處理技術領域。
背景技術:
日前,在完成工作任務中,經常需要對大量的計算機文件進行操作。按 照傳統的方法,需要設計人員通過特殊軟體將若干份含有計算機能夠識別的編碼文件手動生成人能識別的漢語文件,然後交由相關人員進行翻譯。並在翻譯結束後,由設計人員將 翻譯的文件一一手動生成計算機識別的編碼文件。這種手工方式帶來的問題是一方面由於需要操作的文件較多,內容繁瑣和不易識別,且不方便操作,極易出錯;另一方面消耗了設計人員大量的時間和精力。目前國內外文件自動解析處理方面大體分為三種一是針對特定的領域文件;二是處理特定的XML文件;三是對資料庫文件進行統計分析。以上情況存在的問題一是處理的對象具有針對性,業務比較單一,不具備滿足多領域文件、多種處理要求的通用性;二是不能通過簡單的配置或者修改來適應文件處理的通用性。

發明內容
本發明的技術解決問題針對現有技術的不足,提供一種通用的文件自動化解析處理系統,針對不同領域的各種文件,通過編寫PM、XML配置文件,完成文件的自動化處理,加快文件處理速度,提高效率,解放文件處理的人力資源,並充分利用計算機資源。本發明的技術解決方案一種通用的文件自動化解析處理系統,包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊;指令輸入模塊接收用戶指令並將用戶指令發送給控制模塊,所述用戶指令包括配置XML文件指令、配置PM文件指令和處理用戶文件指令;控制模塊根據用戶指令的類別調用不同的模塊,若用戶指令為配置XML文件指令,則調用XML文件配置模塊,由XML文件配置模塊讀取預設的XML文件,並且判斷該XML文件是否符合預定格式,僅當該XML文件正常,即符合預定格式時,由文件處理模塊將當前時間和該XML文件的名稱及內容存入資料庫,並且同時還將該XML文件存到XML文件指定目錄之中;若用戶指令為配置PM文件指令,則調用PM文件配置模塊,由PM文件配置模塊讀取預設的PM文件,之後由文件處理模塊將當前時間和該PM文件的名稱存入資料庫,並且同時還將該PM文件存到PM文件指定目錄之中;若用戶指令為處理用戶文件指令,則調用XML文件載入模塊,由XML文件載入模塊讀取存儲在XML文件指定目錄之中XML文件,之後由XML文件解析模塊對該XML文件進行解析,得到該XML文件中的對PM文件的關聯信息,並且根據所述關聯信息調用PM文件載入模塊將存儲在PM文件指定目錄中的PM文件載入,之後由文件處理模塊根據PM文件中的處理指令對用戶文件進行處理,再由文件輸出模塊將處理之後的用戶文件進行保存並輸出,即得到用戶需求文件。 所述XML文件的格式包括標題用於表示該XML文件的名稱;描述為該XML文件本身功能的介紹;關聯為該XML文件關聯到PM文件的描述;作者和日期為該XML文件的作者及生成日期;
·
所述PM文件採用Perl語言編寫,該PM文件中的內容為對用戶文件的操作指令。本發明與現有技術相比的有益效果是(I)本發明文件自動化解析處理系統更具有通用性本系統不局限於某種領域的某種文件,可以批量處理不同領域的、不同文件格式的大量文件。針對不同領域的不同需求,編寫PM文件、XML配置文件可實現各類文件的解析處理。(2)本發明中PM文件可復用性強本發明中的PM文件使用Perl語言編寫,允許調用、繼承、修改。鑑於此,在實現新功能時,利用現有的PM文件,可縮短PM文件實現周期,降低實現難度。


圖I為本發明系統組成框圖;具體的實施方式本發明提供了一種通用的文件自動化解析處理系統,如圖I所示,包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊;XML文件和PM文件是根據用戶需求預先編寫好的,XML文件的格式包括標題(Title):用於表示該XML文件的名稱;描述為該XML文件本身功能的介紹;例如包括該XML文件要處理的業務的介紹,以及該XML包含的所有關聯的PM文件的介紹等等;關聯為該XML文件關聯到PM文件的描述,指明了該XML文件要關聯到那個PM文件。作者和日期為該XML文件的作者及生成日期;PM文件採用Perl語言編寫,該PM文件中的內容為對用戶文件的操作指令。指令輸入模塊接收用戶指令並將用戶指令發送給控制模塊,所述用戶指令包括配置XML文件指令、配置PM文件指令和處理用戶文件指令;控制模塊根據用戶指令的類別調用不同的模塊,若用戶指令為配置XML文件指令,則調用XML文件配置模塊,由XML文件配置模塊讀取預設的XML文件,並且判斷該XML文件是否符合預定格式,僅當該XML文件正常,即符合預定格式時,由文件處理模塊將當前時間和該XML文件的名稱及內容存入資料庫,並且同時還將該XML文件存到XML文件指定目錄之中;若用戶指令為配置PM文件指令,則調用PM文件配置模塊,由PM文件配置模塊讀取預設的PM文件,之後由文件處理模塊將當前時間和該PM文件的名稱存入資料庫,並且同時還將該PM文件存到PM文件指定目錄之中;本發明中資料庫採用Mysql。若用戶指令為處理用戶文件指令,則調用XML文件載入模塊,由XML文件載入模塊讀取存儲在XML文件指定目錄之中XML文件,之後由XML文件解析模塊對該XML文件進行解析,得到該XML文件中的對PM文件的關聯信息,並且根據所述關聯信息調用PM文件載入模塊將存儲在PM文件指定目錄中的PM文件載入,之後由文件處理模塊根據PM文件中的處理指令對用戶文件進行處理,PM文件中是由Perl語言編寫的對用戶文件進行操作的命令,比如命令為刪除每一個用戶文件中第100行的內容,則文件處理模塊根據這個命令,順次將所有用戶文件中的第100行刪除,之後再由文件輸出模塊將處理之後的用戶文件進行保存並輸出,即得到用戶需求文件。第一次實際使用時,應先輸入配置XML文件指令和配置PM文件指令,將所有的預 設好的XML文件和PM文件註冊,之後再輸入處理用戶文件指令對用戶文件進行處理,執行過後,以後如果XML文件和PM文件沒有變動,就無需再對XML文件和PM文件註冊。本發明執行效率高由於使用Perl語言編寫PM文件,佔用資源少,執行速度快。通過對本發明系統進行測試,對一份5萬行文件進行解析處理的時間大約為0. 3秒。
權利要求
1.一種通用的文件自動化解析處理系統,其特徵在於包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊; 指令輸入模塊接收用戶指令並將用戶指令發送給控制模塊,所述用戶指令包括配置XML文件指令、配置PM文件指令和處理用戶文件指令;控制模塊根據用戶指令的類別調用不同的模塊, 若用戶指令為配置XML文件指令,則調用XML文件配置模塊,由XML文件配置模塊讀取預設的XML文件,並且判斷該XML文件是否符合預定格式,僅當該XML文件正常,即符合預定格式時,由文件處理模塊將當前時間和該XML文件的名稱及內容存入資料庫,並且同時還將該XML文件存到XML文件指定目錄之中; 若用戶指令為配置PM文件指令,則調用PM文件配置模塊,由PM文件配置模塊讀取預設的PM文件,之後由文件處理模塊將當前時間和該PM文件的名稱存入資料庫,並且同時還將該PM文件存到PM文件指定目錄之中; 若用戶指令為處理用戶文件指令,則調用XML文件載入模塊,由XML文件載入模塊讀取存儲在XML文件指定目錄之中XML文件,之後由XML文件解析模塊對該XML文件進行解析,得到該XML文件中的對PM文件的關聯信息,並且根據所述關聯信息調用PM文件載入模塊將存儲在PM文件指定目錄中的PM文件載入,之後由文件處理模塊根據PM文件中的處理指令對用戶文件進行處理,,再由文件輸出模塊將處理之後的用戶文件進行保存並輸出,即得到用戶需求文件。
2.根據權利要求I所述的一種通用的文件自動化解析處理系統,其特徵在於所述XML文件的格式包括 標題用於表不該XML文件的名稱; 描述為該XML文件本身功能的介紹; 關聯為該XML文件關聯到PM文件的描述; 作者和日期為該XML文件的作者及生成日期;
3.根據權利要求I所述的一種通用的文件自動化解析處理系統,其特徵在於所述PM文件採用Perl語言編寫,該PM文件中的內容為對用戶文件的操作指令。
全文摘要
一種通用的文件自動化解析處理系統,其特徵在於包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊。針對不同領域的各種文件,通過編寫PM、XML配置文件,完成文件的自動化處理,加快文件處理速度,提高效率,解放文件處理的人力資源,並充分利用計算機資源。
文檔編號G06F17/30GK102789495SQ20121024370
公開日2012年11月21日 申請日期2012年7月13日 優先權日2012年7月13日
發明者何文婷, 朱峰, 石雲, 鄒光南 申請人:航天恆星科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀