一種通用的文件自動化解析處理系統的製作方法
2023-06-06 11:35:51 2
專利名稱:一種通用的文件自動化解析處理系統的製作方法
技術領域:
本發明涉及一種通用的文件自動化解析處理系統,屬於文件自動化處理技術領域。
背景技術:
日前,在完成工作任務中,經常需要對大量的計算機文件進行操作。按 照傳統的方法,需要設計人員通過特殊軟體將若干份含有計算機能夠識別的編碼文件手動生成人能識別的漢語文件,然後交由相關人員進行翻譯。並在翻譯結束後,由設計人員將 翻譯的文件一一手動生成計算機識別的編碼文件。這種手工方式帶來的問題是一方面由於需要操作的文件較多,內容繁瑣和不易識別,且不方便操作,極易出錯;另一方面消耗了設計人員大量的時間和精力。目前國內外文件自動解析處理方面大體分為三種一是針對特定的領域文件;二是處理特定的XML文件;三是對資料庫文件進行統計分析。以上情況存在的問題一是處理的對象具有針對性,業務比較單一,不具備滿足多領域文件、多種處理要求的通用性;二是不能通過簡單的配置或者修改來適應文件處理的通用性。
發明內容
本發明的技術解決問題針對現有技術的不足,提供一種通用的文件自動化解析處理系統,針對不同領域的各種文件,通過編寫PM、XML配置文件,完成文件的自動化處理,加快文件處理速度,提高效率,解放文件處理的人力資源,並充分利用計算機資源。本發明的技術解決方案一種通用的文件自動化解析處理系統,包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊;指令輸入模塊接收用戶指令並將用戶指令發送給控制模塊,所述用戶指令包括配置XML文件指令、配置PM文件指令和處理用戶文件指令;控制模塊根據用戶指令的類別調用不同的模塊,若用戶指令為配置XML文件指令,則調用XML文件配置模塊,由XML文件配置模塊讀取預設的XML文件,並且判斷該XML文件是否符合預定格式,僅當該XML文件正常,即符合預定格式時,由文件處理模塊將當前時間和該XML文件的名稱及內容存入資料庫,並且同時還將該XML文件存到XML文件指定目錄之中;若用戶指令為配置PM文件指令,則調用PM文件配置模塊,由PM文件配置模塊讀取預設的PM文件,之後由文件處理模塊將當前時間和該PM文件的名稱存入資料庫,並且同時還將該PM文件存到PM文件指定目錄之中;若用戶指令為處理用戶文件指令,則調用XML文件載入模塊,由XML文件載入模塊讀取存儲在XML文件指定目錄之中XML文件,之後由XML文件解析模塊對該XML文件進行解析,得到該XML文件中的對PM文件的關聯信息,並且根據所述關聯信息調用PM文件載入模塊將存儲在PM文件指定目錄中的PM文件載入,之後由文件處理模塊根據PM文件中的處理指令對用戶文件進行處理,再由文件輸出模塊將處理之後的用戶文件進行保存並輸出,即得到用戶需求文件。 所述XML文件的格式包括標題用於表示該XML文件的名稱;描述為該XML文件本身功能的介紹;關聯為該XML文件關聯到PM文件的描述;作者和日期為該XML文件的作者及生成日期;
·
所述PM文件採用Perl語言編寫,該PM文件中的內容為對用戶文件的操作指令。本發明與現有技術相比的有益效果是(I)本發明文件自動化解析處理系統更具有通用性本系統不局限於某種領域的某種文件,可以批量處理不同領域的、不同文件格式的大量文件。針對不同領域的不同需求,編寫PM文件、XML配置文件可實現各類文件的解析處理。(2)本發明中PM文件可復用性強本發明中的PM文件使用Perl語言編寫,允許調用、繼承、修改。鑑於此,在實現新功能時,利用現有的PM文件,可縮短PM文件實現周期,降低實現難度。
圖I為本發明系統組成框圖;具體的實施方式本發明提供了一種通用的文件自動化解析處理系統,如圖I所示,包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊;XML文件和PM文件是根據用戶需求預先編寫好的,XML文件的格式包括標題(Title):用於表示該XML文件的名稱;描述為該XML文件本身功能的介紹;例如包括該XML文件要處理的業務的介紹,以及該XML包含的所有關聯的PM文件的介紹等等;關聯為該XML文件關聯到PM文件的描述,指明了該XML文件要關聯到那個PM文件。作者和日期為該XML文件的作者及生成日期;PM文件採用Perl語言編寫,該PM文件中的內容為對用戶文件的操作指令。指令輸入模塊接收用戶指令並將用戶指令發送給控制模塊,所述用戶指令包括配置XML文件指令、配置PM文件指令和處理用戶文件指令;控制模塊根據用戶指令的類別調用不同的模塊,若用戶指令為配置XML文件指令,則調用XML文件配置模塊,由XML文件配置模塊讀取預設的XML文件,並且判斷該XML文件是否符合預定格式,僅當該XML文件正常,即符合預定格式時,由文件處理模塊將當前時間和該XML文件的名稱及內容存入資料庫,並且同時還將該XML文件存到XML文件指定目錄之中;若用戶指令為配置PM文件指令,則調用PM文件配置模塊,由PM文件配置模塊讀取預設的PM文件,之後由文件處理模塊將當前時間和該PM文件的名稱存入資料庫,並且同時還將該PM文件存到PM文件指定目錄之中;本發明中資料庫採用Mysql。若用戶指令為處理用戶文件指令,則調用XML文件載入模塊,由XML文件載入模塊讀取存儲在XML文件指定目錄之中XML文件,之後由XML文件解析模塊對該XML文件進行解析,得到該XML文件中的對PM文件的關聯信息,並且根據所述關聯信息調用PM文件載入模塊將存儲在PM文件指定目錄中的PM文件載入,之後由文件處理模塊根據PM文件中的處理指令對用戶文件進行處理,PM文件中是由Perl語言編寫的對用戶文件進行操作的命令,比如命令為刪除每一個用戶文件中第100行的內容,則文件處理模塊根據這個命令,順次將所有用戶文件中的第100行刪除,之後再由文件輸出模塊將處理之後的用戶文件進行保存並輸出,即得到用戶需求文件。第一次實際使用時,應先輸入配置XML文件指令和配置PM文件指令,將所有的預 設好的XML文件和PM文件註冊,之後再輸入處理用戶文件指令對用戶文件進行處理,執行過後,以後如果XML文件和PM文件沒有變動,就無需再對XML文件和PM文件註冊。本發明執行效率高由於使用Perl語言編寫PM文件,佔用資源少,執行速度快。通過對本發明系統進行測試,對一份5萬行文件進行解析處理的時間大約為0. 3秒。
權利要求
1.一種通用的文件自動化解析處理系統,其特徵在於包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊; 指令輸入模塊接收用戶指令並將用戶指令發送給控制模塊,所述用戶指令包括配置XML文件指令、配置PM文件指令和處理用戶文件指令;控制模塊根據用戶指令的類別調用不同的模塊, 若用戶指令為配置XML文件指令,則調用XML文件配置模塊,由XML文件配置模塊讀取預設的XML文件,並且判斷該XML文件是否符合預定格式,僅當該XML文件正常,即符合預定格式時,由文件處理模塊將當前時間和該XML文件的名稱及內容存入資料庫,並且同時還將該XML文件存到XML文件指定目錄之中; 若用戶指令為配置PM文件指令,則調用PM文件配置模塊,由PM文件配置模塊讀取預設的PM文件,之後由文件處理模塊將當前時間和該PM文件的名稱存入資料庫,並且同時還將該PM文件存到PM文件指定目錄之中; 若用戶指令為處理用戶文件指令,則調用XML文件載入模塊,由XML文件載入模塊讀取存儲在XML文件指定目錄之中XML文件,之後由XML文件解析模塊對該XML文件進行解析,得到該XML文件中的對PM文件的關聯信息,並且根據所述關聯信息調用PM文件載入模塊將存儲在PM文件指定目錄中的PM文件載入,之後由文件處理模塊根據PM文件中的處理指令對用戶文件進行處理,,再由文件輸出模塊將處理之後的用戶文件進行保存並輸出,即得到用戶需求文件。
2.根據權利要求I所述的一種通用的文件自動化解析處理系統,其特徵在於所述XML文件的格式包括 標題用於表不該XML文件的名稱; 描述為該XML文件本身功能的介紹; 關聯為該XML文件關聯到PM文件的描述; 作者和日期為該XML文件的作者及生成日期;
3.根據權利要求I所述的一種通用的文件自動化解析處理系統,其特徵在於所述PM文件採用Perl語言編寫,該PM文件中的內容為對用戶文件的操作指令。
全文摘要
一種通用的文件自動化解析處理系統,其特徵在於包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊。針對不同領域的各種文件,通過編寫PM、XML配置文件,完成文件的自動化處理,加快文件處理速度,提高效率,解放文件處理的人力資源,並充分利用計算機資源。
文檔編號G06F17/30GK102789495SQ20121024370
公開日2012年11月21日 申請日期2012年7月13日 優先權日2012年7月13日
發明者何文婷, 朱峰, 石雲, 鄒光南 申請人:航天恆星科技有限公司