文件重構裝置的製作方法
2023-06-01 06:40:36 4

本發明涉及文件重構裝置。
背景技術:
jp-a-2004-287829公開了一種圖像數據分類設備。在給出指示存儲圖像數據和圖像數據的特徵量的存儲設備中存儲的圖像數據必須被包括在特定組中的指令的情況下,圖像數據分類設備將圖像數據的特徵量與和該組關聯的特徵量進行比較,從而確定將圖像數據包括在組中是否合適。在將圖像數據包括在組中合適的情況下,圖像數據分類設備將圖像數據包括在組中並且將圖像數據存儲在存儲設備中。在將圖像數據包括在組中不合適的情況下,圖像數據分類設備輸出指示圖像數據不合適的消息。
另外,jp-a-2005-031934公開了一種圖像處理系統,該圖像處理系統獲取諸如帳票的文檔作為多條圖像數據,根據帳票的類型將所獲取的多條圖像數據分類,並且存儲分類的圖像數據。圖像處理系統被構造成保持待分類的帳票的特徵,使用帳票的特徵從所獲取的多條圖像數據來識別帳票,在不可從識別結果來指定圖像數據的分類目的地的情況下獲取第二帳票的圖像數據以識別該帳票,並且使用識別結果來指定分類目的地。
技術實現要素:
這裡,在採用以頁為單位將包括多個頁的輸入文件與基準圖像核對的構造的情況下,已經成功進行核對的頁以一頁為單位歸檔並且輸出(分類)。一般,一個輸入文件中包括的多個頁可具有諸如前-後關係的關聯性。然而,在採用以頁為單位歸檔已經成功進行核對的頁的方法的情況下,難以在分類之後參照一個輸入文件中的已經成功進行核對的多個頁或者參照一個輸入文件中的包括已經成功進行核對的頁和無法進行核對的頁的多個頁。
本發明的目的是使得更容易隨後參照包括從含多個頁的輸入文件中提取的頁的兩個或更多個頁。
根據本發明的第一方面,提供了一種文件重構裝置,該文件重構裝置包括:
提取單元,其從包括多個頁的輸入文件提取符合預定條件的頁;以及
創建單元,其創建輸出文件,所述輸出文件包括由所述提取單元從所述輸入文件提取的兩個或更多個符合頁。
根據本發明的第二方面,根據第一方面所述的文件重構裝置還可包括:
核對單元,其將所述輸入文件中的各個頁的圖像與被預先確定是所述條件的基準圖像進行核對,
其中,所述提取單元可從所述輸入文件提取由所述核對單元已經成功與所述基準圖像執行核對的頁作為所述符合頁。
根據本發明的第三方面,在根據第二方面所述的文件重構裝置中,
其中,在處於所述條件下的所述基準圖像包括第一基準圖像和第二基準圖像的情況下,所述創建單元可創建所述輸出文件,所述輸出文件包括:
所述輸入文件中的由所述核對單元已經成功與所述第一基準圖像執行核對的一個或更多個符合頁,以及
所述輸入文件中的由所述核對單元已經成功與所述第二基準圖像執行核對的一個或更多個符合頁。
根據本發明的第四方面,在根據第三方面所述的文件重構裝置中,在所述條件包括第一條件和第二條件的情況下,所述創建單元可創建第一輸出文件和第二輸出文件作為所述輸出文件,所述第一條件包括所述第一基準圖像和所述第二基準圖像中的一個作為所述基準圖像,所述第二條件包括所述第一基準圖像和所述第二基準圖像中的另一個作為所述基準圖像,所述第一輸出文件包括所述輸入文件中的由所述核對單元已經成功與所述第一基準圖像執行核對的兩個或更多個頁,所述第二輸出文件包括所述輸入文件中的由所述核對單元已經成功與所述第二基準圖像執行核對的兩個或更多個頁。
根據本發明的第五方面,提供了一種文件重構裝置,該文件重構裝置包括:
提取單元,其從包括多個頁的輸入文件提取符合預定條件的頁;以及
創建單元,其創建輸出文件,所述輸出文件包括
由所述提取單元從所述輸入文件提取的單個符合頁,以及
所述輸入文件中的與所述符合頁連續的並且由於不符合所述條件而導致未由所述提取單元從所述輸入文件提取的一個或更多個不符合頁。
根據本發明的第六方面,根據第五方面所述的文件重構裝置還可包括:
核對單元,其將所述輸入文件中的各個頁的圖像與被預先確定是所述條件的基準圖像進行核對,
其中,所述提取單元可從所述輸入文件提取由所述核對單元已經成功與所述基準圖像執行核對的頁作為所述符合頁。
根據本發明的第七方面,提供了一種文件重構裝置,該文件重構裝置包括:
提取單元,其從包括多個頁的輸入文件提取符合預定條件的頁和與符合頁連續的預定數量的連續頁;以及
創建單元,其創建輸出文件,所述輸出文件包括單個符合頁和由所述提取單元從所述輸入文件提取的一個或更多個連續頁。
根據本發明的第八方面,根據第七方面所述的文件重構裝置還可包括:
核對單元,其將所述輸入文件中的各個頁的圖像與被預先確定是所述條件的基準圖像進行核對,
其中,所述提取單元可從所述輸入文件提取由所述核對單元已經成功與所述基準圖像執行核對的頁作為所述符合頁。
根據本發明的第一方面,可以隨後更容易地參照包括從包括多個頁的輸入文件提取的頁的兩個或更多個頁。
根據本發明的第二方面,可以得到包括對應於基準圖像的頁的輸出文件。
根據本發明的第三方面,可以得到包括與具有不同內容的多個基準圖像對應的頁的輸出文件。
根據本發明的第四方面,可以得到具有不同內容的相應多個基準圖像的輸出文件。
根據本發明的第五方面,可以隨後更容易地參照包括從包括多個頁的輸入文件提取的頁的兩個或更多個頁。
根據本發明的第六方面,可以得到包括對應於基準圖像的頁的輸出文件。
根據本發明的第七方面,可以隨後更容易地參照包括從包括多個頁的輸入文件提取的頁的兩個或更多個頁。
根據本發明的第八方面,可以得到包括對應於基準圖像的頁的輸出文件。
附圖說明
將基於附圖詳細地描述本發明的示例性實施方式,其中:
圖1是示出這個示例性實施方式的圖像數據分類系統的構造示例的示圖;
圖2是示出圖像形成設備中設置的控制單元的構造的框圖;
圖3是示出規則表的概況的示圖;
圖4是示出伺服器設備中設置的圖像存儲單元的構造的框圖;
圖5a至圖5e是示出輸入文件的示例的示圖;
圖6是示出提取組合分類處理的過程的流程圖;
圖7是示出關於提取組合分類處理的第一具體示例的示圖;
圖8是示出關於提取組合分類處理的第二具體示例的示圖;
圖9是示出關於提取組合分類處理的第三具體示例的示圖;
圖10是示出連續組合分類處理的過程的流程圖;
圖11是示出圖10中示出的臨時存儲區域輸出處理(子程序)的過程的流程圖;
圖12是示出關於連續組合分類處理的第一具體示例的示圖;以及
圖13是示出關於連續組合分類處理的第二具體示例的示圖。
具體實施方式
下文中,將參照附圖詳細描述本發明的示例性實施方式。
圖像數據分類系統的構造
圖1是示出這個示例性實施方式的圖像數據分類系統的構造示例的示圖。
圖像數據分類系統包括:圖像形成設備1,其具有掃描功能、列印功能、複印功能和傳真功能,以像所謂的多功能機器一樣操作;網絡2和電話線路6,其連接到圖像形成設備1;終端設備3和伺服器設備5,其連接到網絡2;以及傳真設備4,其連接到電話線路6。
這裡,網絡2包括網際網路線路等。另外,終端設備3通過網絡2將各條數據(包括圖像數據)發送到圖像形成設備1並且從圖像形成設備1接收各條數據,並且包括例如個人計算機(pc)。另外,傳真設備4通過電話線路6將傳真發送到圖像形成設備1並且從圖像形成設備1接收傳真。另外,伺服器設備5通過網絡2將各條數據(包括圖像數據和程序)發送到圖像形成設備1並且從圖像形成設備1接收各條數據。
另外,圖像形成設備1包括:圖像讀取單元10,其讀取記錄在諸如紙張的記錄介質中的圖像;圖像形成單元20,其在諸如紙的記錄介質上形成圖像;用戶接口(ui)30,其接收與使用電源的打開或關閉、掃描功能、列印功能、複印功能和傳真功能的操作相關的用戶指令並且向用戶顯示消息;發送和接收單元40,其通過網絡2將數據發送到終端設備3和伺服器設備5並且從終端設備3和伺服器設備5接收數據並且通過電話線路6將數據發送到傳真設備4並且從傳真設備4接收數據;以及控制單元50,其控制圖像讀取單元10、圖像形成單元20、ui30和發送和接收單元40的操作。
圖像數據分類系統的操作
這裡,將簡要描述圖1中示出的圖像數據分類系統執行的分類處理的概況。
首先,設置在圖像形成設備1中的控制單元50從控制單元50的外部獲取一個輸入文件。這裡,輸入文件被構造成包括一個或更多個頁。另外,輸入文件的示例包括通過網絡2和發送和接收單元40從不同於它自身的設備的終端設備3發送的輸入文件、通過電話線路6和發送和接收單元40從不同於它自身的設備的傳真設備4發送的輸入文件、通過用它自身的設備內的圖像讀取單元10讀取原始文檔而得到的輸入文件等。
接下來,控制單元50以頁為單位分析從外部獲取的一個輸入文件。隨後,控制單元50基於構成輸入文件的頁的分析結果將頁分類,以對一個或更多個輸出文件執行重構。另外,控制單元50向著不同於它自身的設備的伺服器設備5輸出通過重構一個輸入文件而得到的一個或更多個輸出文件。
從控制單元50輸出的輸出文件通過發送和接收單元40和網絡2被發送到伺服器設備5。另外,伺服器設備5存儲接收到的輸出文件。
設置在圖像形成設備中的控制單元的構造
圖2是示出圖像形成設備1中設置的控制單元50的構造的框圖。
同時,圖2隻示出與圖1中示出的圖像數據分類系統執行的圖像數據分類處理相關的功能塊,並且將不描述與圖像讀取單元10等的操作的控制相關的功能塊。
控制單元50包括讀取出並且執行程序的中央處理單元(cpu),存儲供cpu執行的程序、在執行程序時使用的數據等的只讀存儲器(rom),存儲在執行程序時暫時生成的數據等的隨機存取存儲器(ram),和存儲在執行程序時使用的數據等、能夠將其內容重寫並且即使當沒有被供應電源時也能夠保持所存儲的內容(所有這些都未在附圖中示出)的電可擦除可編程只讀存儲器(eeprom)。這裡,除了被預先存儲在rom或eeprom中之外,設置在控制單元50中的cpu執行的程序還可在存儲在諸如cd-rom的存儲介質中的狀態下提供到cpu,或者還可通過網絡2提供到cpu。
控制單元50包括輸入和輸出單元51、劃分單元52、核對單元53、重構單元54和存儲單元55。另外,存儲單元55包括規則存儲區域55a和暫時存儲區域55b。
輸入和輸出單元51向/從控制單元50、圖像讀取單元10、圖像形成單元20、ui30和發送和接收單元40輸入/輸出各條數據(包括以上提到的輸入文件和輸出文件)。
在從輸入和輸出單元51輸入的輸入文件包括多個頁的情況下,劃分單元52將輸入文件劃分成頁單位。同時,在下面的描述中,構成輸入文件的頁的圖像數據將被稱為「目標圖像數據」。
核對單元53將從劃分單元52輸入的目標圖像數據與存儲在存儲單元55的規則存儲區域55a中的規則表中登記的基準圖像數據進行核對。可應用各種已知方法作為在核對單元53中採用的核對方法。另外,核對單元53基於目標圖像數據和基準圖像數據之間的核對的結果,在必要時將特定頁的目標圖像數據存儲在存儲單元55的臨時存儲區域55b中。同時,隨後將詳細描述規則表和基準圖像數據。
重構單元54基於核對單元53執行的目標圖像數據和基準圖像數據之間的核對的結果,將以上提到的輸入文件重構成均包括一個或更多個頁的一個或更多個輸出文件。
在存儲單元55中,規則存儲區域55a存儲以上提到的規則表,臨時存儲區域55b存儲特定頁的目標圖像數據。這裡,規則存儲區域55a可包括eeprom等,臨時存儲區域55b可包括ram等。
這裡,在這個示例性實施方式中,控制單元50是文件重構裝置的示例。另外,劃分單元52、核對單元53、重構單元54和存儲單元55是提取單元和創建單元的示例。另外,核對單元53是核對單元的示例。
規則表的概況
圖3是示出用作圖像數據分類處理中的分類規則的規則表的概況的示圖。規則表被存儲在圖2中示出的存儲單元55的規則存儲區域55a中。
在這個示例性實施方式的規則表中,賦予各個總體規則(被稱為整體規則)的整體規則名、相對於各個整體規則而設置的分類類型、賦予在整體規則之中設置的一個或更多個規則(被稱為個體規則)的個體規則名、在各個個體規則中設置的輸出目的地、文件名前綴和基準圖像彼此關聯。這裡,在圖3中示出的示例中,四個整體規則(第一整體規則r1至第四整體規則r4)被登記在規則表中。
在圖3中示出的規則表中,分類類型指示圖像數據分類處理的類型,並且提取組合(分類處理)或連續組合(分類處理)被設置用於分類類型。這裡,「提取組合分類處理」是指以下處理:從構成輸入文件的一個或更多個頁(目標圖像數據)提取與帳票(基準圖像數據)核對成功的頁(核對成功頁)並且將所提取的一個或更多個核對成功頁彼此組合從而構成一批輸出文件。另外,「連續組合分類處理」是指以下處理:提取與帳票(基準圖像數據)核對成功的頁(核對成功頁)和與核對成功頁連續並且與帳票(基準圖像數據)核對失敗的頁(核對失敗頁),並且將所提取的一個或更多個核對成功頁和與核對成功頁連續的一個或更多個核對失敗頁彼此組合從而構成一批輸出文件。同時,隨後,將詳細描述「提取組合分類處理」和「連續組合分類處理」。
另外,個體規則中的輸出目的地被設置成用於存儲符合個體規則的輸出文件的文件夾名稱。同時,在這個示例中,所有輸出目的地都被設置為在伺服器設備5的圖像存儲單元500(參見隨後將描述的圖4)中提供的文件夾。
另外,個體規則中的文件名前綴被設置成被賦予符合個體規則的輸出文件的文件名的頭部的名稱。同時,在這個示例中,從隨後將描述的多條基準圖像基準圖像數據的名稱來確定所有文件名前綴。
另外,個體規則中的基準圖像包括一條或更多條基準圖像基準圖像數據。這裡,將在獨立描述四個整體規則之前,描述圖3中描述的基準圖像中的「批准書」、「申請書a」、「申請書b」、「申請書c」和「申請書d」。
首先,「批准書」是用於所謂批准的文檔,並且以特定形式形成。另外,「申請書a」是例如用於相對於契約a發出請求的文檔,並且以與不同於「批准書」的特定形式形成。另外,「申請書b」是例如用於相對於契約b發出請求的文檔,並且以與不同於「批准書」和「申請書a」的特定形式形成。另外,「申請書c」是例如用於相對於契約c發出請求的文檔,並且以與不同於「批准書」、「申請書a」和「申請書b」的特定形式形成。另外,「申請書d」是例如用於相對於契約d發出請求的文檔,並且以與不同於「批准書」、「申請書a」、「申請書b」和「申請書c」的特定形式形成。下文中,文檔(包括電子文檔)以如同「批准書」、「申請書a」、「申請書b」、「申請書c」和「申請書d」的特定形式形成,並且被作為基準圖像登記在規則表中的文檔(包括電子文檔)將被稱為「帳票」。
同時,由用戶設置和登記整體規則的內容。也就是說,從設置在圖像形成設備1、通過網絡2連接到圖像形成設備1的終端設備3等中的ui30接收的與整體規則(包括個體規則)相關的設置被登記在控制單元50中的存儲單元55的規則存儲區域55a中。另外,在這個示例中,選擇存儲在規則存儲區域55a中的多個整體規則中的任一個並且將其設置在控制單元50中。
然後,將參照圖3詳細描述第一整體規則r1至第四整體規則r4中的每個的內容。
在第一整體規則r1中,分類類型被設置成「提取組合」,個體規則被設置成1(個體規則名:個體規則a)。這裡,在個體規則a中,輸出目的地被設置成「規則a文件夾」,文件名前綴被設置成「申請書abcd_」。另外,在個體規則a中,基準圖像被設置成「批准書」、「申請書a」、「申請書b」、「申請書c」和「申請書d」。
在第二整體規則r2中,分類類型被設置成「提取組合」,個體規則被設置成2(個體規則名:個體規則b和個體規則c)。這裡,在個體規則b中,輸出目的地被設置成「規則b文件夾」,文件名前綴被設置成「申請書ab_」。另外,在個體規則b中,基準圖像被設置成「批准書」、「申請書a」和「申請書b」。另一方面,在個體規則c中,輸出目的地被設置成「規則c文件夾」,文件名前綴被設置成「申請書cd_」。另外,在個體規則c中,基準圖像被設置成「申請書c」和「申請書d」。另外,在包括在第二整體規則r2中的個體規則c和個體規則d中,個體規則的內容(輸出目的地、文件名前綴和基準圖像)沒有彼此重疊。
在第三整體規則r3中,分類類型被設置成「連續組合」,個體規則被設置成1(個體規則名:個體規則d)。這裡,在個體規則d中,輸出目的地被設置成「規則d文件夾」,文件名前綴被設置成「批准書n_」(這裡,n是序數)。另外,在個體規則d中,基準圖像被設置成「批准書」。
在第四整體規則r4中,分類類型被設置成「連續組合」,個體規則被設置成2(個體規則名:個體規則e和個體規則f)。這裡,在個體規則e中,輸出目的地被設置成「規則e文件夾」,文件名前綴被設置成「批准書n_」(這裡,n是序數)。另外,在個體規則e中,基準圖像被設置成「批准書」。另一方面,在個體規則f中,輸出目的地被設置成「規則f文件夾」,文件名前綴被設置成「申請書an_」(這裡,n是序數)。另外,在個體規則f中,基準圖像被設置成「申請書a」。另外,在包括在第四整體規則r4中的個體規則e和個體規則f中,個體規則的內容(輸出目的地、文件名前綴和基準圖像)沒有彼此重疊。
以這種方式,在圖3中示出的示例中,第一整體規則r1和第二整體規則r2的分類類型被設置成「提取組合」,而第三整體規則r3和第四整體規則r4的分類類型被設置成「連續組合」。另外,在分類類型被設置成「提取組合」的第一整體規則r1和第二整體規則r2中,第一整體規則r1中設置的個體規則的數量是1個(單個),而第二整體規則r2中設置的個體規則的數量是2個(多個)。另一方面,另外,在分類類型被設置成「連續組合」的第三整體規則r3和第四整體規則r4中,第三整體規則r3中設置的個體規則的數量是1個(單個),而第四整體規則r4中設置的個體規則的數量是2個(多個)。
這裡,在這個示例性實施方式中,構成第一整體規則r1和第二整體規則r2的個體規則中設置的多個基準圖像中的兩個用作第一基準圖像和第二基準圖像。另外,在這個示例性實施方式中,構成第二整體規則r2和第四整體規則r4的多個個體規則中分別設置的基準圖像用作一個基準圖像(第一條件)和另一個基準圖像(第二條件)。
伺服器設備中設置的圖像存儲單元的構造
圖4是示出圖1中示出的伺服器設備5中設置的圖像存儲單元500的構造的示圖。
圖像存儲單元500包括諸如硬碟驅動(hdd)或固態驅動(ssd)的輔助存儲裝置。在這個示例中,在圖像存儲單元500的存儲區域中設置規則a文件夾501、規則b文件夾502、規則c文件夾503、規則d文件夾504、規則e文件夾505、規則f文件夾506、和規則外文件夾507。
規則a文件夾501對應於圖3中示出的個體規則a的輸出目的地,並且存儲包括滿足個體規則a的圖像數據的輸出文件。規則b文件夾502對應於圖3中示出的個體規則b的輸出目的地,並且存儲包括滿足個體規則b的圖像數據的輸出文件。規則c文件夾503對應於圖3中示出的個體規則c的輸出目的地,並且存儲包括滿足個體規則c的圖像數據的輸出文件。規則d文件夾504對應於圖3中示出的個體規則d的輸出目的地,並且存儲包括滿足個體規則d的圖像數據的輸出文件。規則e文件夾505對應於圖3中示出的個體規則e的輸出目的地,並且存儲包括滿足個體規則e的圖像數據的輸出文件。規則f文件夾506對應於圖3中示出的個體規則f的輸出目的地,並且存儲包括滿足個體規則f的圖像數據的輸出文件。規則外文件夾507存儲包括不滿足各整體規則中設置的個體規則的圖像數據的輸出文件。具體地,規則外文件夾507例如在設置第一整體規則r1的情況下存儲包括不滿足個體規則a的圖像數據的輸出文件,例如在設置第二整體規則r2的情況下存儲包括不滿足個體規則b和個體規則c的圖像數據的輸出文件。
輸入文件
圖5a至圖5e是示出這個示例性實施方式中使用的輸入文件的示例的示圖。這裡,圖5a示出第一輸入文件f1,圖5b示出第二輸入文件f2,圖5c示出第三輸入文件f3,圖5d示出第四輸入文件f4,圖5e示出第五輸入文件f5。同時,在隨後描述的具體示例中使用第一輸入文件f1至第五輸入文件f5。
這裡,在獨立地描述圖5a至圖5e之前,將描述圖5a至圖5e中示出的「批准書m」、「申請書am」、「申請書bm」、「申請書cm」、「申請書dm」和「附加文檔m」(這裡,m是序數)。
首先,「批准書m」意指以圖3中示出的「批准書」的形式寫入例如手寫字符等的文檔。另外,「申請書am」意指以圖3中示出的「申請書a」的形式寫入例如手寫字符等的申請書。另外,「申請書bm」意指以圖3中示出的「申請書b」的形式寫入例如手寫字符等的申請書。另外,「申請書cm」意指以圖3中示出的「申請書c」的形式寫入例如手寫字符等的申請書。另外,「申請書dm」意指以圖3中示出的「申請書d」的形式寫入例如手寫字符等的申請書。另外,「附加文檔m」指示除了以上提到的各種帳票(「批准書」、「申請書a」、「申請書b」、「申請書c」和「申請書d」)外的內容。
圖5a中示出的第一輸入文件f1包括七頁的多條目標圖像數據。這裡,在七頁的多條目標圖像數據之中,第二頁(p2)和第三頁(p3)是帳票,並且剩餘頁(p1、p4至p7:五頁)是附加文檔(附加文檔1至5)。另外,在兩頁的帳票之中,第二頁(p2)是對應於基準圖像的「批准書」的批准書1(第一)並且第三頁(p3)是對應於基準圖像的「申請書a」的申請書a1(第一)。以這種方式,第一輸入文件f1包括一頁的「批准書」和一頁的「申請書a」作為帳票。
圖5b中示出的第二輸入文件f2包括十二頁的多條目標圖像數據。這裡,在十二頁的多條目標圖像數據之中,第二頁(p2)、第三頁(p3)、第六頁(p6)、第七頁(p7)、第十頁(p10)和第十一頁(p11)是帳票,並且剩餘頁(p1、p4、p5、p8、p9、p12:六頁)是附加文檔(附加文檔1至6)。另外,在六頁的帳票之中,第二頁(p2)是對應於基準圖像的「批准書」的批准書1(第一)並且第三頁(p3)是對應於基準圖像的「申請書a」的申請書a1(第一)。另外,第六頁(p6)是對應於基準圖像的「批准書」的批准書2(第二)並且第七頁(p7)是對應於基準圖像的「申請書b」的申請書b1(第一)。另外,第十頁(p10)是對應於基準圖像的「申請書c」的申請書c1(第一)並且第十一頁(p11)是對應於基準圖像的「批准書」的批准書3(第三)。以這種方式,第二輸入文件f2包括三頁的「批准書」、一頁的「申請書a」、一頁的「申請書b」和一頁的「申請書c」。
圖5c中示出的第三輸入文件f3包括十二頁的多條目標圖像數據。這裡,在十二頁的多條目標圖像數據之中,第二頁(p2)、第三頁(p3)、第六頁(p6)、第七頁(p7)、第八頁(p8)、第十頁(p10)和第十一頁(p11)是帳票,並且剩餘頁(p1、p4、p5、p9、p12:五頁)是附加文檔(附加文檔1至5)。另外,在七頁的帳票之中,第二頁(p2)是對應於基準圖像的「批准書」的批准書1(第一)並且第三頁(p3)是對應於基準圖像的「申請書a」的申請書a1(第一)。另外,第六頁(p6)是對應於基準圖像的「批准書」的批准書2(第二)並且第七頁(p7)是對應於基準圖像的「申請書b」的申請書b1(第一)。另外,第八頁(p8)是對應於基準圖像的「申請書c」的申請書c1(第一)並且第十頁(p10)是對應於基準圖像的「申請書d」的申請書d1(第一)。另外,第十一頁(p11)是對應於基準圖像的「批准書」的批准書3(第三)。以這種方式,第三輸入文件f3包括三頁的「批准書」、一頁的「申請書a」、一頁的「申請書b」、一頁的「申請書c」和一頁的「申請書d」作為帳票。
圖5d中示出的第四輸入文件f4包括七頁的多條目標圖像數據。這裡,在七頁的多條目標圖像數據之中,第三頁(p3)和第六頁(p6)是帳票,並且剩餘頁(p1、p2、p4、p5、p7:五頁)是附加文檔(附加文檔1至5)。另外,在兩頁的帳票之中,第三頁(p3)是對應於基準圖像的「批准書」的批准書1(第一)並且第六頁(p6)是對應於基準圖像的「批准書」的批准書2(第二)。以這種方式,第四輸入文件f4包括兩頁的「批准書」作為帳票。
圖5e中示出的第五輸入文件f5包括十二頁的多條目標圖像數據。這裡,在十二頁的多條目標圖像數據之中,第二頁(p2)、第三頁(p3)、第六頁(p6)、第八頁(p8)、第十頁(p10)和第十一頁(p11)是帳票,並且剩餘頁(p1、p4、p5、p7、p9、p12:六頁)是附加文檔(附加文檔1至6)。另外,在六頁的帳票之中,第二頁(p2)是對應於基準圖像的「批准書」的批准書1(第一)並且第三頁(p3)是對應於基準圖像的「申請書a」的申請書a1(第一)。另外,第六頁(p6)是對應於基準圖像的「批准書」的批准書2(第二)並且第八頁(p8)是對應於基準圖像的「申請書a」的申請書a2(第二)。另外,第十頁(p10)是對應於基準圖像的「申請書a」的申請書a3(第三)並且第十一頁(p11)是對應於基準圖像的「批准書」的批准書3(第三)。以這種方式,第五輸入文件f5包括三頁的「批准書」和三頁的「申請書a」作為帳票。
同時,儘管這裡已經將五個示例描述為輸入文件,但輸入文件的構造不限於此,並且頁的數量不限於七個或十二個。另外,儘管這裡將輸入文件包括多個頁的情況描述為示例,但輸入文件可包括單個頁。另外,儘管這裡在假定輸入文件包括帳票和附加文檔的情況下已經給出了描述,但輸入文件可包括僅僅帳票或僅僅附加文檔。
圖像數據分類系統中的分類處理
然後,將更詳細地描述這個示例性實施方式的圖像數據分類系統中的分類處理。同時,這裡,首先將描述「提取組合分類處理」,然後,將描述「連續組合分類處理」。
提取組合分類處理的過程
圖6是示出提取組合分類處理的過程的流程圖。
在這個示例性實施方式中,通過設置在圖像形成設備1中的控制單元50(cpu)來執行圖6中示出的處理。同時,這裡,在圖像形成設備1的控制單元50中,假定預先從存儲單元55的規則存儲區域55a讀取出並且設置包括提取組合分類處理的執行的整體規則(圖3中示出的第一整體規則r1或第二整體規則r2)。
在這個處理中,首先,劃分單元52通過輸入和輸出單元51獲取輸入文件(步驟10)。然後,劃分單元52將設置在存儲單元55中的暫時存儲區域55b初始化(步驟12)。
接下來,劃分單元52確定步驟10中獲取的輸入文件是否包括多個頁(步驟14)。在步驟14中的確定結果是肯定(「是」)的情況下,劃分單元52以頁為單位來劃分輸入文件(步驟16),並且將所劃分的輸入文件輸出到核對單元53,並且處理前進至下一個步驟18。另一方面,在步驟14中的確定結果是否定(「否」)的情況下,劃分單元52在不執行劃分的情況下將輸入文件原樣地輸出到核對單元53,並且處理前進至下一個步驟18。
隨後,核對單元53將頁編號x設置成1(步驟18)並且將輸入文件中的第x頁的目標圖像數據與和整體規則關聯的一條或更多條基準圖像數據進行核對。另外,確定第x頁的核對是否已經成功(在輸入文件中是否存在與第x頁具有相同的目標圖像和形式的基準圖像)(步驟20)。
在步驟20中的確定結果是肯定(「是」)的情況下(在第x頁是符合頁的情況下),核對單元53與個體規則關聯地將第x頁的目標圖像數據存儲在存儲單元55的暫時存儲區域55b中(步驟22),並且處理前進至下一個步驟26。另一方面,在步驟20中的確定結果是否定(「否」)的情況下(在第x頁是不符合頁的情況下),核對單元53將第x頁的目標圖像數據輸出到重構單元54。重構單元54將第x頁的目標圖像數據重構為一個文件,並且將重構後的目標圖像數據輸出到與個體規則關聯的輸出目的地(步驟24),並且處理前進至下一個步驟26。同時,在步驟24中,重構單元54通過輸入和輸出單元51將所得到的文件作為輸出文件輸出到外部(這裡,發送和接收單元40)。另外,輸出文件通過網絡2被發送到伺服器設備5,並且被存儲在設置在伺服器設備5的圖像存儲單元500中的規則外文件夾507中。
隨後,核對單元53確定第x頁的目標圖像數據是否是輸入文件中的最後一頁(步驟26)。在步驟26中的確定結果是否定(「否」)的情況下,核對單元53將頁編號更新成x=x+1(步驟28),並且返回步驟20,繼續與下一頁的目標圖像數據相關的處理。
另一方面,在步驟26中的確定結果是肯定(「是」)的情況下,重構單元54以逐個個體規則為基礎將存儲在存儲單元55的暫時存儲區域55b中的一個或更多個頁的多條目標圖像數據分批成一個文件並且存儲分批的文件(步驟30)。這裡,在步驟30中,有可能創建與和整體規則關聯的個體規則的數量相同數量的文件(例如,在個體規則的數量是1個的情況下的一個文件或者個體規則的數量是2個的情況下的兩個文件)。另外,在步驟30中,在僅僅一頁的多條目標圖像數據被存儲在暫時存儲區域55b中的情況下,創建包括一頁的多條目標圖像數據的文件。
然後,重構單元54向步驟30中創建的各文件賦予通過將與個體規則關聯的文件名前綴加到各文件的原始輸入文件的文件名而得到的文件名(步驟32)。
另外,重構單元54通過輸入和輸出單元51將被賦予步驟32中的文件名的各文件作為輸出文件輸出到外部(這裡,發送和接收單元40)(步驟34)。另外,輸出文件通過網絡2被發送到伺服器設備5,並且被存儲在除了設置在伺服器設備5的圖像存儲單元500中的規則外文件夾507外的文件夾(在這個示例中,就提取組合分類處理而言,規則a文件夾501至規則c文件夾503中的任一個)中。
此後,劃分單元52確定是否存在下一個輸入文件(步驟36)。在步驟36中的確定結果是肯定(「是」)的情況下,劃分單元52返回步驟10,繼續相對於下一個輸入文件進行處理。另一方面,在步驟36中的確定結果是否定(「否」)的情況下,處理終止。
關於提取組合分類處理的具體示例
然後,將參照三個具體示例描述上述的提取組合分類處理。
第一具體示例
圖7是示出關於提取組合分類處理的第一具體示例的示圖。
這裡,這個示例中使用的分類規則在該圖的左側示出。另外,這個示例中使用的輸入文件在該圖的右上側示出。另外,這個示例中的分類結果在該圖的右下側示出。同時,其間的關係與隨後將描述的圖8、圖9、圖12和圖13中的關係相同。
在第一具體示例中,分類規則是第一整體規則r1。因此,待設置的個體規則只是個體規則a,輸出目的地被設置成「規則a文件夾」,並且基準圖像被設置成「批准書」、「申請書a」、「申請書b」、「申請書c」和「申請書d」。
另外,在第一具體示例中,輸入文件是第一輸入文件f1。第一輸入文件f1包括總共七頁的多條目標圖像數據,包括兩頁的帳票(批准書1和申請書a1)(另外參見圖5a)。
然後,將根據圖6中示出的流程圖,對在設置第一整體規則r1的狀態下對第一輸入文件f1執行處理的情況下的分類結果給出描述。
在這種情況下,在步驟20中,並非是帳票的第一頁(p1)的附加文檔1和第四頁(p4)至第七頁(p7)的附加文檔2至5被確定是否定(「否」),因此在步驟24中附加文檔被作為個體輸出文件順序地輸出。然而,五個輸出文件(輸出1至輸出5)不包括帳票,因此其輸出目的地沒有被設置成設置在個體規則a中的規則a文件夾501,而是被設置成規則外文件夾507。另外,五個輸出文件(輸出1至輸出5)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則外文件夾507中。
另一方面,在步驟20中,作為帳票的第二頁(p2)的批准書1和第三頁(p3)的申請書a1被確定是肯定(「是」),因此在步驟22中,批准書和申請書在與個體規則a關聯的狀態下存儲在暫時存儲區域55b中。另外,當按照第七頁(p7)即最後一頁的核對的執行,步驟26中的確定結果是肯定(「是」)時,在步驟30中將與個體規則a關聯的兩頁分批成一個文件,然後,在步驟32中,將添加有與個體規則a關聯的文件名前綴「申請書abcd_」的文件名「申請書abcd_f1」賦予原始輸入文件名(這裡,被稱為「f1」)。然後,在步驟34中,使用規則a文件夾501輸出被賦予文件名「申請書abcd_f1」的輸出文件(輸出6),規則a文件夾501被作為輸出目的地設置在個體規則a中。此後,輸出文件(輸出6)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則a文件夾501中。
同時,當通過在步驟30中將多個頁分批來創建一個文件時,新文件(輸出文件)中的頁的次序可匹配原始輸入文件中的頁的次序(可按升序來排列輸入文件中的頁編號)。同時,這與隨後將描述的圖8中示出的第二具體示例和圖9中示出的第三具體示例相同。
第二具體示例
圖8是示出關於提取組合分類處理的第二具體示例的示圖。
在第二具體示例中,分類規則是與上述第一具體示例類似的第一整體規則r1。因此,待設置的個體規則只是個體規則a,輸出目的地被設置成「規則a文件夾」,並且基準圖像被設置成「批准書」、「申請書a」、「申請書b」、「申請書c」和「申請書d」。
另外,在第二具體示例中,輸入文件是第二輸入文件f2。第二輸入文件f2包括總共十二頁的多條目標圖像數據,包括六頁的帳票(批准書1、申請書a1、批准書2、申請書b1、批准書3、申請書c1和批准書3)(另外參見圖5b)。
以這種方式,第一具體示例和第二具體示例就分類規則而言是彼此相同的並且待處理的輸入文件的內容互不相同。
然後,將根據圖6中示出的流程圖,對在設置第一整體規則r1的狀態下對第二輸入文件f2執行處理的情況下的分類結果給出描述。
在這種情況下,在步驟20中,並非是帳票的第一頁(p1)的附加文檔1、第四頁(p4)的附加文檔2、第五頁(p5)的附加文檔3、第八頁(p8)的附加文檔4、第九頁(p9)的附加文檔5和第十二頁(p12)的附加文檔6被確定是否定(「否」),因此在步驟24中附加文檔被作為個體輸出文件順序地輸出。然而,六個輸出文件(輸出1至輸出6)不包括帳票,因此其輸出目的地沒有被設置成設置在個體規則a中的規則a文件夾501,而是被設置成規則外文件夾507。另外,六個輸出文件(輸出1至輸出5)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則外文件夾507中。
另一方面,在步驟20中,作為帳票的第二頁(p2)的批准書1、第三頁(p3)的申請書a1、第六頁(p6)的批准書2、第七頁(p7)的申請書b1、第十頁(p10)的申請書c1和第十一頁(p11)的批准書3被確定是肯定(是),因此在步驟22中,批准書和申請書在與個體規則a關聯的狀態下存儲在暫時存儲區域55b中。另外,按照第十二頁(p12)即最後一頁的核對的執行,在步驟30中將與個體規則a關聯的六頁分批成一個文件,然後,在步驟32中,將添加有與個體規則a關聯的文件名前綴「申請書abcd_」的文件名「申請書abcd_f2」賦予原始輸入文件名(這裡,被稱為「f2」)。然後,在步驟34中,使用規則a文件夾501輸出被賦予文件名「申請書abcd_f2」的輸出文件(輸出7),規則a文件夾501被作為輸出目的地設置在個體規則a中。此後,輸出文件(輸出7)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則a文件夾501中。
第三具體示例
圖9是示出關於提取組合分類處理的第三具體示例的示圖。
在第三具體示例中,分類規則是與上述第一具體示例和第二具體示例不同的第二整體規則r2。因此,待設置的個體規則是個體規則b和個體規則c二者。這裡,個體規則b中的輸出目的地被設置成「規則b文件夾」,並且基準圖像被設置成「批准書」、「申請書a」和「申請書b」。另一方面,個體規則c中的輸出目的地被設置成「規則c文件夾」並且基準圖像被設置成「申請書c」和「申請書d」。
另外,在第三具體示例中,輸入文件是第三輸入文件f3。第三輸入文件f3包括總共十二頁的多條目標圖像數據,包括七頁的帳票(另外參見圖5c)。
以這種方式,第一具體示例和第二具體示例就分類規則和待處理的輸入文件的內容而言不同於第三具體示例。
然後,將根據圖6中示出的流程圖,對在設置第二整體規則r2的狀態下對第三輸入文件f3執行處理的情況下的分類結果給出描述。
在這種情況下,在步驟20中,並非是帳票的第一頁(p1)的附加文檔1、第四頁(p4)的附加文檔2、第五頁(p5)的附加文檔3、第九頁(p9)的附加文檔4和第十二頁(p12)的附加文檔5被確定是否定(「否」),因此在步驟24中附加文檔被作為個體輸出文件順序地輸出。然而,五個輸出文件(輸出1至輸出5)不包括帳票,因此其輸出目的地沒有被設置成設置在個體規則b中的規則b文件夾502或設置在個體規則c中的規則c文件夾502,而是被設置成規則外文件夾507。另外,五個輸出文件(輸出1至輸出5)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則外文件夾507中。
另一方面,在步驟20中,作為帳票的第二頁(p2)的批准書1、第三頁(p3)的申請書a1、第六頁(p6)的批准書2、第七頁(p7)的申請書b1、第八頁(p8)的申請書c1、第十頁(p10)的申請書d1和第十一頁(p11)的批准書3被確定是肯定(是),因此在步驟22中,批准書和申請書被存儲在暫時存儲區域55b中。然而,在這個示例中,符合個體規則b的批准書1、申請書a1、批准書2、申請書b1和批准書3在與個體規則b關聯的狀態下被存儲在暫時存儲區域55b中。另一方面,在這個示例中,符合個體規則c的申請書c1和申請書d1在與個體規則c關聯的狀態下被存儲在暫時存儲區域55b中。
另外,當按照第十二頁(p12)即最後一頁的核對的執行,步驟26中的確定結果是肯定(「是」)時,在步驟30中將與個體規則b關聯的五頁分批成一個文件,然後,在步驟32中,將添加有與個體規則b關聯的文件名前綴「申請書ab_」的文件名「申請書ab_f3」賦予原始輸入文件名(這裡,被稱為「f3」)。另外,在步驟34中,使用規則b文件夾502輸出被賦予文件名「申請書ab_f3」的輸出文件(輸出6),規則b文件夾502被作為輸出目的地設置在個體規則b中。此後,輸出文件(輸出6)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則b文件夾502中。
另外,在步驟30中,將與個體規則c關聯的兩頁分批成一個文件,然後,在步驟32中,將添加有與個體規則c關聯的文件名前綴「申請書cd_」的文件名「申請書cd_f3」賦予原始輸入文件名(這裡,被稱為「f3」)。另外,在步驟34中,使用規則c文件夾503輸出被賦予文件名「申請書cd_f3」的輸出文件(輸出7),規則c文件夾503被作為輸出目的地設置在個體規則c中。此後,輸出文件(輸出7)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則c文件夾503中。
連續組合分類處理的過程
圖10是示出連續組合分類處理的過程的流程圖。
在這個示例性實施方式中,通過設置在圖像形成設備1中的控制單元50(cpu)來執行圖10(和隨後將描述的圖11)中示出的處理。同時,這裡,在圖像形成設備1的控制單元50中,假定預先從存儲單元55的規則存儲區域55a讀取出並且設置包括連續組合分類處理的執行的整體規則(圖3中示出的第三整體規則r3或第四整體規則r4)。
在這個處理中,首先,劃分單元52通過輸入和輸出單元51獲取輸入文件(步驟40)。然後,劃分單元52將設置在存儲單元55中的暫時存儲區域55b初始化(步驟42)。
接下來,劃分單元52確定步驟40中獲取的輸入文件是否包括多個頁(步驟44)。在步驟44中的確定結果是肯定(「是」)的情況下,劃分單元52以頁為單位來劃分輸入文件(步驟46),並且將所劃分的輸入文件輸出到核對單元53,並且處理前進至下一個步驟48。另一方面,在步驟44中的確定結果是否定(「否」)的情況下,劃分單元52在不執行劃分的情況下將輸入文件原樣地輸出到核對單元53,並且處理前進至下一個步驟48。
隨後,核對單元53將頁編號x設置成1(步驟48)並且將輸入文件中的第x頁的目標圖像數據與和整體規則關聯的一條或更多條基準圖像數據核對。另外,確定第x頁的核對是否已經成功(在輸入文件中是否存在與第x頁具有相同的目標圖像和形式的基準圖像)(步驟50)。
在步驟50中的確定結果是肯定(「是」)的情況下(在第x頁是符合頁的情況下),核對單元53確定設置在存儲單元55中的暫時存儲區域55b是否為空(是否存在已經被存儲的目標圖像數據(頁))(步驟52)。在步驟52中的確定結果是否定(「否」)的情況下,重構單元54執行作為子程序的暫時存儲區域輸出處理(步驟54),並且將暫時存儲區域55b清空,並且處理前進至下一個步驟56。另一方面,在步驟52中的確定結果是肯定(「是」)的情況下,處理原樣地前進至下一個步驟56。同時,隨後將詳細描述步驟54中示出的暫時存儲區域輸出處理。
接下來,核對單元53將第x頁的目標圖像數據存儲在暫時存儲區域55b中(步驟56),並且處理前進至下一個步驟62。
另一方面,在步驟50中的確定結果是否定(「否」)的情況下(在第x頁是不符合頁的情況下),核對單元53確定設置在存儲單元55中的暫時存儲區域55b是否為空(步驟58)。在步驟58中的確定結果是否定(「否」)的情況下,處理前進至以上提到的步驟56,並且核對單元53將第x頁的目標圖像數據存儲在暫時存儲區域55b中並且處理前進至下一個步驟62。另一方面,在步驟58中的確定結果是肯定(「是」)的情況下,核對單元53將第x頁的目標圖像數據輸出到重構單元54。重構單元54將第x頁的目標圖像數據重構成一個文件,並且將重構後的數據輸出到與個體規則關聯的輸出目的地(步驟60),並且處理前進至下一個步驟62。同時,在步驟60中,重構單元54通過輸入和輸出單元51將所得到的文件作為輸出文件輸出到外部(這裡,發送和接收單元40)。另外,輸出文件通過網絡2被發送到伺服器設備5,並且被存儲在設置在伺服器設備5的圖像存儲單元500中的規則外文件夾507中。
隨後,核對單元53確定第x頁的目標圖像數據是否是輸入文件中的最後一頁(步驟62)。在步驟62中的確定結果是否定(「否」)的情況下,核對單元53將頁編號更新成x=x+1(步驟64),並且返回步驟50,繼續與下一頁的目標圖像數據相關的處理。
另一方面,在步驟62中的確定結果是肯定(「是」)的情況下,重構單元54執行作為子程序的暫時存儲區域輸出處理(步驟66),並且將暫時存儲區域55b清空,並且處理前進至下一個步驟68。同時,步驟66中示出的暫時存儲區域輸出處理具有與以上提到的步驟54中執行的內容相同的內容。
此後,劃分單元52確定是否存在下一個輸入文件(步驟68)。在步驟68中的確定結果是肯定(「是」)的情況下,劃分單元52返回步驟40,繼續相對於下一個輸入文件進行處理。另一方面,在步驟68中的確定結果是否定(「否」)的情況下,處理終止。
圖11是示出圖10中示出的臨時存儲區域輸出處理(子程序)的過程的流程圖。在圖10中示出的步驟54和步驟66中的每個中,執行暫時存儲區域輸出處理。
在這個處理中,首先,重構單元54以帳票開頭將存儲在存儲單元55的暫時存儲區域55b中的一個或更多個頁的多條目標圖像數據分批成一個文件並且存儲分批的文件(步驟70)。也就是說,在步驟70中,必須創建一個文件。另外,在步驟70中,在只有一頁的多條目標圖像數據被存儲在暫時存儲區域55b中的情況下,創建包括一頁的多條目標圖像數據的文件。
然後,重構單元54向步驟70中創建的一個文件賦予通過將與個體規則關聯的文件名前綴加到文件的原始輸入文件的文件名而得到的文件名(步驟72)。
另外,重構單元54通過輸入和輸出單元51將被賦予步驟72中的文件名的一個文件作為輸出文件輸出到外部(這裡,發送和接收單元40)(步驟74)。另外,輸出文件通過網絡2被發送到伺服器設備5,並且被存儲在除了設置在伺服器設備5的圖像存儲單元500中的規則外文件夾507外的文件夾(在這個示例中,就連續組合分類處理而言,規則d文件夾504至規則f文件夾506中的任一個)中。
此後,重構單元54將設置在存儲單元55中的暫時存儲區域55b初始化(步驟76),並且返回圖10中示出的連續組合分類處理的主程序。
連續組合分類處理的具體示例
接下來,將參照兩個具體示例描述上述連續組合分類處理。
第一具體示例
圖12是示出關於連續組合分類處理的第一具體示例的示圖。
在第一具體示例中,分類規則是第三整體規則r3。因此,待設置的個體規則只是個體規則d,輸出目的地被設置成「規則d文件夾」,並且基準圖像被設置成「批准書」。
另外,在第一具體示例中,輸入文件是第四輸入文件f4。第四輸入文件f4包括總共七頁的多條目標圖像數據,包括兩頁的帳票(批准書1和批准書2)(另外參見圖5d)。
然後,將根據圖10和圖11中示出的流程圖,對在設置第三整體規則r3的狀態下對第四輸入文件f4執行處理的情況下的分類結果給出描述。
在這種情況下,首先,在步驟50中,並非是帳票的第一頁(p1)的附加文檔1和第二頁(p2)的附加文檔2被確定是否定(「否」),然後在步驟58中其被確定是肯定的(「是」),因此在步驟60中附加文檔被作為個體輸出文件順序地輸出。然而,兩個輸出文件(輸出1和輸出2)不包括帳票,因此其輸出目的地沒有被設置成設置在個體規則d中的規則d文件夾504,而是被設置成規則外文件夾507。另外,兩個輸出文件(輸出1和輸出2)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則外文件夾507中。
另外,在步驟50中,作為帳票的第三頁(p2)的批准書1被確定是肯定(「是」),然後在步驟52中被確定是肯定(「是」),因此在步驟56中,批准書被存儲在暫時存儲區域55b中。接下來,在步驟50中,並非是帳票的第四頁(p4)的附加文檔3和第五頁(p5)的附加文檔4被確定是否定(「否」),然後在步驟58中其被確定是否定(「否」),因此,在步驟56中,將附加文檔連同以上提到的第三頁(p3)的批准書1一起存儲在暫時存儲區域55b中。
另外,在步驟50中,作為帳票的第六頁(p6)的批准書2被確定是肯定(「是」),然後在步驟52中被確定是否定(「否」)。因此,執行步驟54中示出的暫時存儲區域輸出處理(子程序),在步驟70中,將存儲在暫時存儲區域55b中的三頁(批准書1、附加文檔3和附加文檔4)分批成一個文件,批准書1作為第一頁。然後,在步驟72中,將添加有與個體規則d關聯的文件名前綴「批准書1_」的文件名「批准書1_f4」賦予原始輸入文件名(這裡,被稱為「f4」)。另外,在步驟74中,使用規則d文件夾504輸出被賦予文件名「批准書1_f4」的輸出文件(輸出3),規則d文件夾504被作為輸出目的地設置在個體規則d中。此後,輸出文件(輸出3)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則d文件夾504中。另外,在輸出輸出文件(輸出3)之後,在步驟76中將暫時存儲區域55b初始化,並且完成步驟54的處理。
然後,在步驟56中,作為帳票的第六頁(p6)的批准書2被存儲在暫時存儲區域55b中。接下來,在步驟50中,並非帳票的第七頁(p7)的附加文檔5被確定是否定(「否」),然後在步驟58中被確定是否定(「否」),因此,在步驟56中,將附加文檔連同以上提到的第六頁(p6)的批准書2一起存儲在暫時存儲區域55b中。
另外,按照第七頁(p7)即最後一頁的核對的執行,步驟62中的確定結果是肯定(「是」)。因此,執行步驟66中示出的暫時存儲區域輸出處理(子程序),並且在步驟70中,將存儲在暫時存儲區域55b中的兩頁(批准書2和附加文檔5)分批成一個文件,批准書2作為第一頁。然後,在步驟72中,將添加有與個體規則d關聯的文件名前綴「批准書2_」的文件名「批准書2_f4」賦予原始輸入文件名(這裡,被稱為「f4」)。另外,在步驟74中,使用規則d文件夾504輸出被賦予文件名「批准書2_f4」的輸出文件(輸出4),規則d文件夾504被作為輸出目的地設置在個體規則d中。此後,輸出文件(輸出4)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則d文件夾504中。另外,在輸出輸出文件(輸出4)之後,在步驟76中將暫時存儲區域55b初始化,並且完成步驟66的處理。
同時,當通過在步驟70中將步驟54和步驟66中示出的暫時存儲區域輸出處理中的多個頁分批來創建一個文件時,新文件(輸出文件)中的頁的次序可匹配原始輸入文件中的頁的次序(可按升序來排列輸入文件中的頁編號)。同時,這與隨後將描述的圖13中示出的第二具體示例相同。
第二具體示例
圖13是示出關於連續組合分類處理的第二具體示例的示圖。
在第二具體示例,分類規則是第四整體規則r4。因此,待設置的個體規則是個體規則e和個體規則f二者。這裡,個體規則e中的輸出目的地被設置成「規則e文件夾」,並且基準圖像被設置成「批准書」。另一方面,個體規則f中的輸出目的地被設置成「規則f文件夾」並且基準圖像被設置成「申請書a」。
另外,在第二具體示例中,輸入文件是第五輸入文件f5。第五輸入文件f5包括總共十二頁的多條目標圖像數據,包括六頁的帳票(另外參見圖5e)。
以這種方式,第一具體示例和第二具體示例就分類規則和待處理的輸入文件的內容而言互不相同。
然後,將根據圖10和圖11中示出的流程圖,對在設置第四整體規則r4的狀態下對第五輸入文件f5執行處理的情況下的分類結果給出描述。
在這種情況下,首先,在步驟50中,並非是帳票的第一頁(p1)的附加文檔1、被確定是否定(「否」),然後在步驟58中確定其是肯定(「是」),因此在步驟60中,附加文檔被作為一個輸出文件(輸出1)輸出。然而,輸出文件(輸出1)不包括帳票,因此其輸出目的地沒有被設置成在個體規則e中設置的規則e文件夾505和在個體規則f中設置的規則f文件夾506,而是被設置成規則外文件夾507。另外,輸出文件(輸出1)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則外文件夾507中。
另外,在步驟50中作為帳票的第二頁(p2)的批准書1被確定是肯定(「是」),然後在步驟52中其被確定是肯定(「是」),因此在步驟56中批准書被存儲在暫時存儲區域55b中。
另外,在步驟50中,作為帳票的第三頁(p3)的申請書a1被確定是肯定(「是」),然後在步驟52中被確定是否定(「否」)。因此,執行步驟54中示出的暫時存儲區域輸出處理(子程序),在步驟70中,將存儲在暫時存儲區域55b中的一個頁(批准書1)分批成一個文件。然後,在步驟72中,將添加有與個體規則e關聯的文件名前綴「批准書1_」的文件名「批准書1_f5」賦予原始輸入文件名(這裡,被稱為「f5」)。另外,在步驟74中,使用規則e文件夾505輸出被賦予文件名「批准書1_f5」的輸出文件(輸出2),規則e文件夾505被作為輸出目的地設置在個體規則e中。此後,輸出文件(輸出2)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則e文件夾505中。另外,在輸出輸出文件(輸出2)之後,在步驟76中將暫時存儲區域55b初始化,並且完成步驟54的處理。
然後,在步驟56中,作為帳票的第三頁(p3)的申請書a1被存儲在暫時存儲區域55b中。接下來,在步驟50中,並非帳票的第四頁(p4)的附加文檔2和第五頁(p5)的附加文檔3被確定是否定(「否」),然後在步驟58中被確定是否定(「否」),因此,在步驟56中,將附加文檔連同以上提到的第三頁(p3)的申請書a1一起存儲在暫時存儲區域55b中。
另外,在步驟50中,作為帳票的第六頁(p6)的批准書2被確定是肯定(「是」),然後在步驟52中被確定是否定(「否」)。因此,執行步驟54中示出的暫時存儲區域輸出處理(子程序),在步驟70中,將存儲在暫時存儲區域55b中的三頁(申請書a1、附加文檔2和附加文檔2)分批成一個文件,申請書a1作為第一頁。然後,在步驟72中,將添加有與個體規則f關聯的文件名前綴「申請書a1_」的文件名「申請書a1_f5」賦予原始輸入文件名(這裡,被稱為「f5」)。另外,在步驟74中,使用規則f文件夾506輸出被賦予文件名「申請書a1_f5」的輸出文件(輸出3),規則f文件夾506被作為輸出目的地設置在個體規則f中。此後,輸出文件(輸出3)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則f文件夾506中。另外,在輸出輸出文件(輸出3)之後,在步驟76中將暫時存儲區域55b初始化,並且完成步驟54的處理。
然後,在步驟56中,作為帳票的第六頁(p6)的批准書2被存儲在暫時存儲區域55b中。接下來,在步驟50中,並非帳票的第七頁(p7)的附加文檔4被確定是否定(「否」),然後在步驟58中被確定是否定(「否」),因此,在步驟56中,將附加文檔連同以上提到的第六頁(p6)的批准書2一起存儲在暫時存儲區域55b中。
另外,在步驟50中,作為帳票的第八頁(p8)的申請書2被確定是肯定(「是」),然後在步驟52中被確定是否定(「否」)。因此,執行步驟54中示出的暫時存儲區域輸出處理(子程序),在步驟70中,將存儲在暫時存儲區域55b中的兩頁(批准書2和附加文檔4)分批成一個文件,批准書2作為第一頁。然後,在步驟72中,將具有文件名前綴「批准書2_」、與個體規則e關聯、被添加到個體規則e的文件名「批准書2_f5」賦予原始輸入文件名(這裡,被稱為「f5」)。另外,在步驟74中,使用規則e文件夾505輸出被賦予文件名「批准書2_f5」的輸出文件(輸出4),規則e文件夾505被作為輸出目的地設置在個體規則e中。此後,輸出文件(輸出4)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則e文件夾505中。另外,在輸出輸出文件(輸出4)之後,在步驟76中將暫時存儲區域55b初始化,並且完成步驟54的處理。
然後,在步驟56中,作為帳票的第八頁(p8)的申請書a2被存儲在暫時存儲區域55b中。接下來,在步驟50中,並非帳票的第九頁(p9)的附加文檔5被確定是否定(「否」),然後在步驟58中被確定是否定(「否」),因此,在步驟56中,將附加文檔連同以上提到的第八頁(p8)的申請書a2一起存儲在暫時存儲區域55b中。
另外,在步驟50中,作為帳票的第十頁(p10)的申請書a3被確定是肯定(「是」),然後在步驟52中被確定是否定(「否」)。因此,執行步驟54中示出的暫時存儲區域輸出處理(子程序),在步驟70中,將存儲在暫時存儲區域55b中的兩頁(申請書a2和附加文檔5)分批成一個文件,申請書a2作為第一頁。然後,在步驟72中,將添加有與個體規則f關聯的文件名前綴「申請書a2_」的文件名「申請書a2_f5」賦予原始輸入文件名(這裡,被稱為「f5」)。另外,在步驟74中,使用規則f文件夾506輸出被賦予文件名「申請書a2_f5」的輸出文件(輸出5),規則f文件夾506被作為輸出目的地設置在個體規則f中。此後,輸出文件(輸出5)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則f文件夾506中。另外,在輸出輸出文件(輸出5)之後,在步驟76中將暫時存儲區域55b初始化,並且完成步驟54的處理。
然後,在步驟56中,作為帳票的第十頁(p10)的申請書a3被存儲在暫時存儲區域55b中。
另外,在步驟50中,作為帳票的第十一頁(p11)的批准書3被確定是肯定(「是」),然後在步驟52中被確定是否定(「否」)。因此,執行步驟54中示出的暫時存儲區域輸出處理(子程序),在步驟70中,將存儲在暫時存儲區域55b中的一個頁(申請書a3)構造為一個文件。然後,在步驟72中,將添加有與個體規則f關聯的文件名前綴「申請書a3_」的文件名「申請書a3_f5」賦予原始輸入文件名(這裡,被稱為「f5」)。另外,在步驟74中,使用規則f文件夾506輸出被賦予文件名「申請書a3_f5」的輸出文件(輸出6),規則f文件夾506被作為輸出目的地設置在個體規則f中。此後,輸出文件(輸出6)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則f文件夾506中。另外,在輸出輸出文件(輸出6)之後,在步驟76中將暫時存儲區域55b初始化,並且完成步驟54的處理。
然後,在步驟56中,作為帳票的第十一頁(p11)的批准書a3被存儲在暫時存儲區域55b中。接下來,在步驟50中,並非帳票的第十二頁(p12)的附加文檔6被確定是否定(「否」),然後在步驟58中被確定是否定(「否」)。因此,在步驟56中,將附加文檔與以上提到的第十一頁(p11)的批准書3一起存儲在暫時存儲區域55b中。
另外,按照第十二頁(p12)即最後一頁的核對的執行,步驟62中的確定結果是肯定(「是」)。因此,執行步驟66中示出的暫時存儲區域輸出處理(子程序),並且在步驟70中,將存儲在暫時存儲區域55b中的兩頁(批准書3和附加文檔6)分批成一個文件,批准書3作為第一頁。然後,在步驟72中,將添加有與個體規則e關聯的文件名前綴「批准書3_」的文件名「批准書3_f5」賦予原始輸入文件名(這裡,被稱為「f5」)。另外,在步驟74中,使用規則e文件夾505輸出被賦予文件名「批准書3_f5」的輸出文件(輸出7),規則e文件夾505被作為輸出目的地設置在個體規則e中。此後,輸出文件(輸出7)被存儲在設置在伺服器設備5的圖像存儲單元500中的規則e文件夾505中。另外,在輸出輸出文件(輸出7)之後,在步驟76中將暫時存儲區域55b初始化,並且完成步驟66的處理。
連續組合分類處理的修改例
在上述的連續組合分類處理中,從輸入文件提取的帳票的頁和輸入文件中與帳票的頁連續的一個或更多個附加文檔的頁被構造為一批輸出文件,但本發明不限於此。例如,可採用以下構造:預先設置一個或更多個頁的數量(被稱為頁的設定數量),並且從輸入文件提取的帳票的頁和與帳票的頁連續的頁的以上提到的設定數量被構造為一批輸出文件。在這種情況下,例如,當頁的設定數量被設置成2個時,包括帳票的輸出文件必須包括一頁帳票和與帳票的頁連續的兩頁的附屬文檔(不限於附加文檔)。
其他
同時,在這個示例性實施方式中,通過重構輸入文件而得到的輸出文件被存儲在設置在伺服器設備5中的圖像存儲單元500中,但本發明不限於此。例如,輸出文件的輸出目的地可以是終端設備3或其他設備中的任一個。另外,在這個示例性實施方式中,儘管通過重構輸入文件而得到的輸出文件被存儲在設置在伺服器設備5的圖像存儲單元500中的多個文件夾中,但本發明不限於此,並且文件夾可被設置在不同存儲設備中。
另外,在這個示例性實施方式中,通過重構輸入文件而得到的輸出文件被作為數據輸出,但本發明不限於此。例如,可使用圖像形成單元20將構成輸出文件的一個或更多個頁(圖像數據)印刷到紙張上,並且可將其在附於電子郵件的狀態下發送到終端設備3等,或者可用於啟動與輸出文件關聯的特定程序(應用)。
已經出於例證和描述的目的,提供了以上對本發明的示例性實施方式的描述。這旨在是排他性的或者將本發明限於所公開的精確形式。顯而易見,對於本領域的技術人員,將清楚許多修改形式和變形形式。選擇並且描述這些實施方式,以最佳地說明本發明的原理及其實際應用,從而使被領域的其他技術人員能夠理解適於預料中的特定使用的本發明的各種實施方式和各種修改形式。本發明的範圍旨在由隨附權利要求書及其等同物限定。