新四季網

結構化文擋處理器、結構化文擋處理方法和程序的製作方法

2023-09-16 19:05:25

專利名稱:結構化文擋處理器、結構化文擋處理方法和程序的製作方法
技術領域:
本發明涉及一種結構化文檔處理器,用於處理由一個或多個結構組件組成的結構化文檔,具體來說,涉及用於高效地將模板應用於結構化文檔的結構化文檔處理器。
背景技術:
當前在Internet上存在許多網站。有各種網站,從商業化的到專用的網站,應有盡有。特別是在商業化的網站上,有許多Web頁面經過精心設計,以便吸引客戶。一個這樣的精心設計的示例是,一個公司的網站中包括的多個Web頁面這樣設計,以便給人一致的感覺。例如,一種格式常常用於使多個Web頁面均勻,其中菜單列表放在Web頁面的左側,Web頁面的頂部是帶有一個公司的徽標的欄。
然而,如果在創建這樣的均勻的Web頁面之後公司的徽標發生更改,網站中包括的所有Web頁面都必須糾正。對於一個大公司,可能包括成千上萬的Web頁面,則必須要編輯成千上萬的Web頁面。這需要完成大量的工作。
相應地,已經有人發明了向實現Web頁面的諸如HTML文檔之類的結構化文檔應用模板(模型文檔)(例如,請參考專利文件1)。模板用於使文檔的布局均勻。在模型文檔中清楚地指定了兩種類型的區域在將向其中應用模板的多個文檔之中共同使用的區域,根據向其中應用模板的文檔用於自由地設置或編輯不同內容的區域(以下簡稱為「內容區域」)。使用模板管理Web頁面的優點在於甚至在更改公司徽標的情況下,向其中應用模板的所有Web頁面都只需通過重寫包括徽標的文件(模板)自動地進行糾正。在專利文件1中,通過從結構化文檔中提取文檔組件並插入或替代模板中的每一個文檔組件,執行文檔構成進程。
發布的未經審查的專利申請No.2001-209641(第10-22頁;圖2到9)[本發明解決的問題]然而,專利文件1有一個問題必須將一個標籤以一一對應的方式嵌入到模板和結構化文檔中的每一個中,在沒有嵌入標籤的情況下,不可能使用通用模板或將模板應用到結構化文檔中。
提供了一種產品,用於幫助在創建Web頁面時將模板應用到HTML文檔。然而,對這樣的產品的使用施加了下列限制第一限制是,可以只為整個文檔指定要插入到內容區域的一部分;第二限制是,即使在模板中有多個內容區域,文檔也只能插入到一個內容區域;第三限制是,模板只能應用於一個文檔,並且無法同時應用於多個文檔。
最後,現有技術中沒有一種能有效地將模板應用到結構化文檔的技術。
本發明是為了解決上文所提及的技術問題而提出的,其目標是能有效地將模板應用到結構化文檔。

發明內容
在此目標下,本發明可以指定要插入到模板的內容區域的文檔的結構組件。即,根據本發明的結構化文檔處理器包括結構組件選擇接受裝置,用於接受從構成預先確定的文檔的多個結構組件中進行的對特定結構組件的選擇;模板應用裝置,用於將特定結構組件插入到預先確定的模板中所包括的預先確定的內容區域,其中對所述特定結構組件的選擇已經被結構組件選擇接受裝置接受。
本發明還可以作為用於指定構成一個文檔的結構組件作為要插入到模板中的內容區域的一個部分的用戶界面。在此情況下,根據本發明的結構化文檔處理器包括文檔結構顯示裝置,用於顯示預先確定的文檔的結構;以及應用結果顯示裝置,用於,響應被文檔結構顯示裝置顯示的結構中所包括的多個結構組件之中的特定結構組件的選擇,顯示將特定的結構組件插入到預先確定的模板中所包括的預先確定的內容區域的結果。
此外,本發明還可以作為結構化文檔處理器中的結構化文檔處理方法,用於指定構成一個文檔的結構組件作為要插入到模板中的內容區域的一個部分。在此情況下,根據本發明的結構化文檔處理方法包括接受從構成預先確定的存儲裝置中存儲的預先確定的文檔的多個結構組件中進行的對特定結構組件的選擇;以及將特定結構組件插入到預先確定的存儲裝置中存儲的預先確定的模板中所包括的預先確定的內容區域,其中對所述特定結構組件的選擇已經被接受。
此外,本發明還可以作為一種電腦程式,用於指定構成一個文檔的結構組件作為要插入到結構化文檔處理器中的模板中的內容區域的一個部分。在此情況下,根據本發明的程序使計算機執行以下功能接受從構成預先確定的文檔的多個結構組件中進行的對特定結構組件的選擇;以及將特定結構組件插入到預先確定的模板中所包括的預先確定的內容區域,其中對所述特定結構組件的選擇已經被接受。
根據本發明,可以高效地將模板應用到結構化文檔中。
附圖簡要說明

圖1是顯示本實施例的整個配置的方框圖;圖2是顯示根據本實施例的將模板應用到單個文檔中的操作的流程圖;圖3是顯示根據本實施例的將模板應用到另一個文檔中的操作的流程圖;圖4描述了在本實施例的特定的示例中使用的文檔;
圖5描述了在本實施例的特定的示例中使用的文檔;圖6描述了在本實施例的特定的示例中使用的文檔;圖7描述了在本實施例的特定的示例中使用的模板;圖8顯示了在本實施例的特定的示例中提供的屏幕的示例;圖9顯示了在本實施例的特定的示例中提供的屏幕的示例;圖10顯示了在本實施例的特定的示例中提供的屏幕的示例;圖11顯示了在本實施例的特定的示例中提供的屏幕的示例;圖12顯示了在本實施例的特定的示例中的應用方法存儲裝置中存儲的內容的示例;圖13顯示了在本實施例的特定的示例中在應用模板之前和應用模板之後彼此相比的文檔;圖14顯示了在本實施例的特定的示例中提供的屏幕的示例;以及圖15顯示了在本實施例的特定的示例中提供的屏幕的示例。
11 ...模板存儲裝置12 ...模板選擇接受裝置13 ...模板結構分析裝置14 ...內容區域選擇接受裝置15 ...文檔存儲裝置16 ...文檔選擇接受裝置17 ...文檔結構分析裝置18 ...結構組件選擇接受裝置19 ...應用方法存儲裝置20 ...文檔結構檢查裝置21 ...模板應用裝置22...結構組件檢索裝置
具體實施例方式
下面將參考附圖詳細描述本發明的一個實施例。
首先,將對根據本實施例的結構化文檔處理器的配置進行描述。
圖1顯示了根據本實施例的結構化文檔處理器的整個配置。
如圖1所示,結構化文檔處理器具有模板存儲裝置11、模板選擇接受裝置12、模板結構分析裝置13、內容區域選擇接受裝置14、文檔存儲裝置15、文檔選擇接受裝置16、文檔結構分析裝置17、結構組件選擇接受裝置18、應用方法存儲裝置19、文檔結構檢查裝置20、模板應用裝置21和結構組件檢索裝置22。
模板存儲裝置11是用於存儲用作模板(下文,簡單地稱為「模板」)的結構化文檔的裝置,模板選擇接受裝置12是用於接受識別用戶選擇的模板的信息的裝置。模板結構分析裝置13是用於分析指定的模板的文檔結構的裝置,內容區域選擇接受裝置14是用於接受模板中的內容區域之中的特定內容區域的選擇的裝置。
文檔存儲裝置15是用於存儲將向其中應用模板的結構化文檔(下文,簡單地稱為「文檔」)的裝置,文檔選擇接受裝置16是用於接受標識用戶所選擇的文檔的信息的裝置。文檔結構分析裝置17是用於分析指定的文檔的結構的裝置,結構組件選擇接受裝置18是用於接受構成文檔的結構組件中進行的對特定結構組件的選擇的裝置。
應用方法存儲裝置19是用於存儲有關內容區域(內容區域選擇接受裝置14已經為其接受了選擇)的信息和彼此相關聯的有關結構組件(結構組件選擇接受裝置18已經為其接受了選擇)的信息的裝置。文檔結構檢查裝置20是檢查從文檔的結構角度來看將指定的結構組件插入到指定的內容區域是否有效的裝置。模板應用裝置21是在內存上應用模板的裝置。結構組件檢索裝置22是用於從文檔結構分析裝置17的分析結果中所包括的結構組件中檢索類似於應用方法存儲裝置19中存儲的結構組件的結構組件的裝置對於根據本實施例的結構化文檔處理器,可以採用類似於通用計算機系統的配置的硬體配置。即,可以採用任何配置,只有在它包括中央處理單元(CPU)和主存儲器(它們通過總線連接到輔助存儲設備)的情況下才行。輔助存儲器被認為是硬碟、軟盤、MO(磁光碟)、CD-ROM等等。
用於實現此實施例的電腦程式存儲在輔助存儲設備中。通過中央處理單元(CPU)將電腦程式讀取到主存儲器中,並執行它,實現了模板選擇接受裝置12、模板結構分析裝置13、內容區域選擇接受裝置14、文檔選擇接受裝置16、文檔結構分析裝置17、結構組件選擇接受裝置18、文檔結構檢查裝置20、模板應用裝置21和結構組件檢索裝置22中的每一個。
可以藉助於輔助存儲設備或藉助於主存儲器實現模板存儲裝置11、文檔存儲裝置15和應用方法存儲裝置19中的每一個。
此外,諸如鍵盤和指示設備之類的輸入設備可以連接到結構化文檔處理器。也可以連接諸如顯示器之類的輸出設備。這樣的配置也是可以的與結構化文檔處理器分開提供作為輸入設備和輸出設備的終端設備並相互通過通信線路進行連接。
在任何一種情況下,結構化文檔處理器都具有與輸入設備和輸出設備連接的裝置,儘管在圖1中未顯示。用於顯示有關選擇的模板中包括的內容區域的信息內容區域信息顯示裝置、用於顯示選擇的文檔的結構的文檔結構顯示裝置和用於顯示將所選擇的結構組件插入到選擇的內容區域的結果的應用結果顯示裝置是其示例。
下面將對根據本實施例的結構化文檔處理器的操作進行描述。
圖2是顯示根據本實施例的結構化文檔處理器中的將模板應用到單個文檔中的操作的流程圖。
當用戶從模板存儲裝置11中存儲的模板中選擇一個他希望應用的模板時,模板選擇接受裝置12接受選擇(步驟201)。然後,模板結構分析裝置13分析所選擇的模板的結構,並保留分析結果(步驟202)。模板的描述包括表示模板的哪些區域是內容區域的信息,以便內容區域選擇接受裝置14能夠通過參考模板結構的分析結果輸出內容區域信息。
當用戶從文檔存儲裝置15中存儲的文檔中選擇一個他希望向其中應用在步驟201中選擇的模板時,文檔選擇接受裝置16接受選擇(步驟203)。然後,文檔結構分析裝置17分析所選擇的文檔的結構,並保留分析結果(步驟204)。文檔的描述包括有關構成文檔的結構組件的信息,以便結構組件選擇接受裝置18能夠通過參考文檔結構的分析結果輸出結構組件信息。
當用戶從作為步驟201和202中的處理結果輸出的內容區域中選擇一個他希望向其中插入結構組件的內容區域時,內容區域選擇接受裝置14接受選擇(步驟205)。然後,內容區域選擇接受裝置14存儲有關應用方法存儲裝置中的所選擇的內容區域的信息。
當用戶從作為步驟203和204中的處理結果輸出的結構組件中選擇一個他希望插入到所選擇的內容區域的結構組件時,結構組件選擇接受裝置14接受選擇(步驟206)。結構組件選擇接受裝置18存儲有關所選擇的結構組件的信息,該信息與有關在步驟205中存儲在應用方法存儲裝置19中的內容區域的信息相關聯。即,有關在步驟205中選擇的內容區域的信息和有關在步驟206中選擇的結構組件的信息之間的關聯信息存儲在應用方法存儲裝置19中。
然後判斷是否為所有內容區域指定了將要插入的結構組件(步驟207)。如果判斷還沒有為所有內容區域指定結構組件,那麼,過程返回到步驟205。如果判斷已經為所有內容區域指定了結構組件,那麼,進入步驟208。
然後,文檔結構檢查裝置20基於有關應用方法存儲裝置19中存儲的內容區域信息和結構組件信息的信息之間的關聯的信息判斷從文檔的結構角度來看應用模板的結果是否有效(步驟208)。如果判斷應用模板的結果從文檔的結構角度來看有效,那麼,模板應用裝置21將模板應用到內存上的文檔,結果,輸出應用模板的結果的預覽(步驟209)。另一方面,如果判斷應用模板的結果無效,那麼,則輸出一個有關該效果的警告(步驟210)。然後,模板應用裝置21將模板應用到內存上的文檔,結果,輸出應用模板的結果的預覽(步驟209)。
當在步驟208中判斷應用模板的結果無效時,可以停止應用模板,不用輸出應用結果的預覽。然而,考慮到一些用戶即使應用從文檔的結構角度來看無效也需要檢查應用結果的預覽,在輸出警告之後,輸出應用結果的預覽。
儘管在上面的描述中沒有提及模板存儲裝置11為存儲模板執行的處理,也可以假定所有存在於結構化文檔處理器中的模板都存儲在模板存儲裝置11中。或者,假定只有在模板預選步驟(從所有存在於結構化文檔處理器中的模板中選擇一些模板)中選擇的模板存儲在其中。
儘管在上面的描述中沒有提及文檔存儲裝置15為存儲文檔執行的處理,也可以假定所有存在於結構化文檔處理器中的文檔都存儲在文檔存儲裝置15中。或者,假定只有在模板預選步驟(從所有存在於結構化文檔處理器中的模板中選擇一些模板)中選擇的模板存儲在其中。
圖3是一個流程圖,當對另一個文檔(下文稱為「新文檔」)執行類似於將模板應用到圖2顯示的單個文檔(下文稱為「以前的文檔」)的應用時,在本實施例中執行的操作。假設在應用方法存儲裝置19存儲了有關以前的文檔內容區域的信息和有關結構組件的信息之間的關聯信息,即,表示哪些結構組件已經插入到以前的文檔中的哪些內容區域,作為圖2中的步驟205和206的處理結果。
當用戶從文檔存儲裝置15中存儲的文檔中選擇一個新文檔時,或當結構化文檔處理器自動選擇它時,文檔選擇接受裝置16接受選擇(步驟301)。
然後,文檔結構分析裝置17分析所選擇的文檔的結構,並保留分析結果(步驟302)。
然後,結構組件檢索裝置22從構成新文檔的結構組件中檢索適合於插入到每一個內容區域的每一個結構組件,以便以類似於為以前的文檔執行的應用方法(該應用方法存儲在應用方法存儲裝置19中)的方法執行應用。具體來說,執行下面顯示的過程。
結構組件檢索裝置22,將注意力集中在應用方法存儲裝置19中存儲的一段關聯信息(表示哪些結構組件已經插入到以前的文檔中的哪些內容區域的信息),判斷在文檔結構分析裝置17的分析結果中包括的結構組件中是否有位置類似於關聯信息中包括的結構組件的任何結構組件(步驟303)。
如果判斷沒有任何適當的結構組件,那麼,應用方法存儲裝置19中存儲的關聯信息中包括的結構組件被切換到更高級別的結構組件(步驟304)(下文,結構組件的這樣的更改被稱為「展開」)。結構組件檢索裝置22判斷從文檔的結構角度來看展開是否有效(步驟305)。如果從文檔的結構角度來看展開無效,那麼過程返回到步驟304,並試圖再次展開結構組件範圍。如果從文檔的結構角度來看展開有效,則過程進入步驟303,在此,判斷在文檔結構分析裝置17的分析結果中包括的結構組件中是否有位置類似於展開之後的結構組件的任何結構組件(步驟303)。
如果在步驟303中判斷有適當的結構組件,那麼,保留有關內容區域的信息和有關結構組件的信息之間的關聯信息(表示哪些結構組件應該插入到新文檔中的哪一個內容區域),並判斷對於所有內容區域是否已經執行將要插入的結構組件的檢索(步驟306)。如果判斷對於所有內容區域還沒有執行檢索,那麼對於其他內容區域執行步驟303到305。如果判斷已經為所有內容區域執行了檢索,那麼,過程進入步驟307。最終,模板應用裝置21基於要為所有內容區域插入的結構組件的信息應用內存上的模板(步驟307)。
下面將使用特定的示例詳細描述此實施例的操作。
在此特定的示例中,圖4到6所示的文檔將用作將向其中應用模板的文檔。在圖4到6中,在左側顯示了文檔的顯示圖像。即,假設實現這樣的顯示的HTML文檔存儲在文檔存儲裝置15中。在圖4到6中,在右側也顯示了文檔的結構。然而,假設當選擇文檔時,文檔的結構將要由文檔結構分析裝置17生成,稍後將描述。
在圖4所示的文檔(「index.html」)中,區域401對應於TABLE411;包括區域402到404的區域對應於TABLE412;區域402、403和404分別對應於TD413、414和415。在圖5所示的文檔中(「page2.html」)中,區域501對應於TABLE511;包括區域502和503的區域對應於TABLE512;區域502和503分別對應於TD513和514。在圖6所示的文檔(「page3.html」)中,區域601對應於TABLE611,區域602對應於TABLE612(作為框架),並對應於TD613作為內容。
在此特定的示例中,圖7所示的模板將用作應用於上文所提及的文檔的模板。在圖7中,在左側顯示了模板的顯示圖像。即,假設實現這樣的顯示的HTML模板存儲在模板存儲裝置11中。在圖7中,在右側也顯示了模板的文檔結構。然而,假設當選擇模板時,模板的結構將要由模板結構分析裝置13生成,稍後將描述。
在圖7所示的模板(「template.htpl」)中,區域701對應於TABLE711;包括區域702到704的區域對應於TABLE712;區域702、703和704分別對應於TD713、714和716;區域705對應於TABLE717。
模板還包括表示內容區域的信息。此信息可以作為放入HTML標記的特殊標記來實現。在圖7中的示例中,特殊標記tpl:insert715被放HTML標記td中,以表示對應於TD的區域703是一個內容區域。
此外,在標記715中還描述了諸如內容區域的名稱之類的標識信息,儘管圖7中沒有顯示。
在上面的描述的假設中,將對將模板應用到圖2中的流程圖所顯示的單個文檔的操作進行具體描述。
可以預先執行文檔預選步驟,以從存在於結構化文檔處理器中的許多文檔中選擇將向其中應用模板的一些文檔,並將它們存儲在文檔存儲裝置15中。這裡假設,上文所提及的文檔「index.html」、「page2.html」和「page3.html」通過這樣的過程存儲在文檔存儲裝置15中。然後開始圖2所示的過程。
圖8顯示了過程開始時的屏幕圖像。在圖8中的屏幕上,模板示例或用戶定義的模板都可以作為模板類型指定。這裡指定了用戶定義的模板,如圖所示。然後,在最下面的區域顯示了可選擇的模板「template.htpl」的縮略圖。儘管只顯示了一個模板,因為在此特定的示例中假定只有一個模板,當假定有多個模板時,顯示多個縮略圖。
如果用戶點擊「template.htpl」的縮略圖,則模板「/Webcontent/theme」的位置和其文件名「template.htpl」顯示在縮略圖的緊上面的區域,標識所選擇的模板的信息發送到結構化文檔處理器。為響應此,模板選擇接受裝置12接受該信息(步驟201)。
在此時間點,模板結構分析裝置13分析所選擇的模板的結構(步驟202),儘管它沒有在屏幕上顯示出來。具體來說,生成有關模板的文檔結構的信息,該信息在圖7的右側顯示。
在步驟202的處理之後或與其平行,顯示了一個屏幕,用於指定哪些結構組件應該插入到所選擇的模板中的哪些內容區域(以圖9到11所示的格式的屏幕)。在模板結構分析裝置13在步驟202中生成的模板的文檔結構中,包括表示內容區域「main」存在於模板「template.htpl」中的信息,以便「main」在最初顯示屏幕時作為可選擇的內容區域顯示。儘管只顯示了一個內容區域名稱,因為在此特定的示例中使用了只具有一個內容區域的模板,如果使用具有多個內容區域的模板,則顯示多個內容區域名稱。
用戶首先在此屏幕上指定將模板應用於哪一個文檔。
圖9顯示了將要顯示的屏幕圖像。通過點擊圖9中的粗線圍繞的區域的右側的向下三角形標記,將顯示出用於標識可選擇的文檔(「/WebContent/index.html″、「/webContent/page2.html」和「Webcontent/page3.html」)的信息,這裡選擇了「/webcontent/index.html」,如圖所示。在左下區域,顯示了所選擇的文檔的預覽映像,如「預覽」箭頭所示,標識所選擇的文檔的信息被發送到結構化文檔處理器。為響應此,文檔選擇接受裝置16接受該信息(步驟203)。
在此時間點,文檔結構分析裝置17分析所選擇的文檔的結構,儘管它沒有在屏幕上顯示出來(步驟204)。具體來說,生成有關文檔結構的信息,該信息在圖4的右側顯示。
此外,有關構成文檔「index.html」的結構組件的信息(這是文檔結構分析裝置17分析的結果),以便有關構成文檔「index.html」的結構組件的信息顯示右邊的區域中間。在初始顯示屏幕中,只顯示了最高等級的結構組件。
然後,用戶選擇應該向其中插入結構組件的內容區域。
圖10顯示了在此時間點的屏幕圖像。在圖10中粗線圍繞的區域選擇了內容區域「main」。然後,將標識所選擇的內容區域的信息發送到結構化文檔處理器,內容區域選擇接受裝置14接受信息(步驟205)。
然後,用戶從表示文檔結構的樹中選擇將要插入到所選擇的內容區域的結構組件。
圖11顯示了將要顯示的屏幕圖像。按順序跟隨BODY,在其下的第二TABLE,在其下的第一TBODY,然後在圖11中的粗線圍繞的區域中的在其下的第一TR,提供了如圖所示的屏幕顯示。這裡選擇了TR下的第二TD,即,圖4中的TD414。然後,將標識所選擇的結構組件的信息發送到結構化文檔處理器,結構組件選擇接受裝置18接受信息(步驟206)。
在此特定的示例中,由於只有一個內容區域存在於模板「template.htpl」中,並且沒有未處理的內容區域(步驟207中的YES),然後,文檔結構檢查裝置判斷將結構組件TD414插入到模板「template.htpl」中的內容區域「main」中從文檔的結構角度來看是否有效(步驟208)。判斷插入從文檔的結構角度來看有效(稍後將描述的過程),以便模板應用裝置21應用模板,顯示了圖11中的右下區域中顯示的預覽(步驟209)。
在本實施例中,有關在步驟205中選擇的內容區域的信息和有關在步驟206中選擇的結構組件的信息之間的關聯信息存儲在應用方法存儲裝置19中,圖12顯示了一個示例。在圖12中,內容區域的名稱是作為有關內容區域的信息存儲的。作為有關結構組件的信息,有關文檔結構(排除文檔結構中的結構組件,不向其中傳遞)的信息到達結構組件。然而,這只是一個示例,任何信息都可以存儲(只有在它可以識別哪個結構組件已經插入到哪一個內容區域的情況下才可。例如,包括內容區域信息的模板結構信息可以作為內容區域信息存儲,而不是作為內容區域的名稱。
在步驟208中按如下方式執行從文檔的結構角度來看的有效性檢查。首先,通過參考模板結構分析裝置13對模板結構的分析的結果,文檔結構檢查裝置20識別出,內容區域「main」是放入在TD中的內容區域。此外,通過參考應用方法存儲裝置19,已知,將要插入的結構組件是TD。相應地,文檔結構檢查裝置20檢查文檔的TD本身是否可以插入到模板的TD中。作為檢查的結果,判斷出插入是不可能的。然後,作為檢查文檔的內容TD是否可以插入到模板的TD的結果,判斷插入是可以的。因此,文檔結構檢查裝置20判斷從文檔的結構角度來看將結構組件TD414插入到內容區域「main」是有效的。
相反,如果嘗試將PR插入到放入TD中的內容區域,例如,那麼,在步驟208中判斷從文檔的結構角度來看是無效的,則會顯示一個警告(步驟210)。儘管在上面的描述中假設,文檔結構檢查裝置20是指存儲在應用方法存儲裝置19中的信息和模板結構分析裝置13在檢查從文檔的結構角度來看的有效性時的分析結果,在應用方法存儲裝置19存儲了模板結構信息和文檔結構信息之間的關聯的情況下,也可以從文檔的結構角度來看檢查有效性,而不參考模板結構分析裝置13的分析結果。
作為通過上文描述的過程將模板應用到文檔的結果,文檔「index.html」按如圖13所示的那樣更改。即,放了一個tpl:put標記,這是一個表示在應用模板之後結構組件已經插入到TD1311的特殊標記。在tpl:put標記中提供了對應於TD1301的描述,儘管沒有顯示。
然後,對將模板應用到圖3中的流程圖顯示的另一個文檔的操作進行具體的描述。這裡,假設將模板應用到上文描述的文檔「index.html」作為主要情況(將模板應用到一個特定文檔,以便指定對於其他文檔要執行的模板應用的方法),將對對於其他文檔「page2.html」和「page3.html」執行類似的應用的情況進行描述。
首先,將對圖5所示的將模板應用到文檔「page2.html」的過程進行描述。
圖14顯示了將要顯示的屏幕圖像。儘管在圖14中選中了所有文檔「index.html」、「page2.html」和「page3.html」,但這裡將只集中注意力描述文檔「page2.html」。通過選中圖14中的左下區域中的向其中應用了模板的文檔「page2.html」,選擇了文檔「page2.html」。然後,將標識文檔「page2.html」的信息發送到結構化文檔處理器,文檔選擇接受裝置16接受該信息(步驟301)。然後,文檔結構分析裝置17分析文檔「page2.html」的結構(步驟302)。具體來說,生成有關文檔結構的信息,該信息在圖5的右側顯示。
然後,結構組件檢索裝置22從文檔結構分析裝置17的分析結果中包括的結構組件中檢索類似於應用方法存儲裝置19中存儲的應用方法中顯示的結構組件的結構組件(步驟303)。在應用方法存儲裝置19中顯示了,BODY下的第二TABLE下的第一TBODY下的第一TR下的第二TD已經插入到如圖12所示的內容區域「main」。相應地,結構組件檢索裝置22從圖5右側的文檔結構檢索其位置類似於此PD的結構組件,這是文檔結構分析裝置17的分析的結果。在此情況下,能識別出TD514,這是BODY下的第TABLE下的第一TBODY下的第一TR下的第二TD,也存在於圖5右側的文檔結構中。沒有「main」之外的內容區域(在步驟306中為YES),以便模板應用裝置21隻執行將TD514插入到內存上的內容區域「main」,然後顯示圖14的右下區域顯示的預覽映像。
作為通過上文描述的過程將模板應用到文檔的結果,文檔「page2.html」的文檔結構類似於圖13所示的文檔結構。然而,在tpl:put標記中提供了對應於圖5中的PD514的描述。
接下來,將對圖6所示的將模板應用到文檔「page3.html」的過程進行描述。
圖15顯示了將要顯示的屏幕圖像。儘管在圖15中選中了所有文檔「index.html」、「page2.html」和「page3.html」,但這裡將只集中注意力描述文檔「page3.html」。通過選中圖15中的左下區域中的向其中應用了模板的文檔「page3.html」,選擇了文檔「page3.html」。然後,將標識文檔「page3.html」的信息發送到結構化文檔處理器,文檔選擇接受裝置16接受該信息(步驟301)。然後,文檔結構分析裝置17分析文檔「page3.html」的結構(步驟302)。具體來說,生成有關文檔結構的信息,該信息在圖6的右側顯示。
然後,結構組件檢索裝置22從文檔結構分析裝置17的分析結果中包括的結構組件中檢索類似於應用方法存儲裝置19中存儲的應用方法中顯示的結構組件的結構組件(步驟303)。在應用方法存儲裝置19中顯示了,BODY下的第二TABLE下的第一TBODY下的第一TR下的第二PD已經插入到如圖12所示的內容區域「main」。相應地,結構組件檢索裝置22從圖6右側的文檔結構檢索其位置類似於此TD的結構組件,這是文檔結構分析裝置17的分析的結果。
在此情況下,沒有查找到對應於圖6的右側的文檔結構中的BODY下的第二TABLE下的第一TBODY下的第一PR下的第二TD的結構組件,因此,結構組件檢索裝置22保存圖12所示的信息的內容,並臨時展開插入範圍(步驟304)。即,用一個方法重寫應用方法,指定BODY下的第TABLE下的第一TBODY下的第一PR應該插入到內容區域「main」。
然後,結構組件檢索裝置22判斷從文檔的結構角度來看展開是否有效(步驟305)。具體來說,通過參考結構信息,模板結構分析裝置13的分析結果,結構組件檢索裝置22識別出內容區域「main」被放在HTML標記td中。由於PR無法插入到td中,結構組件檢索裝置22判斷從文檔的結構角度來看展開無效,並重新展開插入範圍(步驟304)。即,用一個方法重寫模板應用方法,指定BODY下的第二TABLE下的第一TBODY應該插入到內容區域「main」。
然後,結構組件檢索裝置22判斷從文檔的結構角度來看展開是否有效(步驟305)。內容區域「main」被放HTML標記td,不可能將TBODY插入到td中。因此,結構組件檢索裝置22判斷從文檔的結構角度來看展開無效,並再次重新展開插入範圍(步驟304)。即,用一個方法重寫模板應用方法,指定BODY下的第二TABLE應該插入到內容區域「main」。
結構組件檢索裝置22判斷從文檔的結構角度來看展開是否有效(步驟305)。內容區域「main」被放HTML標記td,可以將TBODY插入到td中。因此,結構組件檢索裝置22判斷,從文檔的結構角度來看展開是否有效,並從圖6的右側的文檔結構檢索其位置類似於TABLE的結構組件,這是文檔結構分析裝置17的分析的結果。在此情況下,還存在TABLE612,這是圖6的右側的文檔結構中的BODY下的第二TABLE。沒有「main」之外的內容區域(在步驟306中為YES),以便模板應用裝置21隻執行將TABLE612插入到內存上的內容區域「main」,然後顯示圖15的右下區域顯示的預覽映像。
作為通過上文描述的過程將模板應用到文檔的結果,文檔「page3.html」的文檔結構類似於圖13所示的文檔結構。然而,在tpl:put標記中提供了對應於圖6中的TABLE612的描述。
描述了本實施例的一個特定的示例。儘管在上面的描述中沒有詳細提及如何保留模板結構分析裝置13的分析結果,但是,模板結構分析裝置13可以分析模板存儲裝置11中存儲的模板,以在每次需要模板結構信息時獲取模板結構信息。或者,當最初生成模板結構信息時,可以在內存上擴展它,以便在內存上擴展的結構信息可以用於隨後的處理。
同樣,文檔結構分析裝置17的分析結果也可以在每次需要分析結果時通過分析文檔存儲裝置15中存儲的文檔來獲取。或者,當最初生成文檔結構信息時,可以在內存上擴展它,以便在內存上擴展的結構信息可以用於隨後的處理。
此外,儘管在本實施例中在步驟305中從文檔的結構角度來看有效性檢查是由結構組件檢索裝置22執行的,但是,也可以將有關展開之後結構組件的信息傳遞到文檔結構檢查裝置20,文檔結構檢查裝置20通過參考模板結構分析裝置13的分析的結果來執行有效性檢查。
在本實施例中,模板應用裝置21應用內存上的模板,並提供了應用模板之前/之後的文檔的狀態的預覽,以便由於應用模板造成丟失文檔信息的風險最小化。然而,由模板應用裝置21應用模板可以不在內存上執行,而是在硬碟上執行。
如此,本實施例的優點在於,通過執行遵循圖2中的流程圖的過程,可以在應用模板時指定結構組件(HTML標記)作為將要插入到內容區域的一部分。此外,通過執行遵循圖2中的流程圖的過程,還可以在模板具有多個內容區域時為每一個內容區域指定不同的結構組件(HTML標記)。
此外,本實施例的優點在於,通過執行遵循圖3中的流程圖的過程,可以為單個文檔指定要插入到內容區域的一部分自動將模板應用到多個文檔。
權利要求
1.一種結構化文檔處理器,包括結構組件選擇接受裝置,用於接受從構成預先確定的文檔的多個結構組件之中進行的對特定結構組件的選擇;以及模板應用裝置,用於將特定結構組件插入到預先確定的模板中所包括的預先確定的內容區域中,其中對所述特定結構組件的選擇已經被結構組件選擇接受裝置接受。
2.根據權利要求1所述的結構化文檔處理器,進一步包括內容區域選擇接受裝置,用於接受從預先確定的模板中所包括的內容區域中進行的對預先確定的內容區域的選擇,其中對於所述預先確定的內容區域,將向其中插入特定的結構組件。
3.根據權利要求1所述的結構化文檔處理器,進一步包括文檔結構檢查裝置,用於檢查將特定結構組件插入到預先確定的內容區域從文檔的結構角度來看是否有效,其中對所述特定結構組件的選擇已經被結構組件選擇接受裝置接受。
4.根據權利要求1所述的結構化文檔處理器,進一步包括結構組件檢索裝置,用於從構成不同於預先確定的文檔的另一個文檔的結構組件中檢索其位置類似於特定結構組件的結構組件,其中對所述特定結構組件的選擇已經被結構組件選擇接受裝置接受;其中,模板應用裝置將結構組件檢索裝置檢索到的結構組件插入到預先確定的內容區域。
5.根據權利要求4所述的結構化文檔處理器,其中,結構組件檢索裝置如果找不到位置類似於特定結構組件的結構組件,則從構成不同的文檔的結構組件中檢索其位置類似於不同於預先確定的結構組件的更高級別的結構組件,其中對所述特定結構組件的選擇已經被結構組件選擇接受裝置接受。
6.根據權利要求5所述的結構化文檔處理器,其中,結構組件檢索裝置判斷從文檔的結構角度來看,將不同的結構組件插入到預先確定的內容區域是否有效,並且如果判斷有效,則從構成不同的文檔的結構組件中檢索其位置類似於不同的結構組件的結構組件。
7.一種結構化文檔處理器,包括文檔結構顯示裝置,用於顯示預先確定的文檔的結構;以及應用結果顯示裝置,用於,響應從由文檔結構顯示裝置顯示的結構中所包括的多個結構組件中進行的對特定結構組件的選擇,顯示將特定的結構組件插入到預先確定的模板中所包括的預先確定的內容區域的結果。
8.根據權利要求7所述的結構化文檔處理器,進一步包括內容區域信息顯示裝置,用於顯示有關預先確定的模板中所包括的內容區域的信息,其中響應從由內容區域信息顯示裝置顯示的信息中進行的對特定信息的選擇,應用結果顯示裝置顯示將特定的結構組件插入到對應於特定信息的內容區域的結果。
9.結構化文檔處理方法,包括下列步驟接受從構成預先確定的存儲裝置中存儲的預先確定的文檔的多個結構組件之中進行的對特定結構組件的選擇;以及將特定結構組件插入到預先確定的存儲裝置中存儲的預先確定的模板中所包括的預先確定的內容區域,其中對所述特定結構組件的選擇已經被接受。
10.根據權利要求9所述的結構化文檔處理方法,進一步包括以下步驟接受從預先確定的模板中所包括的內容區域中進行的對預先確定的內容區域的選擇,對於所述預先確定的內容區域,將向其中插入特定的結構組件。
11.根據權利要求9所述的結構化文檔處理方法,進一步包括下列步驟生成顯示預先確定的模板的結構的第一結構信息;生成顯示預先確定的文檔的結構的第二結構信息;以及基於第一和第二結構信息,檢查將特定結構組件插入到預先確定的內容區域從文檔的結構角度來看是否有效,其中對所述特定結構組件的選擇已經被接受。
12.根據權利要求9所述的結構化文檔處理方法,進一步包括下列步驟生成顯示不同於預先確定的文檔的不同文檔的結構的第三結構信息;從第三結構信息中所包括的結構組件中檢索其位置類似於特定結構組件的結構組件,其中對所述特定結構組件的選擇已經被接受;以及將檢索到的結構組件插入到預先確定的內容區域。
13.根據權利要求12所述的結構化文檔處理方法,其中檢索結構組件的步驟包括下列步驟判斷在第三結構信息中所包括的結構組件中是否存在其位置類似於特定結構組件的結構組件,其中對所述特定結構組件的選擇已經被接受;在沒有位置類似的結構組件的情況下,將特定結構組件臨時更改為不同於特定結構組件的更高級別的結構組件;以及從第三結構信息中所包括的結構組件中檢索其位置類似於不同結構組件的結構組件。
14.根據權利要求13所述的結構化文檔處理方法,其中在檢索其位置類似於不同結構組件的結構組件的步驟,判斷從文檔的結構角度來看,將不同的結構組件插入到特定的內容區域是否有效,如果判斷有效,則從第三結構信息中所包括的結構組件檢索其位置類似於不同結構組件的結構組件。
15.一種使計算機執行如下功能的程序產品接受從構成預先確定的文檔的多個結構組件中進行的對特定結構組件的選擇;以及將特定結構組件插入到預先確定的模板中所包括的預先確定的內容區域,其中對所述特定結構組件的選擇已經被接受。
16.根據權利要求15所述的程序產品,進一步使計算機執行以下功能接受從預先確定的模板中所包括的內容區域中進行的對預先確定的內容區域的選擇,其中對於所述預先確定的內容區域,將向其中插入特定的結構組件。
17.根據權利要求15所述的程序產品,進一步使計算機執行以下功能檢查將特定結構組件插入到預先確定的內容區域從文檔的結構角度來看是否有效,其中對所述特定結構組件的選擇已經被接受。
18.根據權利要求17所述的程序產品,進一步使計算機執行以下功能從構成不同於預先確定的文檔的另一個文檔的結構組件中檢索其位置類似於特定結構組件的結構組件,其中對所述特定結構組件的選擇已經被接受;將檢索到的結構組件插入到預先確定的內容區域。
19.根據權利要求18所述的程序產品,在檢索結構組件的功能中,進一步使計算機執行以下功能判斷在構成不同的文檔的結構組件中是否存在其位置類似於特定結構組件的結構組件,其中對所述特定結構組件的選擇已經被接受;以及在沒有位置類似的結構組件的情況下,從構成不同的文檔的結構組件中檢索其位置類似於不同於預先確定的結構組件的更高級別的結構組件。
20.根據權利要求19所述的程序產品,在檢索結構組件的功能中,進一步使計算機執行以下功能判斷從文檔的結構角度來看,將不同的結構組件插入到預先確定的內容區域是否有效,如果判斷有效,則從構成不同的文檔的結構組件中檢索其位置類似於不同的結構組件的結構組件。
全文摘要
公開了結構化文檔處理器、結構化文檔處理方法和程序。提供了模板存儲裝置11,用於存儲模板,模板選擇接受裝置12,用於接受模板的選擇,模板結構分析裝置13,用於分析模板的結構,內容區域選擇接受裝置14,用於接受內容區域的選擇,文檔存儲裝置15,用於存儲文檔,文檔選擇接受裝置16,用於接受文檔的選擇,文檔結構分析裝置17,用於分析文檔的結構,結構組件選擇接受裝置18,用於接受結構組件的選擇,應用方法存儲裝置19,用於存儲所選擇的內容區域和所選擇的結構組件,文檔結構檢查裝置20,用於檢查將結構組件插入到內容區域從文檔的結構角度來看的有效性,結構組件檢索裝置22,用於從其他文檔的結構組件中檢索類似於所選擇的結構組件的結構組件,以及模板應用裝置21,用於應用模板。
文檔編號G06F17/21GK1577323SQ20041006009
公開日2005年2月9日 申請日期2004年6月28日 優先權日2003年7月28日
發明者長山淳一 申請人:國際商業機器公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀