新四季網

計算機輔助寫作、電子文檔的瀏覽、檢索和預訂發布的製作方法

2023-05-06 02:16:56 1

專利名稱:計算機輔助寫作、電子文檔的瀏覽、檢索和預訂發布的製作方法
技術領域:
本發明涉及數據處理技術,特別涉及計算機輔助寫作、瀏覽電子文檔、檢索電子文檔、以及預訂發布電子文檔的技術。
背景技術:
在以往,作者使用的文檔寫作工具與用戶使用的文檔管理和檢索工具是相互獨立的,即,作者在寫作時並不關心讀者如何來檢索和利用他/她所寫的內容。但是同時,從信息訪問的觀點看,用戶又會感到很難得到他們真正想要的東西。
而且,由於目前計算機對於自然語言的理解能力還處於字/詞理解的水平,而對於文檔的管理和檢索工具來說,需要句子甚至整篇文章的理解和語義能力,才能夠真正滿足用戶的需要。因此,按照目前的技術發展速度,如果按照現有的文檔的寫作以及管理、檢索方式,可以預計在一個較短的將來內不可能達到用戶信息訪問的要求。

發明內容
為了解決以上所述現有技術中的問題,本發明提出了作者在寫作文檔的過程中就為後面文檔的管理和檢索準備相關的信息,即,為作者提供一套工具來方便地為以後用戶的查詢、預覽作貢獻,更具體地說,準備主題摘要。在文本檢索中,主題摘要有助於用戶快速評價檢索結果的相關程度,在信息服務及瀏覽中,主題摘要有助於多種形式的內容分發,如發往PDA,手機等。
根據本發明的一個方面,提供了一種計算機輔助寫作的方法,包括在作者寫作所述電子文檔時,根據所述電子文檔生成一個或多個主題摘要;與所述電子文檔對應地保存所述主題摘要的信息。
根據本發明的另一個方面,提供了一種瀏覽電子文檔的方法,包括讀取與電子文檔對應保存的主題摘要信息,所述主題摘要信息包含有一個或多個主題和相應的主題摘要;將所述主題摘要呈現給用戶;以及當用戶的確認所述主題摘要時,將所述電子文檔的內容呈現給用戶。
根據本發明的再另一個方面,提供了一種輔助寫作裝置,包括電子文檔編輯單元,用於編輯電子文檔;摘要生成單元,用於根據輸入的主題,從所述電子文檔中提取主題摘要;以及摘要保存單元,用於與所述電子文檔相對應地保存由所述摘要生成單元生成的主題摘要信息。
根據本發明的再另一個方面,提供了一種電子文檔的瀏覽器,包括主題摘要讀取單元,用於讀取與所述被瀏覽的電子文檔對應保存的主題摘要信息,所述主題摘要信息包含有一個或多個主題和相應的主題摘要;以及主題摘要呈現單元,用於將所述主題摘要信息中包含的主題摘要呈現給用戶。
根據本發明的再另一個方面,提供了一種檢索電子文檔的方法,包括提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;對所述提取出的主題摘要信息中的主題編制索引;由用戶輸入查詢;從所述主題索引中找出與所述用戶輸入的查詢最接近的一個或多個主題;將上述最接近的一個或多個主題以及相應的主題摘要呈現給所述用戶;以及將所述用戶選擇的主題摘要對應的電子文檔或者連結提供給所述用戶。
根據本發明的再另一個方面,提供了一種檢索電子文檔的方法,包括在根據用戶的查詢查找到一個或多個電子文檔時,讀取這些查找到的電子文檔對應的主題摘要信息,其中每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;將每個所述主題摘要信息中包含的與所述用戶查詢最接近的一個主題的主題摘要呈現給所述用戶;以及將所述用戶選擇的主題摘要對應的電子文檔或者連結提供給所述用戶。
根據本發明的再另一個方面,提供了一種電子文檔的檢索系統,包括主題摘要信息提取裝置,用於提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;主題索引裝置,用於對所述提取出的主題摘要信息中的主題編制索引;主題索引庫,用於保存由所述主題索引裝置編制的主題索引;主題查找裝置,用於從所述主題索引中找出與用戶輸入的查詢最接近的一個或多個主題;主題摘要呈現裝置,用於將由所述主題查找裝置找出的一個或多個主題以及相應的主題摘要呈現給所述用戶;以及電子文檔提供裝置,用於將所述用戶選擇的主題摘要所對應的電子文檔或者連結提供給所述用戶。
根據本發明的再另一個方面,提供了一種電子文檔的檢索系統,所述檢索系統用於根據用戶的查詢查找一個或多個電子文檔,所述系統包括主題摘要讀取裝置,用於讀取所述查找到的電子文檔對應的主題摘要信息,其中每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;主題摘要呈現裝置,用於將每個所述主題摘要信息中包含的與所述用戶查詢最接近的一個主題的主題摘要呈現給所述用戶;以及電子文檔提供裝置,用於將所述用戶選擇的主題摘要對應的電子文檔或者連結提供給所述用戶。
根據本發明的再另一個方面,提供了一種電子文檔的預訂發布的方法,包括 建立訂戶的簡檔,該簡檔中包含所述訂戶希望的預訂主題;提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;根據所述訂戶簡檔中的預訂主題,選擇相關的主題和相應的主題摘要;以及將選中的主題摘要發布給所述訂戶。
根據本發明的再另一個方面,提供了一種電子文檔的預訂發布系統,包括訂戶簡檔存儲裝置,用戶保存訂戶的簡檔,該簡檔中包含所述訂戶希望的預訂主題;主題摘要信息提取裝置,用於提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;主題選擇裝置,用於根據所述訂戶簡檔中的預訂主題,選擇相關的主題和相應的主題摘要;以及訂戶發布裝置,用於將由所述主題選擇裝置選擇的主題摘要發布給所述訂戶。


相信通過以下結合附圖對本發明具體實施方式
的說明,能夠使人們更好地了解本發明上述的特點、優點和目的。
圖1是根據本發明的一個實施例的計算機輔助寫作的方法的流程圖;圖2是根據本發明的一個實施例的瀏覽電子文檔的方法的流程圖;圖3是展示根據本發明的一個實施例的輔助寫作裝置的結構的方塊圖;圖4是展示根據本發明的一個實施例的電子文檔的瀏覽器的結構的方塊圖;圖5是根據本發明的一個實施例的檢索電子文檔的方法的流程圖;圖6是根據本發明的另一個實施例的檢索電子文檔的方法的流程圖;圖7是展示根據本發明的一個實施例的電子文檔的檢索系統的結構的方塊圖;圖8是根據本發明的一個實施例的電子文檔的預訂發布的方法的流程圖;以及圖9是展示根據本發明的一個實施例的電子文檔的預訂發布系統的結構的方塊圖。
具體實施例方式
下面就結合附圖對本發明的各個優選實施例進行詳細的說明。
計算機輔助寫作的方法根據本發明的一個方面,提供了一種計算機輔助寫作的方法。圖1是根據本發明的一個實施例的計算機輔助寫作的方法的流程圖。
如圖1所示,首先,在步驟101,作者寫作電子文檔。通常,主題摘要的生成是在作者寫完一篇文檔時進行,當然,根據實際情況也可以在完成文檔的一部分(例如一個章節)時進行。
接著,在步驟105,由作者輸入一個主題,或者根據寫作的文檔利用算法自動生成一個主題。在此,主題(topic)可以是一個或多個關鍵詞(keyword)或者自然語言查詢(NL query),其中主題中去掉停用詞(stopword)的關鍵詞稱作主題詞(topic term)。優選地,由作者輸入主題,因為作者可以根據其寫作意圖來決定最能代表該文檔主要內容的主題。如果是自動生成主題,則可以採用在文檔中關鍵詞出現的頻率或者其他信息提取技術來生成主題。
接著,在步驟110,根據該主題從電子文檔(或文檔段)中提取主題摘要。根據本發明的一個實施例可以通過以下方法來根據主題從文檔中提取主題摘要a)計算文檔(或者文檔段)中每個詞(不包括停用詞)的重要性(權重),例如,利用if-idf方法的公式1wj=tf·idf (1)在公式1中,tf是該詞在該文檔中的出現的頻率(次數),idf=all_sentences/term_sentences;其中,all_sentences是該文檔中全部句子的數量,term_sentences是其中包含該詞的句子的數量。
b)計算每個句子的重要性,即將一個句子的全部詞的權重相加,例如用公式2valuei=wjSiwj---(2)]]>c)計算文檔中每個句子與所述主題的相關性,例如可以利用以下公式3scorei=n2q---(3)]]>在公式3中,n是在該句子中出現的主題詞的次數,q是該主題中主題詞的個數。
d)將上述句子的重要性和與主題的相關性結合起來,例如利用下面公式4,來計算每個句子的綜合分值
ri=λ·scorei+(1-λ)·valuei(4)在公式4中,λ是一個0和1之間的係數,用來調整在結合句子的重要性和相關性時的比例,根據本發明的一個優選實施例,可以將其設為0.9,從而強調與主題的相關性。
e)將上述計算出的綜合分值最大的預定數量的句子選擇作為主題摘要。
應當理解,以上只是舉例說明的一種提取主題摘要的方法,還有各種其他根據主題提取摘要的方法,例如,直接列出包含主題詞的句子、使用模板來產生摘要等等,這些方法也多可以適用於本發明。並且,上面雖然是出了計算句子重要性、相關性和綜合分值的公式1~4,但是這些公式的形式和其中的係數是可以作出各種變化的。
進而,在根據主題生成摘要時,還可以利用各種改善摘要可讀性的技術,例如,共同申請人的中國專利申請「用於改善由機器自動生成的摘要的可讀性的方法和裝置」(申請號200310101752.9),其內容被全部包含於此以供參考。
再回到圖1,接著在步驟115,由作者核實該主題摘要。在此,「核實」包括作者查看、修改生成的主題摘要,從而保證最終的主題摘要是準確地、完整地反映該文檔內容的。
然後,在步驟120,判斷是否希望為更多的主題生成主題摘要。通常,一篇文檔會包含許多方面的內容,同樣讀者在查找和閱讀文檔時會有各種不同目的。因此,如果在本步驟判斷為還有更多的主題應當反映的話,就返回到步驟105,輸入下一個主題並提取與該主題對應的摘要;如果沒有其他主題需要提取了,再向下進行到步驟125。
在步驟125,與該電子文檔對應地保存主題摘要信息。具體地,根據本法明的優選實施例,可以將主題摘要信息作為知識標記(knowledge tag)與電子文檔一起保存,例如,在電子文檔的結尾處附加TopicSummary
Topic1Rocket/Topic1
Summary1Yao Ming scored all 18 of his points in the first half and reserve Maurice Taylor had 11
of his 17 points in the fourth quarter in the Houston Rockets′105-90 victory over the Los AngelesClippers 105-90 Monday night./Summary1
Topic2Laker/Topic2
Summary2Kobe Bryant scored 28 points,Karl Malone had 20 points and 10 rebounds and GaryPayton added 17 points and 10 assists to lead the Los Angeles Lakers to a 121-89 drubbing of theMemphis Grizzlies on Sunday night./Summary2
……/TopicSummary
也可以在電子文檔的頭部定義主題摘要知識標記標記類型,在電子文檔的正文中利用該標記指明摘要包含的句子的方式。
如前面所述,本發明沒有對主題摘要信息的具體保存方式進行限定,例如,可以與電子文檔一起保存,即,作為電子文檔的一部分,也可以分開保存,只要能夠與所述電子文檔相對應即可。
通過以上對本實施例的描述可知,如果採用本實施例的輔助寫作方法,則可以輔助作者在寫作的過程中完成多個主題摘要的準備,在不過多增加作者負擔的情況下,利用作者對於該文檔的理解(這肯定是最準確的理解),來保證生成主題摘要的準確性和可讀性。並且,因為可以為一個文檔生成可以充分反映該文檔內容的多個主題摘要(例如,一篇關於NBA的報導中可能包含火箭、湖人、公牛等多個球隊以及多個球員的情況,相應地可以生成相應主題的摘要),因此在利用這些主題摘要信息進行檢索和預覽時,可以更準確和全面,從而得到高的用戶滿意度。
另外,根據本發明的一個實施例,在作者核實該主題摘要之後,對經作者核實、修改之後的主題摘要進行評估,以評價其可靠性。具體地,可以利用多種摘要生成方法(摘要引擎)生成多個摘要,並分別計算這些摘要與作者核實過的摘要的相關程度,將這些相關程度值的加權和,作為該核實後的摘要的準確性量度。並且,在後的面步驟125中,也將該準確性信息作為主題摘要信息的一部分保存。這樣,可以客觀地反映該主題摘要的可靠性。
瀏覽電子文檔的方法在同一發明構思下,根據本發明的另一個方面,提供了一種瀏覽電子文檔的方法,該電子文檔是通過上述計算機輔助寫作的方法產生的文檔,即,與該文檔對應地保存有主題摘要信息。
圖2是根據本發明的一個實施例的瀏覽電子文檔的方法的流程圖。如圖2所示,首先在步驟201,讀取電子文檔的主題摘要信息。具體地,根據保存主題摘要信息的方式,將主題摘要信息讀出,例如,如果主題摘要信息是被保存在文檔的尾部作為知識標記,則相應地識別出該知識標記並將其中信息讀出。
接著,在步驟205,將主題摘要信息中的主題摘要呈現給用戶。具體地,可以有多種方式來呈現主題摘要。最直接的方式是將每個主題和相應主題摘要依次列出。但是,當主題摘要的數量很大時,也可以由用戶輸入希望的主題,然後從所述主題摘要信息中包含的多個主題中選擇與用戶輸入的主題最接近的主題,再將所述最接近的主題的主題摘要顯示給用戶。
接著,在步驟210,讀者查看主題摘要,並判斷是否對該文檔感興趣。如果讀者對該文檔感興趣,則確認並進入到步驟215,將該文檔的內容呈現給讀者;如果讀者對該文檔不感興趣,則不顯示文檔內容,而進行到步驟220,關閉文檔結束。
通過以上對本實施例的描述可知,如果採用本實施例的瀏覽電子文檔的方法,則可以利用由本發明前述的輔助寫作方法編制的電子文檔中的主題摘要信息,在將文檔全部內容呈現給讀者之前,將由作者核實過的相關主題的摘要提供給讀者觀看,讓讀者了解他所關心的主題在該文檔中的大致內容,從而可以節省讀者的閱讀時間。
輔助寫作裝置在同一發明構思下,根據本發明的另一個方面,提供了一種輔助寫作裝置。圖3是展示根據本發明的一個實施例的輔助寫作裝置的結構的方塊圖。
如圖3所示,該輔助寫作裝置300,包括電子文檔編輯單元301,用於編輯電子文檔,它可以是一個獨立的文檔編輯單元,也可以共用已有的文檔編輯器,例如,MS Word或WPS等等;摘要生成單元302,用於根據輸入的主題,從電子文檔中提取主題摘要;摘要保存單元306,用於與電子文檔相對應地保存由摘要生成單元302生成的主題摘要信息;摘要評價單元305,用於允許作者對由摘要生成單元302生成的主題摘要進行評價、修改;摘要緩存304,用於臨時保存由摘要生成單元302生成的主題摘要。
本實施例的輔助寫作裝置300,在操作上,可以實現前面描述的計算機輔助寫作方法。
相應地,輔助寫作裝置300還可以包括準確性計算單元,用於評價所述經過作者核實的摘要的準確性。其中,摘要生成單元302還可以包括句子重要性計算裝置,用於計算所述文檔中每個句子的重要性;句子相關性計算裝置,用於計算所述文檔中每個句子與所述主題的相關性;句子提取裝置,用於結合所述計算出來的每個句子的重要性和相關性、選擇預訂數量的句子。
通過以上對本實施例的描述可知,如果採用本實施例的輔助寫作裝置,則可以輔助作者在寫作的過程中完成多個主題摘要的準備,在不過多增加作者負擔的情況下,利用作者對於該文檔的理解(這肯定是最準確的理解),來保證生成主題摘要的準確性和可讀性。並且,因為可以為一個文檔生成可以充分反映該文檔內容的多個主題摘要,因此在利用這些主題摘要信息進行檢索和預覽時,可以更準確和全面,從而得到高的用戶滿意度。
電子文檔的瀏覽器在同一發明構思下,根據本發明的另一個方面,提供了一種電子文檔的瀏覽器,該電子文檔是通過上述計算機輔助寫作的方法產生的文檔,即,與該文檔對應地保存有主題摘要信息。
圖4是展示根據本發明的一個實施例的電子文檔的瀏覽器的結構的方塊圖。如圖4所示,本實施例的電子文檔瀏覽器400,包括電子文檔瀏覽單元401,用於瀏覽電子文檔的內容,它可以是一個現有技術中的瀏覽器,例如,MS Internet Explorer,Netscape Navigator,Acrobat Reader等等;主題摘要信息讀取單元402,用於讀取與所述電子文檔對應保存的主題摘要信息,具體地,根據保存主題摘要信息的方式,將主題摘要信息讀出,例如,如果主題摘要信息是被保存在文檔的尾部作為知識標記,則相應地識別出該知識標記並將其中信息讀出;主題摘要呈現單元403,用於將由主題摘要信息讀取單元402讀取的主題摘要信息中的主題摘要呈現給用戶,具體地,可以有多種方式來呈現主題摘要。最直接的方式是將每個主題和相應主題摘要依次列出。但是,當主題摘要的數量很大時,也可以由用戶輸入希望的主題,然後從所述主題摘要信息中包含的多個主題中選擇與用戶輸入的主題最接近的主題,再將所述最接近的主題的主題摘要顯示給用戶,這時,該瀏覽器400還包含一個主題選擇單元(未圖示),用於從所述主題摘要信息中包含的多個主題中選擇與用戶輸入的主題最接近的主題。
通過以上對本實施例的描述可知,本實施例的電子文檔瀏覽器可以實施本發明上述瀏覽電子文檔的方法。如果採用本實施例的電子文檔瀏覽器,則可以利用由本發明前述的輔助寫作方法編制的電子文檔中的主題摘要信息,在將文檔全部內容呈現給讀者之前,將由作者核實過的相關主題的摘要提供給讀者觀看,讓讀者了解他所關心的主題在該文檔中的大致內容,從而可以節省讀者的閱讀時間。
檢索電子文檔的方法在同一發明構思下,根據本發明的另一個方面,提供了一種檢索電子文檔的方法,其中電子文檔是通過上述計算機輔助寫作的方法產生的文檔,即,與該文檔對應地保存有主題摘要信息。
圖5是根據本發明的一個實施例的檢索電子文檔的方法的流程圖。如圖5所示,首先在步驟501,提取與多個電子文檔對應的主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要。具體地,如果電子文檔的作者是使用上述輔助寫作裝置300寫作文檔的,則每個電子文檔都會有一個與其對應的主題摘要信息。在本步驟中,就是將多個電子文檔的主題摘要信息提取出來。特別地對於在網際網路上發布的電子文檔,可以通過網絡搜索器(web crawler)來遍歷各個電子文檔,並提取其對應的主題摘要信息,例如從知識標記中提取。
接著,在步驟505,對提取出的主題摘要信息中的主題編制索引。在此,可以使用信息檢索領域中常用的各種索引方法來對這些主題摘要信息中的主題編制索引,例如,倒排文件、籤名文件、PAT樹或PAT陣列等。
接著,在步驟510,由用戶輸入自己的查詢。與主題一樣,用戶的查詢可以是一個或多個關鍵詞(keyword)或者問題。
接著,在步驟515,找出與用戶輸入的查詢接近的一個或多個主題。具體地,本步驟可以包括計算用戶輸入的查詢與主題索引中各個主題的相關程度,以及將上述相關程度最高的一個或者相關程度大於一個預定閾值的主題選擇出來。
然後,在步驟520,將上述最接近的一個或多個主題以及相應的主題摘要呈現給所述用戶,並且,在步驟525,當用戶選擇了其中一個主題摘要時,將用戶選擇的主題摘要對應的電子文檔或者連結提供給所述用戶。
通過以上對本實施例的描述可知,本實施例的檢索電子文檔的方法,可以利用由本發明前述的輔助寫作方法編制的電子文檔中的主題摘要信息,將這些主題摘要信息提取出來,用於用戶的查詢。由於主題摘要信息中的主題和相應的摘要,是經過作者核對的,可以保證其準確性和可讀性,因此,本實施例的檢索電子文檔的方法可以更準確,進而在將文檔全部內容呈現給讀者之前,將由作者核實過的相關主題的摘要提供給讀者觀看,讓讀者了解他所關心的主題在該文檔中的大致內容,從而可以節省讀者的查找時間。
圖6是根據本發明的另一個實施例的檢索電子文檔的方法的流程圖。其中電子文檔是通過上述計算機輔助寫作的方法產生的文檔,即,與該文檔對應地保存有主題摘要信息。
圖6所示的方法,與現有技術的電子文檔檢索方法一樣,在步驟601,根據用戶的查詢查找電子文檔,例如,利用已有的全文檢索、關鍵詞檢索等等。
所不同的是,在向用戶提供檢索結果預覽時,首先,步驟605讀取這些查找到的電子文檔對應的主題摘要信息,其中每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要。
接著,在步驟610,將每個所述主題摘要信息中包含的與所述用戶查詢最接近的一個主題的主題摘要呈現給所述用戶。具體判斷最接近主題的方法前面已經進行了描述在此不再重複說明。
然後,在步驟615,如果用戶選擇了其中一個主題摘要,則將所述用戶選擇的主題摘要對應的電子文檔或者連結提供給所述用戶。
通過以上對本實施例的描述可知,本實施例的檢索電子文檔的方法,可以利用由本發明前述的輔助寫作方法編制的電子文檔中的主題摘要信息,在將文檔全部內容呈現給讀者之前,將由作者核實過的相關主題的摘要提供給讀者觀看,讓讀者了解他所關心的主題在該文檔中的大致內容,從而可以節省讀者的查找時間。
電子文檔的檢索系統在同一發明構思下,根據本發明的另一個方面,提供了一種電子文檔的檢索系統,其中電子文檔是通過上述計算機輔助寫作的方法產生的文檔,即,與該文檔對應地保存有主題摘要信息。
與前面圖5所示的檢索方法相對應,圖7是展示根據本發明的一個實施例的電子文檔的檢索系統的結構的方塊圖。
如圖7所示,電子文檔的檢索系統700,包括主題摘要信息提取裝置701,用於提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要,如前所述,主題摘要信息提取裝置701可以是一個網絡搜索器(web crawler)來遍歷網絡上的各個電子文檔,並提取其對應的主題摘要信息;主題索引裝置702,用於對所述提取出的主題摘要信息中的主題編制索引;主題索引庫703,用於保存由主題索引裝置702編制的主題索引;主題查找裝置706,用於從主題索引庫703的主題索引中找出與用戶輸入的查詢最接近的一個或多個主題;主題摘要呈現裝置705,用於將由主題查找裝置706找出的一個或多個主題以及相應的主題摘要呈現給用戶;電子文檔提供裝置704,用於將用戶選擇的主題摘要所對應的電子文檔或者連結提供給所述用戶。
進而,檢索系統700還可以包括相關度計算裝置(未圖示),用於計算兩個詞語串的相關程度;從而,主題查找裝置706,利用該相關度計算裝置,計算用戶輸入的查詢與主題索引中各個主題的相關程度,並且將上述相關程度最高的一個預定數量或者相關程度大於一個預定閾值的主題選擇出來。
通過以上對本實施例的描述可知,本實施例的電子文檔的檢索系統可以實現前面結合圖5所述的電子文檔檢索方法,可以將由本發明前述的輔助寫作方法編制的電子文檔中的主題摘要信息用於用戶的查詢。由於主題摘要信息中的主題和相應的摘要,是經過作者核對的,可以保證其準確性和可讀性,因此,本實施例的電子文檔的檢索系統可以更準確檢索,進而在將文檔全部內容呈現給讀者之前,將由作者核實過的相關主題的摘要提供給讀者觀看,讓讀者了解他所關心的主題在該文檔中的大致內容,從而可以節省讀者的查找時間。
另外,為了實現前面圖6所示的檢索方法,可以在現有技術的用於根據用戶的查詢查找一個或多個電子文檔的檢索系統中增加設置主題摘要讀取裝置,用於讀取查找到的電子文檔對應的主題摘要信息,其中每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;主題摘要呈現裝置,用於將每個所述主題摘要信息中包含的與所述用戶查詢最接近的一個主題的主題摘要呈現給所述用戶;電子文檔提供裝置,用於將所述用戶選擇的主題摘要對應的電子文檔或者連結提供給所述用戶。
進而,該檢索系統也可以包括一個相關度計算裝置,用於計算兩個詞語串的相關程度;從而,所述主題摘要呈現裝置,利用所述相關度計算裝置,對每個所述主題摘要信息計算用戶輸入的查詢與主題摘要信息中各個主題的相關程度,將上述相關程度最高的一個主題的主題摘要呈現給所述用戶。
本實施例的電子文檔的檢索系統可以實現前面結合圖6所述的電子文檔檢索方法,可以利用由本發明前述的輔助寫作方法編制的電子文檔中的主題摘要信息,在將文檔全部內容呈現給讀者之前,將由作者核實過的相關主題的摘要提供給讀者觀看,讓讀者了解他所關心的主題在該文檔中的大致內容,從而可以節省讀者的查找時間。
電子文檔的預訂發布的方法和系統在同一發明構思下,根據本發明的另一個方面,提供了一種電子文檔的預訂發布的方法和系統,其中電子文檔是通過上述計算機輔助寫作的方法產生的文檔,即,與該文檔對應地保存有主題摘要信息。
通常,發布(publish)/訂閱(subscribe)系統由內容提供者、訂戶(subscriber)客戶機以及發布-訂閱伺服器構成。內容提供者產生通過發布-訂閱系統分發的內容。內容提供者向發布-訂閱伺服器發送結構化的內容。訂戶客戶機向發布-訂閱伺服器發送訂閱請求,並以訂戶簡檔的方式記錄訂戶的希望主題,訂戶從發布-訂閱服務接收內容。所收到的實際內容將決定於訂閱和消息選擇過程。共同申請人的中國專利申請「從公布/訂閱服務接收電子消息的方法和系統」(申請號03149816.7)中公開了這樣的發布-預訂系統和方法,其全部內容被包含於此以供參考。
圖8是根據本發明的一個實施例的電子文檔的預訂發布的方法的流程圖。如圖8所示,首先在步驟801,提取與多個電子文檔對應的主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要。與前面圖5中的步驟501一樣,如果電子文檔的作者是使用上述輔助寫作裝置300寫作文檔的,則每個電子文檔都會有一個與其對應的主題摘要信息。在本步驟中,就是將多個電子文檔的主題摘要信息提取出來。特別地對於在網際網路上發布的電子文檔,可以通過網絡搜索器(web crawler)來遍歷各個電子文檔,並提取其對應的主題摘要信息,例如從知識標記中提取。
接著,在步驟805,將前面步驟提取出的主題摘要信息作為選擇對象,根據訂戶簡檔選擇相關的主題。具體地,例如可以先計算訂戶簡檔中的預訂主題與所述主題摘要信息中各個主題的相關程度,然後將相關程度大於一個預定閾值的主題和相應的主題摘要選擇出來。在此,本發明的電子文檔的預訂發布的方法與現有技術的主要區別在於,將主題摘要信息作為選擇對象,而對於選擇過程則可以利用已知的各種方式,例如,中國專利申請03149816.7號中公開的方式。
然後,在步驟810,將選中的主題和相應的摘要發布給訂戶。
通過以上對本實施例的描述可知,本實施例的電子文檔的預訂發布的方法,可以利用由本發明前述的輔助寫作方法編制的電子文檔中的主題摘要信息,將這些主題摘要信息提取出來,用於選擇與訂戶簡檔匹配的摘要。由於主題摘要信息中的主題和相應的摘要,是經過作者核對的,可以保證其準確性和可讀性,因此,本實施例的電子文檔的預訂發布的方法可以更準確。
圖9是展示根據本發明的一個實施例的電子文檔的預訂發布系統的結構的方塊圖。如圖9所示,電子文檔的預訂發布系統900,包括訂戶簡檔存儲裝置903,用於保存訂戶的簡檔,該簡檔中包含所述訂戶希望的預訂主題;主題摘要信息提取裝置901,用於提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;主題摘要緩存902,用於臨時保存由主題摘要信息提取裝置901提取出的主題摘要信息;主題選擇裝置905,用於根據訂戶簡檔存儲裝置中保存的訂戶簡檔中的預訂主題,選擇主題摘要緩存902中保存的相關的主題和相應的主題摘要;訂戶發布裝置904,用於將由主題選擇裝置905選擇的主題摘要發布給所述訂戶。
進而,該電子文檔的預訂發布系統900還可以包括一個相關度計算裝置(未圖式),用於計算兩個詞語串的相關程度。主題選擇裝置905,利用該關度計算裝置,計算訂戶簡檔中的預訂主題與提取的主題摘要信息中各個主題的相關程度,並且將上述相關程度大於一個預定閾值的主題和相應的主題摘要選擇出來。
本實施例的預訂發布系統,可以實施前面描述的電子文檔的預訂發布方法,從而可以更準確地向訂戶發布相關信息。
本發明的上述輔助寫作裝置、電子文檔的瀏覽器、電子文檔的檢索系統、電子文檔的預訂發布系統以及它們各自的組成部分可以以硬體和軟體方式實現,並且根據需要可以和其他裝置結合,例如,可以實現在個人計算機、筆記本計算機、掌上型計算機、PDA、文字處理機等各種帶有計算功能的設備上,並且可以物理地分離而操作上互相連接完成功能。
以上雖然通過一些示例性的實施例對本發明的計算機輔助寫作的方法、瀏覽電子文檔的方法、輔助寫作裝置、電子文檔的瀏覽器、檢索電子文檔的方法、電子文檔的檢索系統、電子文檔的預訂發布的方法以及電子文檔的預訂發布系統進行了詳細的描述,但是以上這些實施例並不是窮舉的,本領域技術人員可以在本發明的精神和範圍內實現各種變化和修改。因此,本發明並不限於這些實施例,本發明的範圍僅由所附權利要求為準。
權利要求
1.一種計算機輔助寫作的方法,其特徵在於,包括在作者寫作所述電子文檔時,根據所述電子文檔生成一個或多個主題摘要;以及與所述電子文檔對應地保存所述主題摘要的信息。
2.根據權利要求1所述的計算機輔助寫作的方法,其特徵在於,所述生成一個或多個主題摘要的每一個的步驟,包括輸入或者生成一個主題,所述主題包含一個或多個主題詞;以及根據所述主題從所述電子文檔中提取摘要。
3.根據權利要求2所述的計算機輔助寫作的方法,其特徵在於,所述根據所述主題從所述電子文檔中提取摘要的步驟,包括計算所述文檔中每個句子的重要性;計算所述文檔中每個句子與所述主題的相關性;以及結合所述計算出來的每個句子的重要性和相關性,選擇預定數量的句子作為所述主題的摘要。
4.根據權利要求2所述的計算機輔助寫作的方法,其特徵在於,進一步包括從與所述被選擇的句子相鄰的句子中,選擇與所述被選擇的句子相關性高的句子納入所述主題的摘要中。
5.根據權利要求2所述的計算機輔助寫作的方法,其特徵在於,所述生成一個或多個主題摘要的步驟,進一步包括核實所述提取出的摘要。
6.根據權利要求5所述的計算機輔助寫作的方法,其特徵在於,所述生成一個或多個主題摘要的步驟,進一步包括評價所述經過核實的摘要的準確性;其中,所述保存所述主題摘要的步驟,進一步保存所述摘要的準確性信息。
7.根據權利要求6所述的計算機輔助寫作的方法,其特徵在於,所述評價所述經過核實的摘要的準確性的步驟包括利用不同的摘要生成方法為所述主題生成多個參考摘要;計算所述核實的摘要與所述生成的多個參考摘要之間的相關程度;以及根據這些相關程度計算所述核實的摘要的準確性。
8.根據權利要求1所述的計算機輔助寫作的方法,其特徵在於,所述與所述電子文檔對應地保存所述主題摘要的信息的步驟,包括將所述主題摘要信息作為知識標記保存在所述電子文檔中。
9.根據權利要求1所述的計算機輔助寫作的方法,其特徵在於,所述與所述電子文檔對應地保存所述主題摘要的信息的步驟,包括將所述主題摘要信息保存為與所述電子文檔相關聯的知識標記文件。
10.一種瀏覽電子文檔的方法,其特徵在於,包括讀取與電子文檔對應保存的主題摘要信息,所述主題摘要信息包含有一個或多個主題和相應的主題摘要;將所述主題摘要呈現給用戶;以及當用戶確認所述主題摘要時,將所述電子文檔的內容呈現給用戶。
11.根據權利要求10所述的瀏覽電子文檔的方法,其特徵在於,所述主題摘要信息中包含多個主題和相應的主題摘要;其中,所述將所述主題摘要呈現給用戶的步驟,包括由用戶輸入希望的主題;從所述主題摘要信息中包含的多個主題中選擇與用戶輸入的主題最接近的主題;以及將所述最接近的主題的主題摘要呈現給用戶。
12.一種輔助寫作裝置,其特徵在於,包括電子文檔編輯單元,用於編輯電子文檔;摘要生成單元,用於根據輸入的主題,從所述電子文檔中提取主題摘要;以及摘要保存單元,用於與所述電子文檔相對應地保存由所述摘要生成單元生成的主題摘要信息。
13.根據權利要求12所述的輔助寫作裝置,其特徵在於,進一步包括摘要評價單元,用於允許作者對由所述摘要生成單元生成的主題摘要進行評價、修改。
14.根據權利要求13所述的輔助寫作裝置,其特徵在於,進一步包括準確性計算單元,用於評價所述經過核實的摘要的準確性。
15.根據權利要求12所述的輔助寫作裝置,其特徵在於,所述摘要生成單元,包括句子重要性計算裝置,用於計算所述文檔中每個句子的重要性;句子相關性計算裝置,用於計算所述文檔中每個句子與所述主題的相關性;以及句子提取裝置,用於結合所述計算出來的每個句子的重要性和相關性、選擇預訂數量的句子。
16.一種電子文檔的瀏覽器,其特徵在於,包括主題摘要讀取單元,用於讀取與所述被瀏覽的電子文檔對應保存的主題摘要信息,所述主題摘要信息包含有一個或多個主題和相應的主題摘要;以及主題摘要呈現單元,用於將所述主題摘要信息中包含的主題摘要呈現給用戶。
17.根據權利要求16所述的電子文檔的瀏覽器,其特徵在於,進一步包括主題選擇單元,用於從所述主題摘要信息中包含的多個主題中選擇與用戶輸入的主題最接近的主題;其中,所述主題摘要呈現單元,只將所述最接近的主題的主題摘要呈現給用戶。
18.一種檢索電子文檔的方法,其特徵在於,包括提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;對所述提取出的主題摘要信息中的主題編制索引;由用戶輸入查詢;從所述主題索引中找出與所述用戶輸入的查詢最接近的一個或多個主題;將上述最接近的一個或多個主題以及相應的主題摘要呈現給所述用戶;以及將所述用戶選擇的主題摘要對應的電子文檔或者連結提供給所述用戶。
19.根據權利要求18所述的檢索電子文檔的方法,其特徵在於,所述找出與所述用戶輸入的查詢最接近的一個或多個主題的步驟,包括計算用戶輸入的查詢與主題索引中各個主題的相關程度;以及將上述相關程度最高的一個預定數量或者相關程度大於一個預定閾值的主題選擇出來。
20.一種檢索電子文檔的方法,其特徵在於,包括在根據用戶的查詢查找到一個或多個電子文檔時,讀取這些查找到的電子文檔對應的主題摘要信息,其中每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;將每個所述主題摘要信息中包含的與所述用戶查詢最接近的一個主題的主題摘要呈現給所述用戶;以及將所述用戶選擇的主題摘要對應的電子文檔或者連結提供給所述用戶。
21.根據權利要求20所述的檢索電子文檔的方法,其特徵在於,所述將每個所述主題摘要信息中包含的與所述用戶查詢最接近的一個主題的主題摘要呈現給所述用戶的步驟,包括對於每個所述主題摘要信息,計算用戶輸入的查詢與主題摘要信息中各個主題的相關程度,將上述相關程度最高的一個主題的主題摘要呈現給所述用戶。
22.一種電子文檔的檢索系統,其特徵在於,包括主題摘要信息提取裝置,用於提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;主題索引裝置,用於對所述提取出的主題摘要信息中的主題編制索引;主題索引庫,用於保存由所述主題索引裝置編制的主題索引;主題查找裝置,用於從所述主題索引中找出與用戶輸入的查詢最接近的一個或多個主題;主題摘要呈現裝置,用於將由所述主題查找裝置找出的一個或多個主題以及相應的主題摘要呈現給所述用戶;以及電子文檔提供裝置,用於將所述用戶選擇的主題摘要所對應的電子文檔或者連結提供給所述用戶。
23.根據權利要求22所述的電子文檔的檢索系統,其特徵在於,進一步包括相關度計算裝置,用於計算兩個詞語串的相關程度;其中,所述主題查找裝置,利用所述相關度計算裝置,計算用戶輸入的查詢與主題索引中各個主題的相關程度,並且將上述相關程度最高的一個預定數量或者相關程度大於一個預定閾值的主題選擇出來。
24.一種電子文檔的檢索系統,所述檢索系統用於根據用戶的查詢查找一個或多個電子文檔,其特徵在於,包括主題摘要讀取裝置,用於讀取所述查找到的電子文檔對應的主題摘要信息,其中每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;主題摘要呈現裝置,用於將每個所述主題摘要信息中包含的與所述用戶查詢最接近的一個主題的主題摘要呈現給所述用戶;以及電子文檔提供裝置,用於將所述用戶選擇的主題摘要對應的電子文檔或者連結提供給所述用戶。
25.根據權利要求22所述的電子文檔的檢索系統,其特徵在於,進一步包括相關度計算裝置,用於計算兩個詞語串的相關程度;所述主題摘要呈現裝置,利用所述相關度計算裝置,對每個所述主題摘要信息計算用戶輸入的查詢與主題摘要信息中各個主題的相關程度,將上述相關程度最高的一個主題的主題摘要呈現給所述用戶。
26.一種電子文檔的預訂發布的方法,其特徵在於,包括建立訂戶的簡檔,該簡檔中包含所述訂戶希望的預訂主題;提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;根據所述訂戶簡檔中的預訂主題,選擇相關的主題和相應的主題摘要;以及將選中的主題摘要發布給所述訂戶。
27.根據權利要求26所述的電子文檔的預訂發布的方法,其特徵在於,所述選擇相關的主題和相應的主題摘要的步驟,包括計算所述訂戶簡檔中的預訂主題與所述主題摘要信息中各個主題的相關程度;以及將上述相關程度大於一個預定閾值的主題和相應的主題摘要選擇出來。
28.一種電子文檔的預訂發布系統,其特徵在於,包括訂戶簡檔存儲裝置,用戶保存訂戶的簡檔,該簡檔中包含所述訂戶希望的預訂主題;主題摘要信息提取裝置,用於提取分別與多個電子文檔對應的多個主題摘要信息,每個所述主題摘要信息包含有一個或多個主題和相應的主題摘要;主題選擇裝置,用於根據所述訂戶簡檔中的預訂主題,選擇相關的主題和相應的主題摘要;以及訂戶發布裝置,用於將由所述主題選擇裝置選擇的主題摘要發布給所述訂戶。
29.根據權利要求28所述的電子文檔的預訂發布系統,其特徵在於,進一步包括相關度計算裝置,用於計算兩個詞語串的相關程度;其中,所述主題選擇裝置,利用所述相關度計算裝置,計算所述訂戶簡檔中的預訂主題與由所述主題摘要信息提取裝置提取的主題摘要信息中各個主題的相關程度,並且將上述相關程度大於一個預定閾值的主題和相應的主題摘要選擇出來。
全文摘要
本發明提供了計算機輔助寫作的方法、瀏覽電子文檔的方法、輔助寫作裝置、電子文檔的瀏覽器、檢索電子文檔的方法、電子文檔的檢索系統、電子文檔的預訂發布的方法以及電子文檔的預訂發布系統。所述計算機輔助寫作的方法,包括在作者寫作所述電子文檔時,根據所述電子文檔生成一個或多個主題摘要;並由作者確保該主題摘要的可靠性;與所述電子文檔對應地保存所述主題摘要的信息。
文檔編號G06F7/00GK1629834SQ20031012128
公開日2005年6月22日 申請日期2003年12月17日 優先權日2003年12月17日
發明者劉世霞, 楊力平 申請人:國際商業機器公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀