新四季網

輔助表格填充的製作方法

2023-04-29 23:45:51

專利名稱:輔助表格填充的製作方法
技術領域:
本發明一般涉及計算機,更具體地說,涉及幫助完成計算機表格的系統和方法。
背景技術:
計算機和網絡技術從高花費、低性能的數據處理系統向低花費、高性能的通信的演化,問題解決和娛樂系統提供了一種經濟有效的、省時的方式來減少處理每天的任務,諸如書信往來、付帳、購物、預算以及信息採集的負擔。例如,一通過有線或者無線技術接入到網際網路的計算系統可向用戶提供一信道,該信道可近乎即時地接入到來自網頁庫和分布在全球的伺服器的豐富的信息,只需用戶手指輕點。
最近的研究表明大約7000萬工人(美國工作的成年人中的59%)一般將完成表格作為他們工作責任的一部分。對於這7000萬工人來說,至少25%一般填充電子表格(例如,在計算機上),並且這個百分比每天都在增加。因此,加入到表格中的數據顯示在計算機的顯示器上是一個很普通的動作。填充表格是單調、耗時並且高度受到人類錯誤的影響。因此,在本領域中對於幫助更快更準確進行表格填充的系統和方法存在未滿足的需求。

發明內容
下面展現了對於本發明的簡單的概述,以提供對於本發明的一些方面的基礎理解。該概述不是對於本發明的廣泛的綜述。其不是為了識別本發明的關鍵/確定性的元素或者描繪本發明的範圍。其目的僅僅是為了以一種簡單的形式展現本發明的一些概念,並作為之後展現的更加詳細的描述的前序。
本發明提供通過使用存在於未標記的文本格式(例如,email文本、web頁、以及/或者其他計算機可讀格式)中的數據來幫助輔助用戶快速填充計算機表格的系統和方法。按照本發明的一方面,用戶可從,例如用戶所接收的email中選擇未標記的文本。該未標記的文本可在未標記媒質圖形用戶接口(GUI)的文本框中顯示給用戶,並可被解析以識別潛在的用戶在填充表格的欄位時感興趣的元素。例如,如果email包含諸如人名、城市、州…的項目,則這些名稱可被識別為潛在感興趣的元素。此外,這些名稱可被放置在它們在通過表格GUI顯示給用戶的表格中的相應的欄位中。表格GUI和未標記的媒質GUI可被並發地顯示給用戶。
按照本發明的另一方面,用戶可驗證所識別的元素是否被精確地插入到它們在表格中對應的欄位中。例如,色彩標示可被用於表示表格中一個具體元素和一個具體欄位之間的聯繫,例如,當填充(populating)聯繫表時,被識別為名的未標記的文本被用藍色高亮顯示(highlight),而對應的表格中的「名」欄位可被以藍色顯示給用戶。用戶將高亮顯示的名下拉到名欄位中,或者更有效地,該系統可自動將名插入到其欄位中。
按照本發明的相關方面,狀態標示可與表格中的每一個欄位相關以警告用戶任何潛在的錯位的信息,以這種形式,用戶可驗證所識別的元素是否被正確地插入到正確的欄位中。例如,諸如「Lincoln」的元素可被插入到「姓」欄位中,但也可以被插入到「城市」欄位中。與名字「Lincoln」所插入的欄位相鄰的狀態指示器可警告用戶要求對插入到該欄位中的內容的正確性進行驗證。狀態指示器還可以使用顏色來視覺地警告用戶關於欄位信息的狀態(例如,用戶驗證、回顧……的重要性等級)。
按照本發明的另一方面,人工智慧技術以及/或者反饋/前饋信息可被用於幫助自動插入到表格欄位中的元素增加可信度等級。例如,隱性馬爾可夫(Markov)模型是使用隱性和顯性隨機變量的概率論(probabilistic)模型的一種類型。這樣的模型可被用於增加本系統和方法插入未標記的媒質元素至表格欄位中的效率。按照這種方式,用戶的參與可潛在地被降低到僅僅在保存並列印所完成的表格之前確定表格中的信息是否是正確的。
按照本發明的另一方面,校正傳播可被用於至少部分基於由用戶進行的單個欄位的校正而幫助校正各個欄位的信息。例如,被驗證為正在由用戶校正以及/或者已經由用戶校正的信息可被估計以幫助關於其他信息是否被正確分配給一給定欄位的推斷。按照這種方式,對一個欄位輸入的校正傳播到其他的欄位。
為了達到上述的以及相關的目的,本發明的某些所示出的方面在此處結合下面的說明以及附圖進行描述。然而,這些方面示出了僅僅是本發明的原理可被應用的各種方法中的一小部分,而本發明試圖包括所有的方面以及它們的等價內容。本發明的其他優勢和創新的特徵可從下面結合附圖考慮的對本發明的詳細說明中變得明顯。


圖1是說明一種按照本發明的一方面幫助輔助用戶填充表格中的欄位的表格填充接口系統100。
圖2是說明按照本發明的一方面幫助輔助填表的系統200。
圖3是說明包括按照本發明的一方面幫助輔助填表的人工智慧組件的系統300。
圖4是說明幫助輔助用戶填充表格中的欄位的隱性馬爾可夫模型的一個示例400。
圖5是說明本發明在輔助用戶填充表格時的效率的柱狀圖500。
圖6是說明按照本發明的一個方面的方法600。
圖7是說明按照本發明的一個方面的方法700。
圖8是說明按照本發明的一個方面的方法800。
圖9是說明按照本發明的一個方面的方法900。
圖10和11是說明按照本發明的一個方面的計算環境1000和1100的一個示例。
具體實施例方式
本發明現在參考附圖進行描述,其中相似的標記被始終用於表示相同的元素。在下面的描述中,為了簡明,說明了許多具體的細節以提供對於本發明的徹底的理解。然而,可以證明本發明可以不具備這些具體的細節而被實現。在其他的情況下,公知的結構和設備以框圖的形式示出以幫助表示本發明。
如在本申請中所使用的,術語「組件」被用於表示計算機相關實體、或者硬體、硬體和軟體的組合、軟體、或者正在執行的軟體。例如,組件可以是但是不限於在處理器上運行的進程、處理器、對象、可執行的軟體執行線程、程序,以及/或者計算機。作為說明,在伺服器上運行的應用程式以及該伺服器可以是計算機組件。一個或多個組件可駐留在進程中以及/或者執行線程中而組件可被本地放置於一個計算機以及/或者分布在兩個或更多個計算機中。「線程」是作業系統核心調度用於執行的進程中的一個實體。如在本領域中所熟知的,每個線程具有相關的「環境」,該「環境」是和線程的執行相關的易失性數據。線程的環境包括系統寄存器的內容和屬於該線程的進程的虛擬地址的內容。因此,包含線程的環境的真實數據在其執行時改變。
如這裡所使用的,術語「推斷」一般是指從一組通過事件以及/或者數據捕獲的觀察中推出或者推斷系統、環境、以及/或者用戶的狀態的過程。例如,推斷可被用於識別一具體的環境或者動作、或者可產生在狀態上的概率分布。推斷可以是或然性的(probabilistic)——也就是說,在感興趣的狀態上的概率分布的計算是基於數據和事件的考慮。推斷還指所使用的用於從一組時間以及/或者數據中組成高等級事件的技術。這些推斷會導致從一組觀察的事件以及/或者存儲的事件數據中構建新的事件或者動作,不論該事件是否在緊靠的時間附近(close temporal proximity)相關,以及不論該事件和數據是否來自一個或數個事件和數據源。
最近的研究表明大約7000萬工人(美國工作的成年人中的59%)一般將完成表格作為他們工作責任的一部分。對於這7000萬工人來說,至少25%一般填充電子表格(例如,在計算機上),並且這個百分比每天都在增加。因此,加入到表格中的數據顯示在計算機的顯示器上是一個很普通的動作。填充表格是單調、耗時並且高度受到人類錯誤的影響。在許多情況下,被用於填充表格中的欄位的數據可容易地以計算機可讀的格式供使用,諸如在文本文件、email、以及或者web頁上。從這樣的數據中識別和提取(例如,解析)相關信息的技術是存在的,但是是高度不可靠的,並且因此不是很合適於直接填充資料庫或者添加元數據(metadata)。例如,自然語言處理技術以及/或者其他的人工智慧(AI)技術可識別計算機可讀文檔中的具體類型的信息元素,例如名字、地址、電話號碼等等,但是這樣的方法不能避免錯誤。本發明允許用戶比通過傳統的系統和方法更快地輸入數據到電子表格中。此外,本發明通過允許使用不可靠的解析技術和允許用戶視覺驗證並校正由解析器造成的錯誤來允許用戶在存在未標記的計算機可讀數據時更加有效地輸入信息。
圖1是說明了幫助電子表格的輔助表格填充的系統100。按照說明,表格填充接口(FFI)102被展現給用戶以輔助用戶通過傳輸未標示的數據至標示的數據(例如,XML-格式的數據,…),或者至資料庫中來填充表格。FFI 102(此處也稱為「屏幕」)包括表格數據圖形用戶接口(GUI)104(此處也稱為「表格」)而未標示的媒質GUI 106(此處也稱為「文本框」),它們可在屏幕上位於相互緊臨的位置以方便用戶。表格數據GUI 104包括數個欄位108,這樣每個欄位被保留用於具體的信息片(piece of information)(例如,名、姓、街道地址、郵政編碼……)。狀態指示器110可與每一個欄位108相關地操作以通知用戶在具體欄位中的信息的當前狀態。此外,可信度指示符112可與每一個欄位108相關以通知用戶關於與欄位108中的信息的正確性相關聯的概率。
在圖1中說明的FFI 102示出了用於輸入聯繫信息的接口。起初,表格數據GUI 104(例如,典型的聯繫信息表格、貨物以及/或者服務定購表格…)以及空的文本框106被展現給用戶。用戶可複製文本段至文本框106(例如,通過從email剪切和複製…),而系統100可試圖分類、或者解析未標記的數據以識別在未標示的數據中的元素。當未標示的數據被解析時,系統100可在具有所識別的元素的計算機終端上填充表格104中的欄位108。文本框106和表格104中的原始未標記的數據可被同時顯示在屏幕102上,而未標記的數據可被增加以視覺地表示相關性(例如,使用色彩編碼……)。例如,系統100可使用紫色來表示未標示文本中的某個元素已經被用於填充表格104中的地址欄位。按照該示例,其他的色彩(例如,橙色)可被用於標示系統100已經確定具體的文本是潛在的感興趣的,但是可信度等級並不足以高到將其分配到欄位中,並且,因此用戶可以做出確定是否具體的文本是否應該被分配給具體的欄位。
按照本發明的相關方面,用戶可在表格的一部分中進行填充,而系統100可在可供使用的未標記的計算機可讀媒質中搜索,定位潛在的欄位輸入候選,顯示該定位的文檔以及/或者元素,並填充表格中的剩餘欄位。以這種方式,可執行部分的自動填充。
用戶可快速驗證解析的正確性。如果解析存在錯誤,用戶可校正它們(例如,通過從未標記的文本中拖曳元素並將它放置在表格的相應欄位中、通過直接在欄位中鍵入、通過在文本框106中校正文本等等)。此外,解析協議可利用側信息(side information),例如由用戶提供的校正或者添加。例如,如果用戶輸入信息至欄位或者校正了起始的解析,該用戶可指令系統重新解析該未標記的文本並依靠由用戶提供的側信息(通過點擊圖1中標有「AutoFill」的按鈕),繼續本發明,名稱「Charles Stanly」說明「Charles」是特定聯繫人的名而「Stanely」是特定聯繫人的姓。然而,用戶可發現聯繫人的姓和名顛倒了,無論是由於意外還是其他原因,並且可使用上述的拖-放技術將「Stanely」放置到名欄位中。此外,欄位可被提供下拉式菜單,以使在文本框中顯示的未標記數據包含多餘一個的名時,例如,一個名可被顯示在名欄位中而其他可在下拉式菜單中被提供,這樣用戶可簡單地打開菜單(例如,點擊,拖曳…)並在欄位要求校正時選擇一其他名稱(alternate name)。
在進行該動作時,系統可自動將「Chaeles」移動到姓欄位中,降低填充表格所要求的用戶動作的數量且同時增加姓欄位的可信度等級,這是基於用戶驗證「Stanley」是聯繫人的名且因而不會是聯繫人的姓的事實。這樣的自動粘貼用戶動作(post-user-action)欄位填充是校正傳播的一個示例。
在一些情況中,允許用戶識別哪一個欄位可被用作側信息(例如在所填充的欄位中的信息以及/或者由用戶校正的信息…)是有利的,且哪個欄位是系統允許覆蓋的(例如,不包括側信息的欄位)。這種允許可通過狀態指示器110來輔助,狀態指示器110可指示用戶沒有在該欄位上採取動作、或者已經驗證了、校正了、以及/或者輸入了信息至該欄位。例如,每個欄位的信息可以是「未填充以及未驗證」、「自動填充但是未驗證」、或者「用戶或者自動填充並且驗證」。
例如,「未填充以及未驗證」的欄位可以是第一色彩(例如,紅色)的狀態指示器110。如果系統100填充了欄位(例如,欄位是自動填充的),之後狀態指示器可升級至第二狀態指示器色彩(例如,黃色)以警告用戶欄位已經被自動填充但是未經驗證。這樣的指示器可警告用戶一種要求用戶驗證的情況,但是不需要校正的情況,如上述的「Charles Stanley」例子。如果用戶驗證在欄位中的信息是正確的,狀態指示器可被升級到第三色彩(例如,綠色)以表示狀態「填充並驗證」。繼續該示例,如果用戶輸入信息至具有紅色狀態指示器的欄位,則狀態指示器可被直接升級至綠色,因為用戶已經填充了該欄位並通過完成該動作來驗證該信息是正確的。因此該欄位現在是「填充並驗證的」。此外,另一個欄位的可信度可被更新以及/或者通過用戶驗證以及/或者第一欄位的校正來改善。例如,在「Charles Stanley」的示例中,如果沒有驗證哪一個名稱是名以及/或者哪一個名稱是姓,姓欄位可具有黃色狀態指示器。如果用戶驗證「Charles」是正確的名,則系統100將名欄位的狀態升級到「(用戶)填充並驗證」(例如,具有綠色的狀態指示器)。因為用戶已經驗證「Charles」是名(並且因而不會是姓),系統可將「Stanley」保留在姓欄位中,且因此姓欄位的可信度指示器也被從黃色升級到綠色(例如,自動填充並驗證)。
按照本發明的相關方面,色彩編碼的可信度指示器112可與具體的欄位108相關(例如,欄位的邊界色彩,欄位以及/或者文本的背景色彩,等等)。例如,難以讓系統100以高可信度因素填充的欄位可被按照可向用戶表示該欄位少於所希望的可信度閥值的色彩方案標記。可信度指示符可以不同灰度的色彩陰影表示從0到1的值。此外,該示例中的可信度指示器112可以是,例如,實心(solid)指示器、閃爍(blinking)指示器、全亮度、對比度等等的淡進淡出(fade in and out)指示器、或者任何可按照所論指示欄位可信度的不同等級的其他適合的指示器方案。
按照一個示例,包括「@」或者「.com」的信息片可被自動插入到表格中的「email」欄位。類似的,具有格式(nnn)nnn-nnnn、nnn-nnn-nnnn、nnn-nnnn等等的信息,其中n是整數,該信息可被以高度的可信度自動插入到電話號碼欄位中。需要理解高可信度指示可與其他類型的信息相關,該信息是針對這些信息將要被寫入的欄位中,而這些信息的自動插入不限於email以及/或者電話號碼欄位。
圖2是說明了幫助輔助表格填充的系統200,包括控制組件202,其可操作的耦合於未標示的媒體GUI 204、表格數據GUI 206、以及解析組件208中的每一個。控制組件202可接收並分析未標記的數據以幫助填充表格中的欄位。這些未標記的欄位可通過未標記的媒體GUI 204展現給用戶。未標記的數據可以是,例如,由用戶粘貼到未標記的媒體GUI 204的email摘錄。在將未標記的數據粘貼到未標記的媒體GUI 204中後,數據可被保存在未標記的媒體存儲器210中。解析組件208可解析保存在未標記的媒體數據存儲器206中的未標記的數據以確定潛在的表格填充數據(例如,諸如名稱的合適的名詞、諸如地址、電話號碼、郵政編碼的數字數據組…),它們可被保存在表格數據存儲器212中。保存在表格數據存儲器212中的數據可被用於填充表格中的欄位,並通過表格數據GUI 206展現給用戶。如結合圖1所描述的,之後用戶可驗證或者校正表格中個別欄位,且這些驗證以及/或者校正可被作為側信息保存在側信息存儲器214中。解析組件208可使用所保存的側信息來按照由用戶進行的驗證以及/或者改變來升級表格數據存儲器212。在這種方式中,文本分類以及/或者標記可被更新,其允許和自動填充的欄位相關的狀態等級響應用戶驗證以及/或者欄位的校正而升級。
需要理解此處描述的數據存儲(例如,存儲器)組件可以是易失性或者非易失性存儲器,或者可包括易失性或者非易失性存儲器兩者。為了說明而不是限制,非易失性存儲器可包括只讀存儲器(ROM)、可編程ROM(PROM)、電子可編程ROM(ROM)、電子可擦寫ROM(EEPROM)、或者快閃記憶體。易失性存儲器可包括隨機存取存儲器(RAM),其是作為外部高速緩存。為了說明而不是限制,RAM可以多種形式存在,諸如同步RAM(SRAM)、動態RAM(DRAM)、同步DRAM(SDRAM)、雙倍數據速率SDRAM(DDR SDRAM)、增強SDRAM(ESDRAM)、同步鏈路DRAM(SLDRAM)、以及直接存儲器總線RAM(DRRAM)。本系統和方法的存儲器試圖包括,但不限於這些以及任何其他合適類型的存儲器。
圖3說明了按照本發明的一方面並且以類似於在上面參考圖2描述的方式來幫助輔助表格填充的系統300。系統300包括控制組件302,其可操作地耦合於未標示的媒體GUI 304、表格數據GUI 306、以及解析組件308中的每一個。控制組件302分析未標記的數據以填充表格中的欄位。這些未標記的欄位可通過未標記的媒體GUI 304展現給用戶。未標記的數據可以是,例如,由用戶粘貼到未標記的媒體GUI 304的email摘錄。在將未標記的數據粘貼到未標記的媒體GUI 304中後,數據可被保存在未標記的媒體存儲器310中。解析組件308可解析保存在未標記的媒體數據存儲器306中的未標記的數據以確定潛在的表格填充數據(例如,諸如名字的合適的名詞、諸如地址、電話號碼、郵政編碼的數字數據集合…),它們可被保存在表格數據存儲器312中。保存在表格數據存儲器312中的數據可被用於填充表格中的欄位,並通過表格數據GUI 306展現給用戶。如結合圖1所描述的,然後用戶可驗證或者校正表格中個別欄位,且這些驗證以及/或者校正可被作為側信息保存在側信息存儲器314中。解析組件308可使用所保存的側信息來按照由用戶進行的驗證以及/或者改變升級表格數據存儲器312。在這種方式中,與自動填充欄位相關聯的可信度以及文本分類和/或標記可被更新,以響應用戶驗證以及/或者欄位的校正而有利於校正傳播。此外,解析組件308可操作地耦合於人工智慧(AI)組件316,其可做出針對大多數可輸入特定數據片的欄位的推斷。
如這裡所使用的,術語「推斷」一般是指從一組通過事件以及/或者數據捕獲的觀察中推出或者推斷系統、環境、以及/或者用戶的狀態的過程。例如,推斷可被用於識別一具體的環境或者動作、或者可產生在狀態上的概率分布。推斷可以是或然的(probabilistic)——也就是說,在感興趣的狀態上的概率分布的計算是基於數據和事件的考慮。推斷還指所使用的用於從一組時間以及/或者數據中合成高等級事件的技術。這些推斷會導致從一組觀察的事件以及/或者保存的事件數據中構建新的事件或者動作,不論該事件是否在緊靠的時間附近(close temporal proximity)相關,以及不論該事件和數據是否來自一個或數個事件和數據源。多種分類方案以及/或者系統(例如,支持向量機器、神經網絡、專家系統、Bayesian確信網絡、模糊邏輯、數據融合(fusion)引擎…)可被與執行和本發明相關的自動以及/或者推斷的動作相關聯。此外,推斷可被本發明使用,例如,基於隱性馬爾可夫模型(HMM),就如下面將要推斷圖4討論的,參考下文。
圖4說明了按照本發明的一方面使用HMM來幫助輔助表格填充的方案400。HMM和其他的或然論模型可被用於從用戶接口「回-信道」信息至一解析器以幫助校正傳播,其允許在單個欄位由用戶校正時校正鄰居欄位。HMM是具有一組狀態Q、一輸出字母,O、轉換概率,A、輸出概率,B以及初始狀態概率,П的有限狀態機變量。當前的狀態一般不是可觀察的。相反,每個狀態可產生具有特定概率,B的輸出。通常狀態Q以及輸出O是被了解的,所以HMM被認為是三元組的,(A、B、П),具有下列的屬性A=[aij=P(qjat t+1|qiat t)]其中P(a|b)是對於一給出的b的條件概率,t≥1,以及qi∈Q。
非正式的,A是下一個狀態是qj而給定當前狀態是qi的概率。
B=[bik=P(ok|qi)]其中ok∈Q。
非正式的,B是輸出是ok而給定當前狀態是qi的概率。
П=[pi=P(qiat t=1)]按照圖4,示出了不同的隨機變量Xl至Xn,它們可表示表格中的欄位。這些欄位可以是欄位組中的一部分,包括{名、後綴(suffix)、姓、街道地址號、街道名稱、城市、州、郵政編碼、電話號碼、email地址…}。還需要理解可被輸入到其中的X欄位的組以及信息片Y不限於上面描述的示例信息欄位,但是還可包括任何其他合適的信息片以及/或者欄位。Y可表示對應於給出的X的真實信息片,這樣如果Y1等於「John」,且如果X1=「first name」為真(例如,P(X1=first name=1)),則「John」可以插入到用X1所表示的欄位中。類似的,如果Y2=「Smith」而X2=「last name」為真,則「Smith」可被插入到與X2相關聯的欄位中。因此,當Y的值是被觀察到時,X仍然是隱性的。一般,概率分布將是被觀察到的(例如,(P(X1=名)=0.23,P(X1=姓)=0.03,P(X1=城市名稱)=0.093等等),這樣顯示具有最高分的標記(例如,按照該示例是「first name」)可被選擇。這樣的推斷有利於尋找隱性變量的最佳設置。在隱性馬爾可夫模型的情況下,可找到最有可能的狀態序列。例如argmaxx1,...,xnp(Y1...Yn|X1=x1,...Xn=xn)]]>按照類似的示例,具體的X可和條件「5個數字」相關,這樣如果Y具有7個數字(555-1234)則其將註冊一較低的概率(例如,P(Y=555-1234|X=0.00001)用於具體的所論的X。相反的,包括諸如12345的信息Y將被註冊一高的概率(例如,P(Y=555-1234)|X=0.9989)用於具體的X並可被插入到表格中相關的欄位中。類似的,上面描述的7個數字的Y對於具有條件「7個數字」的X將註冊高概率的結果。本發明可使用任何數量的可是的變量或者測試來確定哪一個具體的Y滿足和具體X相關的條件以幫助輔助表格填充。
本發明可利用(capitalize)或然論模型的優勢,諸如上述的HMM,其包含隱性和顯性的隨機變量,通過設置隱性變量(X)至對應具體的欄位的標籤的狀態。例如,HMM中的Y隨機變量是「顯性」的隨機變量,其中每個變量對應一個記號(token)。一個記號(token)是記號定界符(delimiter)(例如,空格、破折號、逗號等等)之間的文本的片段。例如,文本串「this-isa,test」將被記號化成「this」=記號1「is」=記號2「a」=記號3「test」=記號41是隱性變量,X表示具有每一個允許的標記的記號的概率(例如,記號在標記上的分布)。在信息提取欄位中,最通常的,由於沒有使用「側信息」,X仍然是非顯性的。為了強迫或然論模型使用側信息(例如,在具有用戶提供的文本的文本欄位的表格中),對應於用戶提供的文本的記號可被搜索而對應的隱性變量X可被設置為對應於該欄位的標記的狀態。這可被視為設置p(X1=名)=1以及P(X1=姓)=0等等,並且在推斷期間不進行更新。例如,如果用戶鍵入「Smith」至表格的姓欄位,可在所有的記號中進行搜索以查找「Smith」。之後,設置p(X2=姓)=1,並且在推斷期間不更新概率分布。
校正傳播還可以進一步完成將回信道信息從用戶接口傳送至解析器。在這種形式下,鄰居欄位可在單個欄位由用戶校正時被填充。如,本發明可使用基於規則的解析方法,其中簡化版本的規則表示「如果姓欄位是由用戶設置,則在未標記的文本中查找名並且將緊靠在姓之前的單詞標記為名」。也可以對應用于姓的規則。在這種形式下,對於名的校正「傳播」至姓。需要理解此處描述的校正傳播不限于姓和名,還可被應用於任何的以及所有相關類型的信息、文本等等。
此外,本發明可使用條件隨機欄位(CRF),其是HMM和最大熵模型兩者的推廣。CRF允許引入任意的非局部特徵並捕獲標記之間的獨立性,允許估計所解析的信息片的可信度。在這種方式中,本發明可在信息具有高可信度等級時自動分配所解析的信息片至一欄位,並可標示具有低可信度等級的信息片以供用戶回顧以及/或者校正。
圖5說明了隨機不正確欄位被校正前後CRF之間的關係的柱狀圖500。在填充表格期間,針對欄位驗證和校正的用戶動作可被通過數個用戶互動模型(UIM)預測以及/或者模型化。例如,在簡單的情況中,UMI1,一用戶可被展現一自動填充的表格並被要求校正所有的錯誤(例如,不進行校正傳播)。因此,所要求的用戶動作的數量等於在自動填充表格期間發生的錯誤的總數。
按照第2種情況,UIM2,假設一初始的自動欄位分配,基於系統可起始校正傳播,用戶執行單一、隨機選擇的校正。如此反覆直到所有的欄位被校正。
按照第3種情況,UIM3,假設一初始自動欄位分配,而用戶在最少可信度不正確欄位上進行校正。例如,可按照可信度(例如,按可信度指示符)視覺地向用戶發出關於欄位的警告直到錯誤被找到。校正傳播可按照最少可信度欄位執行,而用戶可被提示校正任何剩下的錯誤。
表格填充一般要求完美的精確性。因此,所帶來的好處可在無論何時填充時間減少了,還是對用戶的認知負擔減少了,或者兩者減少時被認識到。本發明使用有效的測量,稱為預期的用戶動作數量(ENUA)來輔助其他的標準性能測量。ENUA被定義為正確填充表格中的所有欄位所要求的用戶動作的數量(例如,點擊…)。ENUA可根據UIM而變化,如上面所描述的。為了表示ENUA,使用符號P(i:j),其是在i次人工校正之後錯誤j的數量的概率分布。該分布可使用圖5中的柱狀圖表示例如,在UIM1下,ENUA為ENUA=n=0nP(0;n)]]>其中P(0:n)是不正確欄位(參考圖2)上的分布。
例如,按照UIM2和UIM3模型,ENUA為ENYA1=(1-P(0;0))+nnP(1;n)]]>其中P(0:0)是所有欄位被正確地初始分配的概率而P(1:n)是在一個欄位被校正之後表格中不正確欄位的數量的分布。不同的分布是根據哪一個UIM被使用。ENUA1的上標1表示校正傳播被執行了一次。
還是參考圖5,表格被按照在每個表格中包含錯誤的欄位的數量而分組。實心條表示在任何校正之前使用基於CRF的解析的結果,而虛框表示在一個隨機不正確的欄位被校正之後的分布。這樣的信息可分別被用於估計P(0;n)和P(1;n)。
同時,為了解釋簡單,此處示出的一個或多個方法,例如以流程圖的形式示出的,被作為一系列的動作示出並描述,需要理解並領悟本發明並不為動作的順序所限,一些動作可按照本發明以不同的順序出現以及/或者與其他在此處示出或者描述的動作同時出現。例如,熟悉本領域的人員將會理解和領悟方法也可以被展現為一系列相互關聯的狀態或者事件,諸如在一狀態圖中。此外,並不是所有的所示出的動作是實現按照本發明的方法所要求的。
圖6是說明按照本發明的一方面用於輔助自動填充表格的方法600。在602,選擇的未標記的媒質被插入到一未標記的媒質GUI中的文本框中。在604,插入的媒質被解析以確定可潛在被用於填充表格中的欄位的元素。在606,狀態可被分配給輸入到欄位中的元素並被指示給用戶。例如,所選擇的未標記的媒質,諸如「John Smith and Jane Doe will be at the convention nextweekend」包含兩個名和兩個姓。如果「John」被用於填充例如一聯繫人列表中的「名」欄位,則其可與其狀態指示符相關(例如,「填充但是未驗證」),其可警告用戶「John」可能不是在名欄位中正確的(例如,期望的)輸入。此外,「Jane」可通過下拉式菜單而變得對用戶可用以幫助潛在的用戶校正姓欄位。指示符可以是,例如,緊靠名欄位的色彩編碼的狀態指示符「亮」。繼續該示例,一紅-黃-綠協議可被用於指示不同的狀態等級,其中紅色表示欄位未填充且未驗證,黃色表示欄位已填充但是未驗證,而綠色表示欄位被填充(或者自動填充或者由用戶填充)並且驗證。在本示例中,姓欄位可具有黃色的狀態指示器,表示姓欄位被填充,但是姓「John」還沒有被驗證。
在608,用戶被提醒驗證以及/或者校正表格欄位,而具體的表格欄位展現了少於,例如綠色狀態的任何東西(例如,在示例的情況中綠色表示填充且驗證的狀態)。然後,在步驟610,針對用戶是否校正(例如,改變了)了任何信息做出確定。按照本示例,如果「John」不希望在「名」欄位中輸入,則用戶可點擊文本框中的「Jane」並拉曳「Jane」至姓欄位以校正該輸入。此外,「Jane」可從已經展現在該名欄位中的下拉式菜單中選擇。如果用戶已經校正了任何的信息,則該方法可進入612,其中欄位可以根據用戶的輸入作更新同時文本可被重新解析。本方法可被轉換到606用作屬性升級以及使數據輸入到表格的欄位中,該欄位可以針對用戶輸入發生。如果用戶在610沒有校正信息,那麼能在614作出一個確定針對是否用戶驗證了欄位輸入。如果用戶沒有在614驗證欄位輸入,則該方法可轉換到608以進一步提示用戶在展現除了「填充且驗證」以外的狀態的欄位輸入上採取動作。如果用戶在614驗證精確的信息,那麼其他的欄位相應的屬性標示可在616被更新。例如,「John」是姓欄位所需要的輸入,則指示符的狀態可在616從黃色升級到綠色。
圖7說明了根據本發明的一個方面幫助輔助用戶填充表格的方法700。在702,所選擇的未標記的媒質被粘貼到表格填充界面中的文本框中。在704,未標記的媒質被粘貼到所識別的潛在的元素中(例如,名稱、地址、電話號碼…),它們可被用於填充表格中的欄位。在706元素可被輸入,而狀態可與輸入的元素相關並顯示給用戶以表示特定的輸入是否正確插入到相關的欄位中。在708,針對是否所有的欄位展現了最高可能性狀態的確定被做出(例如,是否所有的欄位是「填充並且驗證」的)。如果所有的欄位在708顯示了「填充且驗證」的指示,則用戶不需要被提示採取行動而該方法可終止。然而,如果任何欄位展現了少於「填充且驗證」的狀態,那麼方法進入到710,其中用戶被提示校正以及/或者驗證任何有疑問的欄位。在712,可針對用戶是否已經校正了一個欄位輸入的確定被做出。如果是這樣,則在714,表格欄位可根據用戶輸入被更新,而文本框可被重新解析,在轉換到706進行狀態升級和將元素輸入到欄位之前。如果確定用戶沒有在712校正任何的欄位,那麼在714針對用戶是否驗證了有疑問的欄位的確定可被做出。如果用戶沒有驗證具有少於所希望的狀態的欄位,那麼該方法可轉換到710以進一步提示用戶採取行動。如果在716確定用戶已經驗證了有疑問的信息,則在718欄位可被更新且其相關的狀態可被升級。
圖8說明了按照本發明的一個方面的方法800,按照該方法802未標記的媒質被解析。在步驟804,隱性馬爾可夫模型(HMM)被使用以確定可輸入特定元素的正確欄位。在806,元素被顯示在具有一狀態指示符的所確定的正確欄位中。用戶在808被提示驗證和/或校正輸入在欄位中的信息。在810,作出針對用戶校正是否被檢測的確定,如果是這樣則在812用戶校正的欄位以及通過校正傳播而校正的其他欄位可被更新,而狀態也可因而升級。該方法然後轉換到806,其中原素被顯示而狀態被按照用戶輸入而指示。如果校正沒有在810被檢測到,則在814針對用戶驗證是否發生的確定被做出。如果用戶沒有驗證輸入的信息是正確的,則該方法可轉換到808以進一步提示用戶採取行動。如果在814,確定用戶已經驗證了在有疑問的欄位中的信息是正確的,則該方法進入到816,其中驗證的元素被顯示在正確地欄位中,同時升級的狀態也被顯示。
圖9說明了按照本發明的一個方面的方法900。在902,未標記的媒質被讀取到未標記的媒質存儲器中,在904,側信息(例如,從用戶動作,諸如數據輸入、驗證、校正…中收集的信息)被讀取到側信息存儲器中。在906未標記的媒質可被解析以識別可潛在填充表格欄位的元素。所識別的元素可在908被寫入到別個數據存儲器中。之後在910,所識別的數據可在表格GUI中的表格欄位中顯示給用戶,在912,未標記的媒質GUI中的未標記媒質可與幫助輔助用戶填充表格欄位的視覺指示符一起被顯示。例如文本框中的名可被用一特定色彩(例如橙色)色彩編碼以表示它們可被輸入到表格GUI的名欄位中,該欄位也用橙色進行色彩編碼。按照另一個示例解析的未標記的包括一個「@」符號的文本可被編碼成例如藍色,以表示該文本可被輸入到表格GUI的「email」欄位中,該GUI也是藍色.
在914用戶可被提示進行驗證以及/或者校正在表格GUI的欄位中的元素分配。然後,在916可作出決定再一次解析該未標記的媒質。如果做出了決定,則在918,用戶輸入被添加到側信息存儲器,而系統轉換到906重新重複進行未標記的媒質解析和元素識別。如果確定在916沒有附加的解析,則在920,表格數據存儲器的內容可被寫入到資料庫或者文件中。
為了提供附加的環境用戶實現本發明的多個方面,圖10和11以及下述的討論是為了提供一個合適的計算環境1000的簡要、概括的描述,其中本發明的不同方面可被實現。雖然本發明在上面結合可在本地計算機以及/或者遠程計算機上運行的電腦程式的計算機可執行指令的一般環境描述,本領域的技術人員將會認識到本發明也可以結合其他程序模塊實施。一般,程序模塊包括例程、程序、組件、數據結構等等,它們可執行具體的任務以及/或者實現具體的抽象數據類型。此外,本領域的技術人員還會認識到本發明的方法可在其他計算機系統配置中實現,包括單個處理器或者多個處理器的計算系統、迷你計算機、大型計算機、以及個人計算機、手持計算設備、基於微處理器以及或者可編程消費者電子設備,等等。其中的每一個可可操作地與一個或多個相關的設備通信。所示出的本發明的方面還可以在分布式計算環境中實現,其中特定的任務可由通過通信網絡連結的遠程處理設備執行。然而,本發明的一些,但不是全部的方面可在單個的計算機上實現。在分布式計算環境中,程序模塊可位於本地以及/或者遠程存儲儲存設備上。
如在該應用中所使用的,術語「組件」用於指計算機相關的實體,可以是硬體、硬體和軟體的組合、軟體、或者所執行的軟體。例如,一組件可以是,但不限於在處理其上運行的進程、處理器、對象、可執行的執行線程、程序、以及計算機。為了說明,在伺服器上的運行的應用程式以及/或者伺服器可以是組件。此外,組件可包括一個或多個子組件。
參考圖10,用於實現本發明的多個方面的示例系統環境1000包括傳統計算機1002,其包括處理器單元1004、系統存儲器1006、以及其耦合各種系統組件,包括將系統存儲器耦合至處理器單元1004的系統總線1008。處理器單元1004可以是商業可用的或者專有的處理器。此外,處理器單元可被實現為由多餘一個的處理器所形成的多處理器,例如可以是並行連接的。
系統總線1008可以是多種類型的總線結構中的任何一種,包括存儲器總線或者存儲器控制器、外圍總線、以及使用諸如PCI、VESA、微通道、ISA、以及EISA(僅僅列出一小部分)的多種傳統總線結構中的任何一種的本地總線。系統存儲器1006包括只讀存儲器(ROM)1010和隨機存取存儲器(RAM)1012。包括幫助在計算機1002中的元件之間傳遞信息的基本例程,例如在啟動期間的基本輸入/輸出系統(BIOS)1014被保存在ROM 1010中。
計算機1002還可包括,例如,硬碟驅動器1016、磁碟驅動器1018,例如用於讀取或者寫入至可移動盤1020、以及光碟驅動器1022,例如,用於讀取或者寫入CD-ROM盤1024或者其他光媒質。硬碟驅動器1016、磁碟驅動器1018、以及光碟驅動器1022分別通過硬碟驅動器接口1026、磁碟驅動器接口1028、以及光碟驅動器接口1030連接到系統總線1008。驅動器1016-1022以及它們相關的計算機可讀媒質提供對於用於計算機1002的數據、數據結構、計算機可讀指令等等的非易失性存儲。儘管上面對於計算機可讀媒質的描述是針對硬碟、可移動磁碟和CD,本領域的技術人員可以理解其他可被計算機讀取的媒質的類型,例如磁帶、快閃記憶體卡、數字視頻光碟、Bernoulli盒式磁碟等等,也可以被用於示例操作環境1000,且進一步任何這樣的媒質可包含用於執行本發明的方法的計算機可讀指令。
數個程序模塊可被保存在驅動器1016-1022的存儲器和RAM 1012中,包括作業系統1032、一個或多個應用程式1034、其他程序模塊1036、以及程序數據1038。作業系統1032可以是任何合適的作業系統或者作業系統的組合。為了舉例,應用程式1034和應用模塊1036可包括按照本發明的一個方面幫助基於客戶的網絡瀏覽(web-crawling)。
用戶可通過一個或多個用戶輸入設備,諸如鍵盤1040和指示設備(例如,滑鼠1042)輸入命令和信息至計算機1002。其他的輸入設備(沒有示出)可包括麥克風、遊戲杆、遊戲盤、圓盤衛星天線、無線遙控器、掃描儀等等。這些或者其他的輸入設備經常通過耦合至系統總線1008的串行接口1044連接到處理器單元1004,但是也可以通過其他接口,諸如並行埠、遊戲埠或者通用串行總線(USB)連接。監視器1046或者其他類型的顯示設備也可以通過諸如視頻適配器1048的接口連接到系統總線1008。除了監視器1046,計算機1002可包括其他的外圍輸出設備(沒有示出),例如揚聲器、印表機等等。
需要理解計算機1002可在使用邏輯連接至一個或多個遠程計算機1060的網絡化環境中操作。遠程計算機1060可以是工作站、伺服器計算機、路由器、對等設備或者其他公共網絡節點,並一般包與合計算機1002相關描述的許多或者全部元件,儘管為了簡明的目的,僅僅存儲儲存設備1062在圖10中被示出。在圖10中說明的邏輯連接可包括區域網(LAN)1064和廣域網(WAN)1066。這樣的網絡環境在辦公室、企業範圍的計算機網絡、內聯網和網際網路上是常見的。
例如,當在LAN網絡環境中使用時,計算機1002通過網絡接口或適配器1068連接至區域網1064。當在WAN網絡環境中使用時,計算機1002一般可包括數據機(例如,電話機、DSL、電纜…)1070、或者連接到LAN上的通信伺服器,或者具有其他用於在WAN 1066,諸如網際網路上建立通信的裝置。數據機1070相對於計算機1002可以是內置或外置的,通過串行埠接口1044連接至系統總線1008。在網絡化環境中,程序模塊(包括應用程式1034)以及/或者程序數據1038可儲存在遠程存儲器存儲設備1062中。可以理解,示出的網絡連接是示例性的,也可以使用在計算機1002和1060之間建立通信鏈路的其他裝置(例如,有線或者無線的)來實現本發明的一方面。
按照本領域中的技術人員實現的計算機編程,本發明已經參考可由計算機,例如計算機1002或者遠程計算機1060執行的操作的動作和符號表現進行描述,除非另有表示。這樣的動作和操作有時被稱為是由計算機執行。可以理解動作和符號表現的操作包括由處理單元1004對表現數據比特的電氣信號進行的操作,該數據比特會導致電氣信號表現的變換或者轉化,將該數據比特維持在存儲器系統(包括系統存儲器1006、硬碟驅動器1016、軟盤驅動器1020、CD-ROM 1024、以及遠程存儲器1062)中的存儲位置以重新配置或者改變計算機系統的操作以及對信號的其他處理。數據位所維持的存儲器位置是具有對應於該數據比特的特定電、磁或者光學屬性的物理位置。
圖11示出了另一個本發明可交互的示例計算環境1100的示意框圖。系統1100進一步示出了包括一個或多個客戶機1102的系統。客戶機1102可以是硬體和/或軟體(如,線程、進程、計算裝置)。系統1100也包括一個或多個伺服器1104。伺服器1104也可以是硬體和/或軟體(如,線程、進程、計算裝置)。例如,伺服器1104可容納線程,以通過使用本發明執行變換。客戶機1102和伺服器1104之間的一個可能的通信可以是適用於在兩個或多個計算機進程之間傳輸的數據分組的形式。系統1100包括可用於便於在客戶機1102和伺服器1104之間通信的通信框架1106。客戶機1102操作上連接至可用於儲存對客戶機1102本地的信息的一個或多個客戶機數據存儲1108。類似地,伺服器1104操作上連接至可用於儲存對伺服器1104本地的信息的一個或多個伺服器數據存儲1110。
在本發明的一種情況中,數據分組在兩個或者多個幫助網絡瀏覽的計算機組件之間發射,數據分組包括,至少部分和使用至少部分用於網絡瀏覽的分布式系統的網絡瀏覽相關的信息。
在本發明的另一種情況中,計算機可讀媒質保存用於幫助網絡瀏覽的的系統的計算機可執行組件,其包括至少部分,用於確定至少部分由用於網絡瀏覽的分布式系統編譯的維持用於web頁的信息的網絡瀏覽系統。
需要理解本發明的系統以及/或者方法可被用在幫助計算機組件和類似的與計算機無關的組件的網絡瀏覽系統中。此外,熟悉本領域的技術人員會認識到本發明的系統以及/或者方法可被用在多種和電子相關的技術中,包括但不限於,計算機、伺服器以及/或者手持電子設備以及類似的有線以及/或者無線等等的設備。
熟悉本領域的技術人員還將認識到本發明不僅可用於基於伺服器到客戶機的瀏覽系統,還可以用於對等的瀏覽系統。客戶機執行一般和「伺服器」行為相關聯的任務也是可能的,且因此在本發明的一些情況中將一些和伺服器相關聯的特徵轉換到客戶機上。本發明的這種情況的一個示例是執行至其他的客戶機的「子瀏覽」以確定以及/或者導出信息並發送給伺服器的客戶機。這種情況可能是有益的,例如,在某個客戶機可伺服器之間存在瓶頸的網絡中。數據可使用至伺服器的最佳接入被傳送到伺服器。在本發明的另一個情況中,客戶機可通過起始內聯網系統中的子瀏覽來展現伺服器的行為,因此可僅僅從單個以及/或者呈現在內聯網中數量明顯減少的客戶機中報告信息至伺服器。在這種方式下,搜索伺服器可在客戶機中起始多個子瀏覽以擴展其瀏覽資源。
上文所描述的包括本發明的示例。當然,不可能為了描述本發明而描述組件或方法的每一可想像的組合,但是本領域的普通技術人員可以認識到,本發明的許多另外的組合和置換是可能的。因此,本發明旨在包含落入所附權利要求書的精神和範圍中的所有這樣的改變、修改和變化。此外,在術語「包括」用於詳細描述和權利要求書的意義上,這類術語旨在以與術語「包含」用作權利要求書中的過渡詞語所解釋的類似的方式為包含性的。
權利要求
1.一種幫助輔助表格填充的系統,包括控制組件,接收未標記的文本輸入信息;解析組件,至少部分基於未標記的文本信息填充表格的子集;以及顯示組件,顯示未標記的文本信息和填充的表格。
2.如權利要求1所述的系統,所述解析組件包括一人工智慧(AI)組件,作出關於至少部分基於未標記的文本信息填充表格的推斷。
3.如權利要求2所述的系統,所述AI組件使用隱性馬爾可夫模型(HMM)來確定表格中所解析的文本信息可被輸入的正確的欄位。
4.如權利要求1所述的系統,所述顯示組件使用色彩來表示至少一個所解析的未標記的文本元素和表格中至少一個的欄位的兼容性。
5.如權利要求1所述的系統,還包括至少一個狀態指示符,表示和表格中至少一個所填充的欄位相關聯的狀態等級。
6.如權利要求5所述的系統,所述至少一個狀態指示符是按照表示至少一個表格中的所填充的欄位的狀態等級的色彩編碼而彩色化。
7.一種用於輔助表格填充的方法,包括接收未標記的媒質;解析未標記的媒質以識別元素;自動用所識別的元素填充表格;以及向用戶顯示未標記的媒質並所填充表格。
8.如權利要求7所述的方法,還包括使用色彩來表示所識別的元素是與表格中的特定欄位兼容的。
9.如權利要求7所述的方法,還包括使用至少一個隱性馬爾可夫模型(HMM)來確定所識別的元素可被輸入的合適的欄位。
10.如權利要求7所述的方法,還包括表示和至少一個欄位中的一個元素相關聯的狀態等級。
11.如權利要求11所述的方法,還包括如果和該至少一個欄位中的至少一個元素相關聯的狀態等級低於希望的等級,提示用戶驗證以及/或者校正至少一個欄位中的至少一個元素。
12.如權利要求11所述的方法,還包括按照用戶驗證以及/或者對於至少一個欄位中的至少一個元素的校正來更新所填充的表格。
13.如權利要求12所述的方法,還包括至少部分基於用戶驗證以及/或者對於至少一個元素的校正而升級和至少一個元素相關的狀態等級。
14.如權利要求11所述的方法,還包括使用不同的色彩表示狀態的不同等級。
15.如權利要求7所述的方法,還包括如果所有欄位中的所有元素的可信度等級高於希望的可信度閥值,存儲所述填充的表格至數據存儲器。
16.一種用戶輔助用戶填充表格的方法,包括讀取未標記的媒質至未標記的媒質存儲器中;讀取側信息至側信息存儲器中;解析未標記的媒質以識別用於填充表格的元素;寫入所識別的元素至表格數據存儲器;以及在表格圖形用戶接口的欄位中顯示所識別的元素。
17.如權利要求16所述的方法,還包括在未標記的媒質圖形用戶接口中顯示具有視覺指示符的未標記的媒質。
18.如權利要求17所述的方法,其特徵在於所述視覺指示符是指示至少一個所識別的元件和至少一個表格中的欄位的兼容性的色彩。
19.如權利要求16所述的方法,還包括指示和填充一給定的欄位的元素相關聯的可信度等級。
20.如權利要求19所述的方法,其特徵在於不同的狀態等級由不同的色彩指示。
21.如權利要求19所述的方法,還包括如果欄位包含至少一個錯誤,允許用戶校正表格中的至少一個欄位。
22.如權利要求21所述的方法,還包括附加從表格中的至少一個欄位的校正中採集的信息至側信息存儲器。
23.如權利要求22所述的方法,還包括在附加從至少一個欄位的校正中採集的信息之後重新解析未標記的媒質以傳播對於至少一個欄位的校正至至少一個其他欄位。
24.如權利要求16所述的方法,還包括允許用戶驗證在至少一個欄位中的至少一個元素是正確的。
25.如權利要求24所述的方法,還包括將表格中的至少一個欄位的驗證中採集的信息添加到側信息存儲器。
26.如權利要求25所述的方法,還包括在添加至少一個欄位的驗證中採集的信息之後重新解析未標記的媒質以傳播至少一個欄位的校正至至少一個其他欄位。
27.如權利要求16所述的方法,還包括如果沒有錯誤在表格中呈現,將表格數據存儲器的內容寫入到文件中。
28.一種在表格填寫中減少錯誤和所需時間的系統,包括用於接收未標記媒質輸入的裝置;用於解析未標記媒質的裝置;用於使用所解析的未標記位置填充表格的裝置;以及用戶並發顯示未標記的媒質和被填充的表格的裝置。
29.如權利要求28所述的系統,還包括用於指示和所填充的表格中的至少一個欄位相關的狀態等級。
30.如權利要求28所述的系統,還包括用於校正以及/或者驗證所填充的表格中至少一個欄位的裝置。
31.如權利要求28所述的系統,還包括用戶指示所解析的未標記的媒質元素和表格中的欄位之間的兼容性的裝置。
32.一種計算機可讀媒質,存儲有計算機可讀指令,用於接收未標記的媒質;解析未標記的媒質以識別元素;用所識別的元素填充表格中的欄位;指示與表格中所填充的欄位相關聯的狀態;以及允許對所填充的表格中的欄位中的元素進行校正以及/或者驗證。
全文摘要
揭示了幫助輔助用戶填充表格的系統和方法。本發明可解析未標記的媒質,例如email等等,以識別可被用於填充表格的元素。所識別的元素可被自動插入到表格中對應的欄位中,且狀態指示符可與之相關聯並向用戶指示以警告用戶需要對表格中特定的欄位進行審閱。此外,未標記的媒質和表格可被並發地呈現給用戶以幫助用戶在輔助表格填充期間進行監督以及/或者互動。
文檔編號G06F12/00GK1664810SQ20051005317
公開日2005年9月7日 申請日期2005年3月3日 優先權日2004年3月3日
發明者T·T·克裡斯蒂安松 申請人:微軟公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀