新四季網

一種從文本中提取物品信息的方法和裝置製造方法

2023-05-03 14:20:16

一種從文本中提取物品信息的方法和裝置製造方法
【專利摘要】本發明公開了一種從文本中提取物品信息的方法和裝置。該方法,包括:讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據;在物品信息列表中查找信息條目;將查找成功的信息條目對應的信息數據添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目並將對應的信息數據添加到物品信息列表。通過預設的信息提取策略從文本中獲取物品信息的相關內容,再在物品信息列表中查找信息,將相關內容直接添加或新建信息條目後添加,實現了物品信息的大數據快速收集保存。
【專利說明】一種從文本中提取物品信息的方法和裝置

【技術領域】
[0001]本發明涉及數據處理領域,尤其涉及一種從文本中提取物品信息的方法和裝置。

【背景技術】
[0002]當前,電子商務快速發展,產品經濟日趨繁榮,為廣大消費者提供了更多消費途徑的同時,也為電子商務網站為海量物品的信息處理提出了越來越高的要求。
[0003]在大量的物品信息的編輯過成中,如果全部靠人工對物品網頁對產品進行信息管理,需要投入龐大的人力和勞動時間,需要一種快速的數據處理方式對大量的物品信息進行快速處理。


【發明內容】

[0004]本發明提供了一種從文本中提取物品信息的方法和裝置,該方法通過預設的信息提取策略從文本中獲取物品彳目息的相關內容,再在物品彳目息列表中查找信息,將相關內容直接添加或新建信息條目後添加,實現了物品信息的大數據快速收集保存。
[0005]為達此目的,本發明採用以下技術方案:
[0006]一方面提供一種從文本中提取物品信息的方法,包括:
[0007]讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據;
[0008]在物品信息列表中查找信息條目;
[0009]將查找成功的信息條目對應的信息數據添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目並將對應的信息數據添加到物品信息列表。
[0010]其中,所述物品為電子商務中的物品。
[0011]其中,所述信息條目包括物品的品牌、型號和價格。
[0012]其中,還包括:
[0013]當提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應的信息數據。
[0014]其中,所述信息條目還包括添加時間;
[0015]所述讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據,具體為:
[0016]讀取文本中攜帶的文字內容並記錄讀取的時間作為添加時間,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據。
[0017]另一方面提供一種從文本中提取物品信息的裝置,包括:
[0018]文本內容讀取模塊,用於讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據;
[0019]信息條目查找模塊,用於在物品信息列表中查找信息條目;
[0020]信息數據添加模塊,用於將查找成功的信息條目對應的信息數據添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目並將對應的信息數據添加到物品信息列表。
[0021]其中,所述物品為電子商務中的物品。
[0022]其中,所述信息條目包括物品的品牌、型號和價格。
[0023]其中,還包括:
[0024]信息數據刪除模塊,用於當提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應的信息數據。
[0025]其中,所述信息條目還包括添加時間;
[0026]所述文本內容讀取模塊,具體用於:
[0027]讀取文本中攜帶的文字內容並記錄讀取的時間作為添加時間,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據。
[0028]本發明的有益效果為:通過預設的信息提取策略從文本中獲取物品信息的相關內容,再在物品信息列表中查找信息,將相關內容直接添加或新建信息條目後添加,實現了物品信息的大數據快速收集保存。

【專利附圖】

【附圖說明】
[0029]為了更清楚地說明本發明實施例中的技術方案,下面將對本發明實施例描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據本發明實施例的內容和這些附圖獲得其他的附圖。
[0030]圖1是本發明【具體實施方式】中提供的一種從文本中提取物品信息的方法的第一實施例的方法流程圖。
[0031]圖2是本發明【具體實施方式】中提供的一種從文本中提取物品信息的方法的第二實施例的方法流程圖。
[0032]圖3是本發明【具體實施方式】中提供的一種從文本中提取物品信息的裝置的第一實施例的結構方框圖。
[0033]圖4是本發明【具體實施方式】中提供的一種從文本中提取物品信息的裝置的第二實施例的結構方框圖。

【具體實施方式】
[0034]為使本發明解決的技術問題、採用的技術方案和達到的技術效果更加清楚,下面將結合附圖對本發明實施例的技術方案作進一步的詳細描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
[0035]請參考圖1,其是本發明【具體實施方式】中提供的一種從文本中提取物品信息的方法的第一實施例的方法流程圖。本發明中的從文本中提取物品信息的方法主要用於對物品信息進行自動收集,實現大數據的快速處理。如圖所示,該方法包括:
[0036]步驟3101:讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據。
[0037]當前許多電子商務網站都是通過多個供貨商提供各種物品,在通知供貨商供貨時準備好各種物品的相關物品信息,對於電子商務網站而言只需要將收到的物品信息集中處理即可,而對於供貨商,所有的物品信息在生產過程中已經準備好,所需要做的僅僅是將需要的物品信息進行篩選提供即可。所以整個過程中,沒有增加供貨商的負擔,電子商務網站也不需要重新對物品信息,特別是大數據的物品信息進行處理。
[0038]步驟S102:在物品信息列表中查找信息條目。
[0039]預先已經設計好物品信息列表,在對物品信息進行處理時,直接根據提取到的信息條目進行查詢,對應填入即可。
[0040]步驟S103:將查找成功的信息條目對應的信息數據添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目並將對應的信息數據添加到物品信息列表。
[0041]對於物品信息列表中已經存在的條目,查找到之後直接信息數據對應填入即可;而對於物品信息列表中尚未存在的信息條目,則在物品信息列表中增加新的信息條目,將對應的信息數據添加到新增的信息條目。
[0042]綜上所述,通過預設的信息提取策略從文本中獲取物品信息的相關內容,再在物品信息列表中查找信息,將相關內容直接添加或新建信息條目後添加,實現了物品信息的大數據快速收集保存。
[0043]請參考圖2,其是本發明【具體實施方式】中提供的一種從文本中提取物品信息的方法的第二實施例的方法流程圖。如圖所示,該方法包括:
[0044]步驟S201:讀取文本中攜帶的文字內容並記錄讀取的時間作為添加時間,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據。
[0045]所述物品為電子商務中的物品。例如用於出售的某種手機。所述信息條目包括物品的品牌、型號和價格。例如A品牌的B型號的手機,價格為C元。
[0046]為了實現對物品信息的變化過程的記錄,在實際記錄過程中物品信息的添加時間,以實現對歷史物品信息的跟蹤。
[0047]在物品信息列表中,還可以為物品設置物品編號的信息條目,每一個新的物品賦予一個獨一無二的編號。
[0048]步驟S202:在物品信息列表中查找信息條目。
[0049]物品信息列表的處理過程可以視為對資料庫或表格的處理過程,在此不做進一步說明。
[0050]步驟S203:將查找成功的信息條目對應的信息數據添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目並將對應的信息數據添加到物品信息列表。
[0051]步驟S204:當提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應的信息數據。
[0052]為了使得物品信息列表中保存物品信息處於最新更新狀態,將之前更新的物品信息予以刪除,當然,這只是一種優選的方式,也可以將所有的物品信息保存,從而方便對某一物品的信息變化過程進行全面統計和分析。對應的,對於同一物品的物品信息的添加,可以不用更改物品編號,這裡所說的物品信息是指具有相同的物理特徵的物品,例如同一品牌、同一型號和同一配置的手機。
[0053]在實際的物品信息列表的使用過程中,也可建立物品信息列表與物品的網頁之間的關聯,物品信息列表之中的數據跟新之後,直接對應網頁中的物品信息進行更新,快速在後臺進行物品展示的相關工作。
[0054]綜上所述,通過預設的信息提取策略從文本中獲取物品信息的相關內容,再在物品信息列表中查找信息,將相關內容直接添加或新建信息條目後添加,實現了物品信息的大數據快速收集保存。同時,對物品信息的刪除也能減少物品信息列表中的冗餘數據。
[0055]以下是本發明一種從文本中提取物品信息的裝置的實施例,裝置的實施例基於上述的方法的實施例實現,在裝置的實施例中未盡的描述,請參考上述方法的實施例。
[0056]請參考圖3,其是本發明一種從文本中提取物品信息的裝置的第一實施例的結構方框圖。如圖所示,該裝置包括:
[0057]文本內容讀取模塊310,用於讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據;
[0058]信息條目查找模塊320,用於在物品信息列表中查找信息條目;
[0059]信息數據添加模塊330,用於將查找成功的信息條目對應的信息數據添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目並將對應的信息數據添加到物品信息列表。
[0060]綜上所述,在上述個模塊的協同工作下,通過預設的信息提取策略從文本中獲取物品信息的相關內容,再在物品信息列表中查找信息,將相關內容直接添加或新建信息條目後添加,實現了物品信息的大數據快速收集保存。
[0061]請參考圖4,其是本發明一種從文本中提取物品信息的裝置的第二實施例的結構方框圖。如圖所示,該裝置包括:
[0062]文本內容讀取模塊310,用於讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據;
[0063]信息條目查找模塊320,用於在物品信息列表中查找信息條目;
[0064]信息數據添加模塊330,用於將查找成功的信息條目對應的信息數據添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目並將對應的信息數據添加到物品信息列表。
[0065]其中,所述物品為電子商務中的物品。
[0066]其中,所述信息條目包括物品的品牌、型號和價格。
[0067]其中,還包括:
[0068]信息數據刪除模塊340,用於當提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應的信息數據。
[0069]其中,所述信息條目還包括添加時間;
[0070]所述文本內容讀取模塊310,具體用於:
[0071]讀取文本中攜帶的文字內容並記錄讀取的時間作為添加時間,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據。
[0072]綜上所述,通過上述模塊的協同工作,通過預設的信息提取策略從文本中獲取物品信息的相關內容,再在物品信息列表中查找信息,將相關內容直接添加或新建信息條目後添加,實現了物品信息的大數據快速收集保存。同時,對物品信息的刪除也能減少物品信息列表中的冗餘數據。
[0073]以上結合具體實施例描述了本發明的技術原理。這些描述只是為了解釋本發明的原理,而不能以任何方式解釋為對本發明保護範圍的限制。基於此處的解釋,本領域的技術人員不需要付出創造性的勞動即可聯想到本發明的其它【具體實施方式】,這些方式都將落入本發明的保護範圍之內。
【權利要求】
1.一種從文本中提取物品信息的方法,其特徵在於,包括: 讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據; 在物品信息列表中查找信息條目; 將查找成功的信息條目對應的信息數據添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目並將對應的信息數據添加到物品信息列表。
2.根據權利要求1所述的一種從文本中提取物品信息的方法,其特徵在於,所述物品為電子商務中的物品。
3.根據權利要求2所述的一種從文本中提取物品信息的方法,其特徵在於,所述信息條目包括物品的品牌、型號和價格。
4.根據權利要求3所述的一種從文本中提取物品信息的方法,其特徵在於,還包括: 當提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應的信息數據。
5.根據權利要求1所述的一種從文本中提取物品信息的方法,其特徵在於,所述信息條目還包括添加時間; 所述讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據,具體為: 讀取文本中攜帶的文字內容並記錄讀取的時間作為添加時間,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據。
6.一種從文本中提取物品信息的裝置,其特徵在於,包括: 文本內容讀取模塊,用於讀取文本中攜帶的文字內容,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據; 信息條目查找模塊,用於在物品信息列表中查找信息條目; 信息數據添加模塊,用於將查找成功的信息條目對應的信息數據添加到物品信息列表;在物品信息列表中添加查找失敗的信息條目並將對應的信息數據添加到物品信息列表。
7.根據權利要求6所述的一種從文本中提取物品信息的裝置,其特徵在於,所述物品為電子商務中的物品。
8.根據權利要求7所述的一種從文本中提取物品信息的裝置,其特徵在於,所述信息條目包括物品的品牌、型號和價格。
9.根據權利要求8所述的一種從文本中提取物品信息的裝置,其特徵在於,還包括: 信息數據刪除模塊,用於當提取到的物品的品牌和型號與物品信息列表中的品牌和型號相同時,刪除物品信息列表中的該品牌與型號對應的信息數據。
10.根據權利要求6所述的一種從文本中提取物品信息的裝置,其特徵在於,所述信息條目還包括添加時間; 所述文本內容讀取模塊,具體用於: 讀取文本中攜帶的文字內容並記錄讀取的時間作為添加時間,根據預設的信息提取策略從所述文字內容中提取物品的至少一個信息條目及對應的信息數據。
【文檔編號】G06Q30/02GK104375985SQ201410687153
【公開日】2015年2月25日 申請日期:2014年11月25日 優先權日:2014年11月25日
【發明者】楊明坤 申請人:蘇州迪雲信息科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀