新四季網

一種通過智能分析電商評論辨別所售物品優劣的方法

2024-04-15 19:21:05



1.本發明涉及信息技術領域,尤其涉及一種通過智能分析電商評論辨別所售物品優劣的方法。


背景技術:

2.隨著電子商務的蓬勃發展,線上購物成為了人們的生活必需品,通常人們在選擇商品時或多或少都會查看商品的買家評論,以此作為選擇的判斷依據之一,因此評論的真實度以及評論角度和質量成為了評論的重要參數;有一部分不良商家通過購買水軍用戶刷好評來為自己的商品提升好評率,以此迷惑用戶的選擇,目前電商平臺通常採用較為簡單的文本分析方法鑑別此類評論,然而水軍用戶可能採取質量較高的評論模板進行刷好評行為,目前尚還沒有較好的方法能較精準地識別所述刷好評的行為;目前電商平臺所採用的一般都是對文本直接顯示的評論方法,需要用戶逐字逐句進行解讀;此外,不同用戶在購物時花在看評論所側重的商品屬性各不相同,有些用戶習慣瀏覽有關商品外觀的評論,有些用戶習慣瀏覽有關商品實際的使用體驗,如電子商品的續航時間,因此,電商平臺需要一個基於用戶閱讀評論的商品屬性偏好的個性化評論推送方法;另外,用戶花費在瀏覽商品評論的時間也是各不相同,有些用戶花費的時間多,希望看到詳盡的評論,有些用戶花費的時間少,希望看到的是簡短的評論,目前尚還沒有根據用戶花費在瀏覽商品評論的時間所推送評論的方法。


技術實現要素:

3.本發明提供了一種通過智能分析電商評論辨別所售物品優劣的方法,主要包括:
4.根據評論的真實度篩選出真實的評論,所述根據評論的真實度篩選出真實的評論,具體包括:獲取用戶的購物次數和好評次數並計算好評率,根據用戶的好評率計算評論的真實度並篩選評論;獲取描述商品屬性的文本並以此構建關於商品屬性的樹形圖,所述獲取描述商品屬性的文本並以此構建關於商品屬性的樹形圖,具體包括:構建目標商品的商品屬性的框架圖,獲取評論對應的樹形圖;優化評論對應的樹形圖,所述優化評論對應的樹形圖,具體包括:檢測描述商品屬性的文本是否存在矛盾,對存在矛盾的樹形圖進行優化顯示;根據樹形圖判斷評論的質量,具體包括:根據評論的質量劃分等級;獲取用戶閱讀評論的商品屬性偏好及平均閱讀評論時長;個性化推送評論給用戶,所述個性化推送評論給用戶,具體包括:根據用戶的偏好和評論的質量篩選評論,根據用戶的平均閱讀時長推送評論。
5.進一步可選地,所述根據評論的真實度篩選出真實的評論包括:
6.構建用戶的信息系統,在用戶本人授權同意的情況下,通過平臺獲取用戶的購物信息,包括購物記錄和好評記錄;根據用戶的評論次數和好評次數計算該用戶的好評率並判斷評論的真實性;包括:獲取用戶的購物次數和好評次數並計算好評率;根據用戶的好評率計算評論的真實度並篩選評論;
7.所述獲取用戶的購物次數和好評次數並計算好評率,具體包括:
8.在得到用戶授權的前提下,通過購物平臺獲取用戶的購物記錄和好評記錄,計算出用戶的購物次數和好評次數。將用戶的好評次數除以購物次數,得到該用戶購物好評率。
9.所述根據用戶的好評率計算評論的真實度並篩選評論,具體包括:
10.通過購物平臺獲取商品的評論區中的所有評論,計算其中好評的佔比,並且將計算得到的好評佔比設置為好評率閾值c。將計算出來的用戶好評率的一半與預設的好評率閾值相比較;若用戶好評率的一半大於預設的好評率閾值c,則認為該用戶評論的真實度不足;若用戶好評率的一半小於預設的好評率閾值c,則認為該用戶的評論真實。逐一獲取評論區內所有用戶的購物信息,分別計算每一個用戶的購物好評率,並分別將計算得到的每一個用戶的購物好評率與預設的好評率閾值c相比較,得到每一位用戶的評論真實度。根據獲得的用戶的評論真實度篩選評論,若計算得到用戶評論的真實度不足,則濾除掉該用戶的評論,若計算得到擁護評論的真實度充足,則保留該用戶的評論。
11.進一步可選地,所述獲取描述商品屬性的文本並以此構建關於商品屬性的樹形圖包括:
12.獲取商品的商品屬性,根據商品屬性的具體程度對商品屬性賦予不同的層級;將不同層級的商品屬性按照一定的規則排列,構建出目標商品的商品屬性的框架圖;通過基於機器學習的分詞方式將評論中的詞語提取出來,逐一將每一條評論中被提取出來的詞語與構建起來的商品屬性的框架圖進行匹配,若匹配成功,則將該詞語填入與其匹配的框架中,若匹配不成功,則丟棄該詞語,以此得到每一條真實的評論的關於商品屬性的樹形圖;包括:構建目標商品的商品屬性的框架圖;獲取評論對應的樹形圖;
13.所述構建目標商品的商品屬性的框架圖,具體包括:
14.在得到商家的授權後,通過購物平臺獲取目標商品的商品屬性,在漢語詞語庫中分別對商品屬性進行相關詞語檢索,得到各個商品屬性的相關詞語集合,構建起目標商品的商品屬性的資料庫。根據商品屬性的相關詞語的數量判斷各個商品屬性的具體程度,相關詞語的數量越多,商品屬性的具體程度越低。根據商品屬性的具體程度對商品屬性賦予相對應的層級,具體程度低的商品屬性賦予高層級,具體程度高的商品屬性賦予低層級。根據各個商品屬性的層級的高低構建目標商品的商品屬性的框架圖。
15.所述獲取評論對應的樹形圖,具體包括:
16.根據所得的商品屬性的框架圖,基於機器學習的分詞方式對評論進行分詞處理,並將詞語提取出來。將提取出來的詞語與商品屬性進行匹配,即將提取出來的詞語輸入到商品屬性的資料庫中,在商品屬性的相關詞語集合中進行搜索,若該詞語在商品屬性的相關詞語集合中,則認為詞語與商品屬性相匹配,將該詞語填入與其相匹配的商品屬性中;若詞語不在商品屬性的相關詞語集合中,則認為與商品屬性不匹配,並且丟棄該詞語。逐一將每一條評論提取出來的詞語與框架圖中的商品屬性進行匹配並根據匹配結果填入或丟棄詞語,最終分別得到每一條評論對應的樹形圖。
17.進一步可選地,所述優化評論對應的樹形圖包括:
18.對獲得的樹形圖顯示出來的文本內容進行是否存在矛盾的分析,即檢測填入框架圖中的詞語之間是否滿足反義詞或否定詞關係,若滿足,則判定為存在矛盾,若不滿足,則判定為不存在矛盾;若樹形圖中的文本存在矛盾,則將有矛盾的文本標記出來,若不存在矛
盾,則無需進行處理;對存在矛盾的文本採取摺疊不顯示的處理,而不存在矛盾的文本則會將其顯示出來;包括:檢測描述商品屬性的文本是否存在矛盾;對存在矛盾的樹形圖進行優化顯示;
19.所述檢測描述商品屬性的文本是否存在矛盾,具體包括:
20.首先,要檢測樹形圖中的每一個商品屬性匹配成功的詞語的個數,若詞語個數大於1,則認為有相互矛盾的可能,並將詞語提取出來,將提取出來的詞語進行兩兩遍歷,然後檢測兩兩遍歷得到的詞語之間是否滿足反義詞或否定詞關係,若滿足,則標記為存在矛盾,若不滿足,則不做標記;若詞語個數小於或等於1,則認為無相互矛盾的可能,不需要進行處理。
21.所述對存在矛盾的樹形圖進行優化顯示,具體包括:
22.根據所做的標記找到描述商品屬性的詞語相互矛盾的樹形圖,將具體的矛盾內容與其對應的樹形圖一一匹配起來。根據標記在樹形圖描述商品屬性的文本中找出其矛盾的具體內容,並將具有矛盾的文本摺疊起來,而不具矛盾的文本則展開顯示。
23.進一步可選地,所述根據樹形圖判斷評論的質量包括:
24.對樹形圖中不同層級的各個分支節點賦予不同的權重,相同的層級中各個分支節點的權重相同,不同層級的分支節點的權重不同,並且層級越高,即越是處於樹形圖中的上層,其權重就越低;每個分支節點中的文本內容是否為空白或者是否發生摺疊決定了分支節點與權重相乘的係數;若分支節點中的內容為空白或發生了摺疊,則該分支節點與權重相乘的係數為0;若分支節點中的內容不為空白且被展開顯示,則該分支節點與權重相乘的係數為1;最後,將樹形圖中的每一個分支節點的係數與其對應的權重相乘,並將所得結果累加起來得到的數值即為樹形圖對應的評論的質量,所得的數值越大,評論的質量越好;包括:根據評論的質量劃分等級;
25.所述根據評論的質量劃分等級,具體包括:
26.若樹形圖中的所有節點都不是空白並且都展開顯示,計算出該樹形圖的對應的評論的質量q,設定q為評論區內評論質量的最大值。根據q值劃分質量等級,0到q/3為低質量等級,q/3到2*q/3為中質量等級,2*q/3到q為高質量等級。逐一計算每個評論的質量並且根據計算出來的質量按照劃分好的等級對每個評論進行質量等級的劃分。
27.進一步可選地,所述獲取用戶閱讀評論的商品屬性偏好及平均閱讀評論時長包括:
28.在獲得用戶授權的前提下,通過購物平臺獲取用戶讀評論的時間以及評論的內容;將用戶讀評論的時間相加然後除以用戶讀評論的個數,得到用戶的平均讀評論時長;篩選出用戶讀取過的評論中被用戶點讚的評論,篩選出每一條評論中描述商品屬性的關鍵詞,並將所有評論中描述商品屬性的關鍵詞集中起來,然後分別統計每一個關鍵詞出現的次數;對關鍵詞出現的次數求和,然後除以關鍵詞的個數,得到一個閾值d,將每一個關鍵詞出現的次數與閾值d相比較,若關鍵詞出現的次數大於或等於閾值d,則認為用戶比較在意該關鍵詞,將該關鍵詞作為用戶喜好的內容標記起來;若關鍵詞出現的次數小於閾值d,則認為用戶不關心該關鍵詞,不需要標記該關鍵詞;記錄被標記的關鍵詞並將其記為用戶閱讀評論的商品屬性偏好。
29.進一步可選地,所述個性化推送評論給用戶包括:
30.根據用戶閱讀評論的商品屬性偏好篩選具有與之相似的商品屬性的評論;對篩選得出的評論,根據用戶平均閱讀評論時長,針對質量等級採取進一步篩選;對篩選得出的評論進行其樹形圖的獲取,根據用戶平均閱讀評論時長,對描述的商品屬性的層級過高的文本,採取摺疊不顯示的處理;將最終得出的評論的樹形圖推送給用戶;包括:根據用戶的偏好和評論的質量篩選評論;根據用戶的平均閱讀時長推送評論;
31.所述根據用戶的偏好和評論的質量篩選評論,具體包括:
32.利用獲得的代表用戶對商品屬性的偏好的關鍵詞篩選出用戶可能感興趣的評論。在評論區的每一條評論中對代表用戶商品屬性偏好的關鍵詞進行搜索,若評論中存在代表用戶商品屬性偏好的關鍵詞,則認為該評論符合用戶的偏好,將該評論保留下來;若評論中不存在代表用戶商品屬性偏好的關鍵詞,則認為該評論不符合用戶的偏好,將該評論濾除。根據所得的評論質量等級進一步篩選出符合用戶要求的評論,逐一獲取評論區中經過篩選後的評論的質量等級,並且將其中中質量等級和高質量等級的評論保留下來,將低質量等級的評論濾除掉。
33.所述根據用戶的平均閱讀時長推送評論,具體包括:
34.預設一個時間閾值s,根據用戶的平均閱讀時長和時間閾值s的比較結果將用戶分為c,d兩類。若用戶的平均閱讀時長大於或等於時間閾值s,則將用戶歸為c類;若用戶的平均閱讀時長小於時間閾值s,則將用戶歸為d類。根據用戶的類別將符合用戶偏好的評論對應的樹形圖推送給用戶。對於c類用戶,直接將樹形圖的所有分支節點展開顯示,不需要進行摺疊;對於d類用戶,需要對樹形圖中層級高的分支節點進行摺疊,然後再將摺疊後的樹形圖推送給用戶。
35.本發明實施例提供的技術方案可以包括以下有益效果:
36.本方法通過追溯評論的用戶的購物好評率,篩除刷好評的不客觀的評論行為;通過對評論文本所描述的商品屬性的層級分級,構建評論的樹形圖,對文字評論進行圖形可視化,利用樹形圖對用戶呈現評論;檢測互相矛盾的文本,對該類文本進行摺疊不予展示,以免對用戶進行誤導;此外,根據評論文本的出現次數和所描述的商品屬性的層級計算評論的質量值,根據質量值劃分質量等級,從而根據用戶的閱讀評論的商品屬性偏好和閱讀評論的時長,選擇不同質量等級以及含有用戶感興趣的商品屬性的評論進行推送,摺疊對於個別用戶過於詳盡的評論文本,實現對用戶個性化的評論推送。
附圖說明
37.圖1為本發明的一種通過智能分析電商評論辨別所售物品優劣的方法的流程圖。
38.圖2為本發明的一種通過智能分析電商評論辨別所售物品優劣的方法的示意圖。
具體實施方式
39.為了使本發明的目的、技術方案和優點更加清楚,下面結合附圖和具體實施例對本發明進行詳細描述。
40.圖1為本發明的一種通過智能分析電商評論辨別所售物品優劣的方法流程圖。如圖1所示,本實施例一種通過智能分析電商評論辨別所售物品優劣的方法具體可以包括:
41.步驟101,根據評論的真實度篩選出真實的評論。
42.構建用戶的信息系統,在用戶本人授權同意的情況下,通過平臺獲取用戶的購物信息,包括購物記錄和好評記錄。根據用戶的評論次數和好評次數計算該用戶的好評率並判斷評論的真實性。如果要判斷評論的真實性,可以通過獲取評論用戶的歷史評論記錄,計算出其好評率,通過好評率來判別,若好評率接近正常值則說明評論具有較高的真實性,若好評率過高,則有較大的刷好評的概率,對於此類評論,應濾除掉。
43.獲取用戶的購物次數和好評次數並計算好評率。
44.在得到用戶授權的前提下,通過購物平臺獲取用戶的購物記錄和好評記錄,計算出用戶的購物次數和好評次數。將用戶的好評次數除以購物次數,得到該用戶購物好評率。用戶的購物信息屬於用戶個人的隱私,需要使用同態加密法對用戶的購物信息進行保護,避免用戶的購物信息在傳輸過程中發生丟失而導致洩露用戶信息。例如:d為明文,d為密文,明文為要獲得的內容,密文為傳輸的內容,並且明文與密文之間的函數關係為f(d)=d,f(d)=d,即f為加密函數,f為解密函數;工作時發送端將密文f發送給接收端,接收端通過解密函數f對得到的密文進行解密得到所需的明文f。在得到用戶的授權之後,將通過某個購物平臺得到的某一個用戶a的購物信息的密文解密得到該用戶的購物次數為100次,好評次數為85次;同樣,另一個用戶b的購物信息的密文通過解密得到該用戶的購物次數為100次,好評次數為45次。那麼,可以通過計算得到用戶a的好評率為80%,用戶b的好評率為45%。
45.根據用戶的好評率計算評論的真實度並篩選評論。
46.通過購物平臺獲取商品的評論區中的所有評論,計算其中好評的佔比,並且將計算得到的好評佔比設置為好評率閾值c。將計算出來的用戶好評率的一半與預設的好評率閾值相比較;若用戶好評率的一半大於預設的好評率閾值c,則認為該用戶評論的真實度不足;若用戶好評率的一半小於預設的好評率閾值c,則認為該用戶的評論真實。逐一獲取評論區內所有用戶的購物信息,分別計算每一個用戶的購物好評率,並分別將計算得到的每一個用戶的購物好評率與預設的好評率閾值c相比較,得到每一位用戶的評論真實度。根據獲得的用戶的評論真實度篩選評論,若計算得到用戶評論的真實度不足,則濾除掉該用戶的評論,若計算得到擁護評論的真實度充足,則保留該用戶的評論。例如:通過購物平臺獲取某一個商品的評論信息並且計算得到其中的好評佔比為50%,則設置好評率閾值c為50%,若通過獲取用戶信息後計算得到用戶好評率分別為:用戶a的好評率為80%,用戶b的好評率為45%。那麼通過分別將用戶a和用戶b的好評率與預設好評率c進行比較可以得到的結果為:用戶a的好評率過高,其評論的真實度不足,該評論被濾除;用戶b的好評率正常,其評論的真實度充足,該評論被保留。
47.步驟102,獲取描述商品屬性的文本並以此構建關於商品屬性的樹形圖。
48.獲取商品的商品屬性,根據商品屬性的具體程度對商品屬性賦予不同的層級。將不同層級的商品屬性按照一定的規則排列,構建出目標商品的商品屬性的框架圖。通過基於機器學習的分詞方式將評論中的詞語提取出來,逐一將每一條評論中被提取出來的詞語與構建起來的商品屬性的框架圖進行匹配,若匹配成功,則將該詞語填入與其匹配的框架中,若匹配不成功,則丟棄該詞語,以此得到每一條真實的評論的關於商品屬性的樹形圖。由於評論中的評價都是對目標商品的商品屬性的評價,所以可以先獲取目標商品的商品屬性,根據具體程度將商品屬性分成不同的層級,再根據層級對商品屬性進行排列,得到目標
商品的框架圖。然後,對評論進行分詞處理並將詞語提取出來,將與商品屬性匹配的詞語填入到框架圖中,全部填入完成後可以得到每一個評論對應的樹形圖。
49.構建目標商品的商品屬性的框架圖。
50.在得到商家的授權後,通過購物平臺獲取目標商品的商品屬性,在漢語詞語庫中分別對商品屬性進行相關詞語檢索,得到各個商品屬性的相關詞語集合,構建起目標商品的商品屬性的資料庫。根據商品屬性的相關詞語的數量判斷各個商品屬性的具體程度,相關詞語的數量越多,商品屬性的具體程度越低。根據商品屬性的具體程度對商品屬性賦予相對應的層級,具體程度低的商品屬性賦予高層級,具體程度高的商品屬性賦予低層級。根據各個商品屬性的層級的高低構建目標商品的商品屬性的框架圖。由於一個詞語越一般,越廣泛化,可以與該詞語聯繫的詞語就越多,該詞語的具體程度就越低;相反,若一個詞語越具體,越細化,可以與該詞語聯繫的詞語就越少,該詞語就越具體,詞語的具體程度就越高,故對具體程度低的商品屬性賦予高層級,具體程度高的商品屬性賦予低層級。例如:通過商家獲得描述某一手機的商品屬性為:外觀,容量,功能,內存,機身,重量,運行速度,顏色。若根據各個商品屬性的相關詞語數量判斷得到高層級的商品屬性為:外觀,容量,功能;低層級的商品屬性為:內存,機身,重量,運行速度,顏色。則根據商品屬性層級的高低構建的到的商品屬性的框架圖為:最上層為某某手機,某某手機下層的3個分支分別為外觀,容量,功能。其中外觀下層的3個分支為機身,重量,顏色;容量下層的1個分支為內存;功能下層的1個分支為運行速度。
51.獲取評論對應的樹形圖。
52.根據所得的商品屬性的框架圖,基於機器學習的分詞方式對評論進行分詞處理,並將詞語提取出來。將提取出來的詞語與商品屬性進行匹配,即將提取出來的詞語輸入到商品屬性的資料庫中,在商品屬性的相關詞語集合中進行搜索,若該詞語在商品屬性的相關詞語集合中,則認為詞語與商品屬性相匹配,將該詞語填入與其相匹配的商品屬性中;若詞語不在商品屬性的相關詞語集合中,則認為與商品屬性不匹配,並且丟棄該詞語。逐一將每一條評論提取出來的詞語與框架圖中的商品屬性進行匹配並根據匹配結果填入或丟棄詞語,最終分別得到每一條評論對應的樹形圖。例如:得到的某一手機商品的框架圖為:手機:(外觀:(機身,重量,顏色),容量:(內存),功能:(運行速度))。根據該框架圖,基於機器學習的分詞方式獲取評論中涉及商品屬性概念的詞語集合為:好看,較大,較強,充足,較薄,輕,快,好看。將得到的涉及商品屬性的詞語集合與框架圖中的商品屬性進行匹配得到品論的樹形圖為:手機:(外觀(好看):(機身(較薄),重量(輕),顏色(好看)),容量(較大):(內存(充足)),功能(較強):(運行速度(快))。
53.步驟103,優化評論對應的樹形圖。
54.對獲得的樹形圖顯示出來的文本內容進行是否存在矛盾的分析,即檢測填入框架圖中的詞語之間是否滿足反義詞或否定詞關係,若滿足,則判定為存在矛盾,若不滿足,則判定為不存在矛盾。若樹形圖中的文本存在矛盾,則將有矛盾的文本標記出來,若不存在矛盾,則無需進行處理。對存在矛盾的文本採取摺疊不顯示的處理,而不存在矛盾的文本則會將其顯示出來。由於對於一種商品屬性的評價往往不止一個方面,所以會導致框架圖中與某一個商品屬性匹配成功的詞語不止一個,這就可能導致矛盾的出現,故要對出現矛盾的樹形圖進行優化處理。如果要對樹形圖進行優化,首先要找到需要優化的地方,即樹形圖中
存在矛盾的內容。可以通過深度學習的方法找出樹形圖中相互矛盾的內容。對矛盾的內容如何處理是優化樹形圖的重要內容,可以將樹形圖中相互矛盾的內容摺疊起來不予顯示,而沒有矛盾的內容則顯示出來,以此來達到優化樹形圖的效果。
55.檢測描述商品屬性的文本是否存在矛盾。
56.首先,要檢測樹形圖中的每一個商品屬性匹配成功的詞語的個數,若詞語個數大於1,則認為有相互矛盾的可能,並將詞語提取出來,將提取出來的詞語進行兩兩遍歷,然後檢測兩兩遍歷得到的詞語之間是否滿足反義詞或否定詞關係,若滿足,則標記為存在矛盾,若不滿足,則不做標記;若詞語個數小於或等於1,則認為無相互矛盾的可能,不需要進行處理。例如:某一個手機商品的評論區中,某一條評論a對應的樹形圖中描述內存的詞語有2個,分別為:很大,很小;描述外觀的詞語為:好看,不好看,描述重量的詞語為:較輕。那麼經過檢測詞語個數後可判斷出描述內存的詞語,描述外觀的詞語有相互矛盾的可能,要將與其匹配的詞語分別提取出來並進行矛盾關係判定。分別將很大和很小,好看和不好看提取出來並進行關係檢測後可以得到,很大和很小滿足反義詞關係,標記為存在矛盾;好看和不好看滿足否定詞關係,標記為存在矛盾。而描述重量的詞語只存在一個,認為無相互矛盾的可能,不需要進行處理。
57.對存在矛盾的樹形圖進行優化顯示。
58.根據所做的標記找到描述商品屬性的詞語相互矛盾的樹形圖,將具體的矛盾內容與其對應的樹形圖一一匹配起來。根據標記在樹形圖描述商品屬性的文本中找出其矛盾的具體內容,並將具有矛盾的文本摺疊起來,而不具矛盾的文本則展開顯示。例如:根據標記找到某一樹形圖的所有文本為:外觀好看,容量比較大,功能比較強,內存不足,機身比較薄,重量也輕,,外觀不好看。具體的矛盾內容為:外觀好看和外觀不好看。那麼,將有矛盾的文本摺疊後,樹形圖的優化顯示為:手機:(外觀:(機身(較薄),重量(輕),顏色(好看)),容量:(內存),功能:(運行速度))。
59.步驟104,根據樹形圖判斷評論的質量。
60.對樹形圖中不同層級的各個分支節點賦予不同的權重,相同的層級中各個分支節點的權重相同,不同層級的分支節點的權重不同,並且層級越高,即越是處於樹形圖中的上層,其權重就越低。每個分支節點中的文本內容是否為空白或者是否發生摺疊決定了分支節點與權重相乘的係數;若分支節點中的內容為空白或發生了摺疊,則該分支節點與權重相乘的係數為0;若分支節點中的內容不為空白且被展開顯示,則該分支節點與權重相乘的係數為1。最後,將樹形圖中的每一個分支節點的係數與其對應的權重相乘,並將所得結果累加起來得到的數值即為樹形圖對應的評論的質量,所得的數值越大,評論的質量越好。由於對一個商品的商品屬性的描述越是細緻,代表對商品的了解越深刻,評論的質量就越高,所以對層級高的分支節點賦予低權重,對層級低的分支節點賦予高權重。例如:若某一描述電子商品的評論a的樹形圖分為高,中,低3個層級,三個層級的權重由高到低分別為0.1,0.2,0.3。其中高層級有1個節點,中層級有2個節點,低層級有4個節點。若該樹形圖中的所有節點都展開顯示,則評論a的質量為:p=0.1*1+0.2*2+0.3*4=1.7;若該樹形圖中中層級和低層級各有1個節點因矛盾而發生摺疊,那麼評論a的質量為:p=0.1*1+0.2*1+0.3*3=1.2。
61.根據評論的質量劃分等級。
62.若樹形圖中的所有節點都不是空白並且都展開顯示,計算出該樹形圖的對應的評論的質量q,設定q為評論區內評論質量的最大值。根據q值劃分質量等級,0到q/3為低質量等級,q/3到2*q/3為中質量等級,2*q/3到q為高質量等級。逐一計算每個評論的質量並且根據計算出來的質量按照劃分好的等級對每個評論進行質量等級的劃分。例如:若計算得到q值為3,並且計算出評論a,評論b,評論c的質量數值分別為0.8,1.6,2.4。那麼根據質量等級對3個評論進行等級劃分得到3個評論的質量等級為:評論a為低質量等級,評論b為重質量等級,評論c為高質量等級。
63.步驟105,獲取用戶閱讀評論的商品屬性偏好及平均閱讀評論時長。
64.在獲得用戶授權的前提下,通過購物平臺獲取用戶讀評論的時間以及評論的內容。將用戶讀評論的時間相加然後除以用戶讀評論的個數,得到用戶的平均讀評論時長。篩選出用戶讀取過的評論中被用戶點讚的評論,篩選出每一條評論中描述商品屬性的關鍵詞,並將所有評論中描述商品屬性的關鍵詞集中起來,然後分別統計每一個關鍵詞出現的次數。對關鍵詞出現的次數求和,然後除以關鍵詞的個數,得到一個閾值d,將每一個關鍵詞出現的次數與閾值d相比較,若關鍵詞出現的次數大於或等於閾值d,則認為用戶比較在意該關鍵詞,將該關鍵詞作為用戶喜好的內容標記起來;若關鍵詞出現的次數小於閾值d,則認為用戶不關心該關鍵詞,不需要標記該關鍵詞。記錄被標記的關鍵詞並將其記為用戶閱讀評論的商品屬性偏好。例如:若某個用戶a曾經讀取過評論a,評論b和評論c,所用時長分別為25秒,30秒和35秒,那麼可以計算得到用戶a的平均閱讀時長為30秒。若3個評論中出現的關鍵詞及其次數分別為:外觀7次,內存9次,顏色2次,重量3次,運行速度4次。那麼對關鍵詞的次數求和得到:7+9+2+3+4=25,關鍵詞的個數為:5,則可以計算得到閾值d=25/5=5。那麼通過比較可以得到用戶a關心的商品屬性為:外觀,內存。
65.步驟106,個性化推送評論給用戶。
66.根據用戶閱讀評論的商品屬性偏好篩選具有與之相似的商品屬性的評論。對篩選得出的評論,根據用戶平均閱讀評論時長,針對質量等級採取進一步篩選。對篩選得出的評論進行其樹形圖的獲取,根據用戶平均閱讀評論時長,對描述的商品屬性的層級過高的文本,採取摺疊不顯示的處理。將最終得出的評論的樹形圖推送給用戶不同的用戶有不同的偏好和需求,根據用戶的偏好和需求個性化地將評論推送給用戶是重要地內容。如果要個性化推送評論給客戶,可以在了解用戶偏好和閱讀習慣地前提下,針對不同的用戶推送不同地評論或者將同一條評論的不同表達形式推送給不同地用戶。例如:若某一個用戶比較注重手機的內存和重量,那就將包含手機內存和重量此類關鍵詞的評論推送給用戶;若某一用戶閱讀評論比較粗略,用的時間比較短,那就將評論精簡後推送給用戶。
67.根據用戶的偏好和評論的質量篩選評論。
68.利用獲得的代表用戶對商品屬性的偏好的關鍵詞篩選出用戶可能感興趣的評論。在評論區的每一條評論中對代表用戶商品屬性偏好的關鍵詞進行搜索,若評論中存在代表用戶商品屬性偏好的關鍵詞,則認為該評論符合用戶的偏好,將該評論保留下來;若評論中不存在代表用戶商品屬性偏好的關鍵詞,則認為該評論不符合用戶的偏好,將該評論濾除。根據所得的評論質量等級進一步篩選出符合用戶要求的評論,逐一獲取評論區中經過篩選後的評論的質量等級,並且將其中中質量等級和高質量等級的評論保留下來,將低質量等級的評論濾除掉。例如:某一用戶對某一電子商品重點關注的內容為:外觀,內存和運行速
度。若該電子商品的評論區中只有3條評論分別為:評論a,評論b和評論c,預設的關鍵詞個數閾值為1,分別在3個評論中對關鍵詞進行搜索後得到:評論a中不含關鍵詞,評論b中含有1個關鍵詞,評論c中含有2個關鍵詞。那麼經過和預設關鍵詞個數閾值比較可以得到:評論b和評論c符合用戶的偏好,被保留;評論a不符合用戶的偏好,被濾除。若剩下的評論b為中質量等級,評論c為低質量等級,則濾除評論c,留下評論b;若剩下的評論b和評論c皆為高質量等級,則都保留下來。
69.根據用戶的平均閱讀時長推送評論。
70.預設一個時間閾值s,根據用戶的平均閱讀時長和時間閾值s的比較結果將用戶分為c,d兩類。若用戶的平均閱讀時長大於或等於時間閾值s,則將用戶歸為c類;若用戶的平均閱讀時長小於時間閾值s,則將用戶歸為d類。根據用戶的類別將符合用戶偏好的評論對應的樹形圖推送給用戶。對於c類用戶,直接將樹形圖的所有分支節點展開顯示,不需要進行摺疊;對於d類用戶,需要對樹形圖中層級高的分支節點進行摺疊,然後再將摺疊後的樹形圖推送給用戶。例如:若有2個用戶p和q,其閱讀評論的平均閱讀時長分別為:用戶p25秒,用戶q60秒。若設定的時間閾值s為40秒,則對用戶p和用戶q的分類為:用戶p為d類,用戶q為c類。根據用戶的類別可以知道:會先將樹形圖中層級高的分支節點摺疊起來,再將摺疊後的樹形圖推送給用戶p;對於用戶q,則會直接將樹形圖的所有分支節點展開顯示出來,再將樹形圖推送給用戶q。
71.以上對本發明的具體實施例進行了描述。需要理解的是,本發明並不局限於上述特定實施方式,本領域技術人員可以在權利要求的範圍內做出各種變化或修改,這並不影響本發明的實質內容。在不衝突的情況下,本技術的實施例和實施例中的特徵可以任意相互組合。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀