一種基於瀏覽記錄的連結評分方法與流程
2023-06-09 13:01:46

本發明涉及網際網路連結評分領域,特別是一種基於瀏覽記錄的連結評分方法。
背景技術:
現在,網際網路已經基本普及,幾乎每個人都會使用瀏覽器進行網絡活動,而瀏覽器裡留存了大量的歷史記錄,以及用戶的使用習慣。那麼這些數據為什麼不能夠利用起來呢?可以通過編寫瀏覽器插件的方式,將用戶在瀏覽器上的網絡活動歷史進行分析、整合,然後計算出用戶對特定關鍵字、網站等的喜好程度。這樣,就可以對用戶以後瀏覽器頁面內呈現的連結進行喜好程度評分。使用戶在點擊之前即可預估該連結的價值,從而避免打開無興趣連結導致的時間、精力上的浪費。
當前的連結評分機制多為搜尋引擎對自身檢索結果的評分,而該評分主要是由搜尋引擎廠商提供的網絡評分服務,根據網民自發評分統計得出的結果,此種方式有以下不足:
1、依賴於特定的搜尋引擎及網絡服務
在百度上看到的連結評分,在360搜索、必應搜索等等服務中是不通用的,且不同的搜尋引擎有自身的一套評分機制以及體現方式。比如,在必應搜索中,體現為officialsite的角標形式;在360搜索中,以小角標「v」的形式體現該連結的可信度,這些體驗是相當不統一且高度依賴於特定網絡服務的。
如果用戶沒有使用搜尋引擎,只是打開了一個論壇的帖子列表,如何顯示連結的評分呢?按照現有的技術,是無法解決這個問題的。
2、無法提供個性化評分建議
現有搜尋引擎所提供的連結評分機制,僅僅是基於搜尋引擎自身的數據運算所得的結果,並沒有根據用戶的瀏覽習慣去優化(當然可以根據用戶的搜索歷史去優化,但並不全面)。造成這個結果的原因是搜尋引擎並不能完全地接觸到用戶的所有瀏覽記錄。同時如果將用戶的所有瀏覽記錄交付於某個搜尋引擎廠商,也是一種隱私方面的隱患。
相關術語:瀏覽器,即網頁瀏覽器,指googlechrome、mozillafirefox、safari等支持第三方插件的瀏覽器。搜尋引擎指自動從網際網路搜集信息,經過一定整理以後,提供給用戶進行查詢的系統,如百度、google等。localstorage,即現代瀏覽器所提供的本地數據存儲接口。
技術實現要素:
本發明所要解決的技術問題是提供一種基於瀏覽記錄的連結評分方法,將依賴於網絡服務的評分機制本地化,放到用戶的電腦上進行評分計算,便可以脫離對網絡服務的依賴,使用戶在任意網頁上都可以看到對應的連結評分。
為解決上述技術問題,本發明採用的技術方案是:
一種基於瀏覽記錄的連結評分方法,包括歷史關鍵詞提取及評分模塊、實時關鍵詞提取及評分模塊、連結評分模塊,具體如下:
歷史關鍵詞提取及評分模塊
獲取用戶所有的瀏覽器歷史記錄;對瀏覽器歷史記錄的標題、連結進行中文、英文分詞,並計算時間差得分;對分詞後的關鍵詞進行出現頻次累加,累加值為上一步驟所計算的時間差得分,得出對應關鍵詞分數;保存關鍵詞及其分數至本地存儲,供其他模塊調用。
實時關鍵詞提取及評分模塊
獲取用戶當前瀏覽的頁面信息,包括標題、內容、網址;對當前瀏覽頁面的標題、內容、網址進行中文、英文分詞;根據用戶在對應網頁上的停留時間,對關鍵字進行評分,停留時間越長,對應的關鍵字評分越高;將此關鍵字評分與「歷史關鍵詞提取及評分模塊」中所保存的關鍵字評分進行累加合併;保存關鍵詞及其分數至本地存儲,供其他模塊調用。
連結評分模塊
獲取用戶當前瀏覽的頁面中的所有連結以及對應的標題;對提獲取到的連結及對應標題進行中文、英文分詞,得出對應關鍵字;將對應連結的關鍵字應用到本地存儲中進行評分檢索;將對應連結中的關鍵字的評分求平均數;根據分數的大小對連結背景進行染色,高亮顯示分數較高的連結。
進一步的,所述連結評分方法基於googlechrome、mozillafirefox或safari瀏覽器的插件機制。
進一步的,在對瀏覽器歷史記錄的標題、連結進行中文、英文分詞時,分詞方法包括使用自定義詞典對文本進行逐個匹配、使用開源的分詞方法或通過http請求的方式調用分詞服務api。
進一步的,所述開源的分詞方法包括node-segment、nodejieba、node-analyzer。
與現有技術相比,本發明的有益效果是:1)在使用了發明方法後,用戶在打開任意網頁時,均可以看到一目了然的連結評分結果;2)方便用戶快速定位自己感興趣的連結,決定下一步點擊操作,此舉大大節省了用戶在連結選擇方面的時間,提高了信息獲取的效率。
附圖說明
圖1是本發明一種基於瀏覽記錄的連結評分方法實現流程示意圖。
具體實施方式
下面結合附圖和具體實施方式對本發明作進一步詳細的說明。
本發明的目的是要克服當前的連結評分服務的「高度網絡服務依賴」以及「無法準確個性化評分」的缺陷。首先,將依賴於網絡服務的評分機制本地化,放到用戶的電腦上進行評分計算,便可以脫離對網絡服務的依賴,使用戶在任意網頁上都可以看到對應的連結評分。其次,依據用戶的瀏覽歷史以及對瀏覽習慣的數據收集,便可以高度定製連結評分機制,使評分結果與用戶的上網習慣息息相關,而不是像搜尋引擎那樣提供一個並無個性化適配的評分結果。
下面基於googlechrome的插件機制對本發明方法進行闡述,但對於mozillafirefox、safari等瀏覽器,實現方式大同小異,具體如下:
歷史關鍵詞提取及評分模塊
1、使用googlechrome提供的chrome.historyapi,獲取用戶所有的瀏覽器歷史記錄。
實現代碼片段如下:
2、對瀏覽器歷史記錄的「標題」、「連結」進行中文、英文分詞,並計算時間差得分。
分詞的方法有很多,包括使用自定義詞典對文本進行逐個匹配、使用開源的分詞解決方案(如:node-segment、nodejieba、node-analyzer等等)或通過http請求的方式調用分詞服務api。時間差得分是以連結訪問時的時間戳除以當前時間的時間戳所得的值,保存後用於接下來的分數計算。
3、對分詞後的關鍵詞進行出現頻次累加,累加值為上一步所計算的時間差得分,得出對應關鍵詞分數。
4、保存關鍵詞及其分數至本地存儲(localstorage),供其他模塊調用。
實時關鍵詞提取及評分模塊
1、使用googlechrome提供的contentscripts機制獲取用戶當前瀏覽的頁面信息:標題、內容、網址。
實現代碼片段如下:
2、對當前瀏覽頁面的「標題」、「內容」、「網址」進行中文、英文分詞。
3、根據用戶在對應網頁上的停留時間,對關鍵字進行評分,停留時間越長,對應的關鍵字評分越高。當用戶停留在網頁上時,可以採用固定的時間差得分(timescore),如1分鐘進行一次關鍵詞提取與評分,這樣就實現了用戶在指定頁面停留時間越長,得分越高的結果。
4、將此關鍵字評分與「歷史關鍵詞提取及評分模塊」中所保存的關鍵字評分進行累加合併。
5、保存關鍵詞及其分數至本地存儲(localstorage),供其他模塊調用。
連結評分模塊
1、使用googlechrome提供的contentscripts機制獲取用戶當前瀏覽的頁面中的所有連結以及對應的標題。
實現代碼片段如下:
2、對提獲取到的連結及對應標題進行中文、英文分詞,得出對應關鍵字。
3、將對應連結的關鍵字,在本地存儲(localstorage)中進行評分檢索。
4、將對應連結中的關鍵字的評分求平均數。
5、根據分數的大小對連結背景進行染色,高亮顯示分數較高(例如,分數高於當前頁面所有連結的平均分)的連結。至此,用戶便可以在任意網頁中看到對應的高分連結,就更容易判斷點擊目標了。