一種添加內鏈的方法及裝置與流程
2023-07-26 05:21:56 2

本發明涉及網際網路技術領域,特別是涉及一種添加內鏈的方法及裝置。
背景技術:
隨著網際網路的廣泛應用,網際網路信息的增長呈現爆炸式增長,各種各樣的信息可以通過網際網路快速傳播,例如:有關經濟的、政治的、娛樂的、教育的、生活的、科技的信息,而網際網路的應用,可以使人們輕易地獲取到這些信息,人們在獲取這些信息的時候,除了採用主動查找的方式獲取想要的信息外,還可以通過被動推薦的方式獲取這些信息。
目前,針對被動推薦的方式,較為普遍採用的方法是:通過對網頁文本中出現的關鍵詞給予一個指向另一個網頁的連結;用戶在閱讀網頁文本時,若對該關鍵詞感興趣,可以通過點擊該關鍵詞,獲取與該關鍵詞有關的內容,而不待採用主動查找方式尋找感興趣的內容。這種位於同一個網站下的一個網頁文本與一個關鍵詞之間的連結,也被成為內鏈。
但是,現有的設置內鏈的方式主要包括由人工添加和由系統自動添加。對於人工添加的方式,由於其添加內鏈是憑藉自身的知識能力/經驗來決定如何添加內鏈的,主觀任意性較強,造成內鏈遺漏和內鏈閒置等問題,而且人工添加的方式,待耗費大量的人力物力,且人工添加的方式效率低下。對於系統自動添加的方式,首先對待添加內鏈的文檔進行分詞處理,獲取待添加內鏈的文檔關鍵詞,再對關鍵詞添加內鏈,分詞處理使得伺服器處理速度降低,增加了處理複雜度。
技術實現要素:
本發明實施例的目的在於提供一種添加內鏈的方法及裝置,以實現在將文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度。具體技術方案如下:
第一方面,本發明實施例提供了一種添加內鏈的方法,包括:
獲取待更新至文檔資料庫的第一文檔,使用關鍵詞庫中的關鍵詞對第一文檔進行關鍵詞分析,得到至少一個關鍵詞;
統計至少一個關鍵詞在第一文檔中出現的次數,計算至少一個關鍵詞在第一文檔中的權值,並根據權值由大到小的順序生成關鍵詞列表,其中,權值用於表示至少一個關鍵詞在第一文檔中所佔的比例;
根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔,其中,至少一個關鍵詞與第二文檔一一對應;
將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中。
可選的,所述根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,包括:
根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔;
獲取至少一個關鍵詞在對應的多個文檔的每個文檔中的權值,並選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔。
可選的,在所述根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔之後,本發明實施例的添加內鏈的方法還包括:
獲取至少一個關鍵詞在對應的多個文檔的每個文檔的權值,並判斷權值是否大於或等於預設閾值;
在權值大於或等於預設閾值時,將與至少一個關鍵詞對應的多個文檔按權值由大到小的順序進行排序,並生成與至少一個關鍵詞對應的文檔列表。
可選的,在所述根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔之後,本發明實施例的添加內鏈的方法還包括:
對至少一個關鍵詞添加標識,以與第一文檔中的其他文字進行區分。
可選的,本發明實施例的添加內鏈的方法還包括:
在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。
可選的,本發明實施例的添加內鏈的方法還包括:
在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔和與至少一個關鍵詞對應的文檔列表在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔及文檔列表中包含的文檔,並返回給所述第一客戶端。
另一方面,本發明實施例還提供了一種添加內鏈的裝置,包括:
關鍵詞分析模塊,用於獲取待更新至文檔資料庫的第一文檔,通過關鍵詞庫中的關鍵詞對第一文檔進行關鍵詞分析,得到至少一個關鍵詞;
權值計算模塊,用於統計至少一個關鍵詞在第一文檔中出現的次數,計算至少一個關鍵詞在第一文檔中的權值,並根據權值由大到小的順序生成關鍵詞列表,其中,權值用於表示至少一個關鍵詞在第一文檔中所佔的比例;
內鏈添加模塊,用於根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔,其中至少一個關鍵詞與第二文檔一一對應;
更新模塊,用於將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中。
可選的,本發明實施例的內鏈添加模塊包括:
查找子模塊,用於根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔;
選擇子模塊,用於獲取至少一個關鍵詞在對應的多個文檔的每個文檔中的權值,並選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔。
可選的,本發明實施例的內鏈添加模塊還包括:
閾值判斷子模塊,用於獲取至少一個關鍵詞在對應的多個文檔的每個文檔的權值,並判斷權值是否大於或等於預設閾值;
文檔列表生成子模塊,用於在權值大於或等於預設閾值時,將與至少一個關鍵詞對應的多個文檔按權值由大到小的順序進行排序,並生成與至少一個關鍵詞對應的文檔列表。
可選的,本發明實施例的添加內鏈的裝置還包括:
標識添加模塊,用於對至少一個關鍵詞添加標識,以區分至少一個關鍵詞和第一文檔中的其他文字。
可選的,本發明實施例的添加內鏈的裝置還包括:
頁面返回模塊,用於在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。
可選的,所述頁面返回模塊,還用於在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔和與至少一個關鍵詞對應的文檔列表在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔及文檔列表中包含的文檔,並返回給第一客戶端。
本發明實施例提供的一種添加內鏈的方法及裝置,可以通過使用關鍵詞庫對待更新至文檔資料庫的第一文檔進行關鍵詞分析,計算每個關鍵詞的權重,然後在文檔資料庫中進行查找,得到關鍵詞權值最高的第二文檔,對每個關鍵詞和與每個關鍵詞對應的權值最高的第二文檔添加內鏈,得到添加內鏈後的第一文檔,並將添加內鏈後的第一文檔更新至文檔資料庫中,在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。通過本發明實施例,能夠在將待更新至文檔資料庫的文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度,在第一客戶端獲取所述文檔時,能夠快速獲得所述文檔,提高用戶體驗。當然,實施本發明的任一產品或方法必不一定需要同時達到以上所述的所有優點。
附圖說明
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實施例的一種添加內鏈的方法的第一種實施例的流程圖;
圖2為本發明實施例的一種添加內鏈的方法的第二種實施例的流程圖;
圖3為本發明實施例的一種添加內鏈的方法的第三種實施例的流程圖;
圖4為本發明實施例的一種添加內鏈的方法的第四種實施例的流程圖;
圖5為本發明實施例的一種添加內鏈的裝置的第一種實施例的結構圖。
具體實施方式
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
為了解決現有技術問題,本發明實施例提供了一種添加內鏈的方法及裝置,以實現在將文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度。
下面,首先對本發明實施例提供的一種添加內鏈的方法進行介紹。如圖1所示,為本發明實施例提供的一種添加內鏈的方法的第一種實施例的流程圖,所述的方法可以包括:
S101,獲取待更新至文檔資料庫的第一文檔,使用關鍵詞庫中的關鍵詞對第一文檔進行關鍵詞分析,得到至少一個關鍵詞;
在本步驟中,可以通過逐一使用關鍵詞遍歷該第一文檔的方式檢索該第一文檔中是否存在關鍵詞庫中的關鍵詞;還可以通過使用多個關鍵詞同時遍歷該第一文檔的方式檢索該文檔中是否存在關鍵詞庫中的關鍵詞。
需要說明的是,上述方式在這裡僅僅是為了更清楚說明得到關鍵詞的方式,並不是用於限定本步驟中獲取關鍵詞的方式,通過其他方式獲取關鍵詞的方式也應當是被允許的。
例如關鍵詞資料庫中包含:關鍵詞A、關鍵詞B、關鍵詞C和關鍵詞D,對上述的文檔進行關鍵詞分析後,得到該文檔中含有關鍵詞A、關鍵詞B和關鍵詞D。
與現有技術的添加內鏈的方法中對第一文檔進行分詞處理不同,本發明實施例的添加內鏈的方法通過預設的關鍵詞庫對第一文檔進行關鍵詞分析,不需要分詞處理,縮短了分析文檔的時間,降低了伺服器處理難度。
其中,關鍵詞庫可以是根據實際需要設置的關鍵詞庫,還可以是對文檔資料庫中的文檔進行分詞處理得到的關鍵詞資料庫,所述的關鍵詞庫可以進行周期更新,以使關鍵詞庫能夠更好的對待更新至文檔資料庫的文檔進行關鍵詞分析,所述的更新周期是根據實際需要進行設置的。
例如:從第三方獲取含有關鍵詞的excel文件,通過PHPexcel擴展程序把excel文件中的關鍵詞存儲至關鍵詞庫,在存儲時,通過對每個關鍵詞賦一個鍵值的方式進行存儲。
S102,統計至少一個關鍵詞在第一文檔中出現的次數,計算至少一個關鍵詞在第一文檔中的權值,並根據權值由大到小的順序生成關鍵詞列表,其中,權值用於表示至少一個關鍵詞在第一文檔中所佔的比例;
在進行關鍵詞分析時,得到多個關鍵詞,記錄每一個關鍵詞在該第一文檔中出現的次數,並統計所有關鍵詞在該第一文檔中出現的次數,根據每一個關鍵詞在該第一文檔中出現的次數和所有關鍵詞在該第一文檔中出現的次數,得到每一個關鍵詞在該第一文檔中的權值,然後根據權值由大到小的順序,生成關鍵詞列表。
在本步驟中,通過生成關鍵詞列表,在其他文檔更新至該文檔資料庫時,通過獲取該關鍵詞列表,能夠快速得到該第一文檔的關鍵詞,並且得到該文檔中關鍵詞的排序,縮短對其他文檔添加內鏈的時間,提高伺服器處理速度,其中,該第一文檔為待更新至上述文檔資料庫的任一文檔。
假設,關鍵詞A在該第一文檔中出現的次數為40次,關鍵詞B在該第一文檔中出現的次數為25次,關鍵詞D在該第一文檔中出現的次數為35次,則關鍵詞A在該第一文檔中的權值為0.4,關鍵詞B在該第一文檔中的權值為0.25,關鍵詞D在該第一文檔中的權值為0.35,因此可以得到關鍵詞列表為:關鍵詞A、關鍵詞D、關鍵詞B。
S103,根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔,其中至少一個關鍵詞與第二文檔一一對應;
在本步驟中,首先使用一個關鍵詞,查找文檔資料庫中各個文檔的關鍵詞列表,獲取含有該關鍵詞的多個關鍵詞列表,並獲取該關鍵詞在各個關鍵詞列表中的權值,選擇含有該關鍵詞的權值最高的關鍵詞列表,再根據該關鍵詞列表得到含有該關鍵詞的權值最高的第二文檔。
在得到含有該關鍵詞的權值最高的第二文檔後,對該關鍵詞和與該關鍵詞對應的權值最高的第二文檔添加內鏈,得到添加內鏈後的第一文檔。
例如,在步驟S101中得到該第一文檔中含有關鍵詞A、關鍵詞B和關鍵詞D,分別用關鍵詞A、關鍵詞B和關鍵詞D在文檔資料庫中進行查找,得到含有關鍵詞A的關鍵詞列表10個,含有關鍵詞B的關鍵詞列表20個,含有關鍵詞D的關鍵詞列表25個;
分別獲取關鍵詞A在與關鍵詞A對應的10個關鍵詞列表中的權值,選擇含有關鍵詞A權重最高的關鍵詞列表,然後獲取與該關鍵詞列表對應的權值最高的第二文檔,對關鍵詞A和與關鍵詞A對應的權值最高的第二文檔添加內鏈;
分別獲取關鍵詞B在與關鍵詞B對應的20個關鍵詞列表中的權值,選擇含有關鍵詞A權重最高的關鍵詞列表,然後獲取與該關鍵詞列表對應的權值最高的第二文檔,對關鍵詞B和與關鍵詞B對應的權值最高的第二文檔添加內鏈;
分別獲取關鍵詞D在與關鍵詞D對應的10個關鍵詞列表中的權值,選擇含有關鍵詞A權重最高的關鍵詞列表,然後獲取與該關鍵詞列表對應的權值最高的第二文檔,對關鍵詞D和與關鍵詞D對應的權值最高的第二文檔添加內鏈;
通過上述步驟,能夠得到與每一個關鍵詞相關度最高的第二文檔,通過對每一個關鍵詞和與每一個關鍵詞對應的權值最高的第二文檔添加內鏈,能夠提供相關度最高的文檔,提高用戶體驗。
S104,將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中。
在本步驟中,通過將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中,能夠實現在將其他文檔更新至文檔資料庫時,首先獲取該文檔的關鍵詞列表,減少訪問文檔資料庫中文檔的次數,提高伺服器處理速度。
本發明實施例提供的一種添加內鏈的方法,通過使用關鍵詞庫對待更新至文檔資料庫的第一文檔進行關鍵詞分析,計算每個關鍵詞的權重,然後在文檔資料庫中進行查找,得到關鍵詞權值最高的第二文檔,對每個關鍵詞和與每個關鍵詞對應的權值最高的第二文檔添加內鏈,得到添加內鏈後的第一文檔,並將添加內鏈後的第一文檔更新至文檔資料庫中。能夠在將待更新至文檔資料庫的文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度。
具體地,在所述根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔之後,本發明實施例的添加內鏈的方法還包括:
對所述至少一個關鍵詞添加標識,以區分所述至少一個關鍵詞和所述第一文檔中的其他文字。
通過添加標識,能夠使關鍵詞與該文檔的其他文字具有差異,使第一客戶端用戶能夠更清楚的看到該關鍵詞,提高用戶體驗。
其中,所述的標識可以是改變關鍵詞的顏色,也可以是對關鍵詞添加下劃線,還可以是改變關鍵詞的字體,這裡不作限定。
參見圖2,圖2為本發明實施例的一種添加內鏈的方法的第二種實施例的流程圖,該方法還可以包括:
S203,根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔;
在得到多個關鍵詞後,首先使用一個關鍵詞,查找文檔資料庫中各個文檔的關鍵詞列表,獲取含有該關鍵詞的多個關鍵詞列表,通過含有該關鍵詞的多個關鍵詞列表查詢與多個關鍵詞列表對應的文檔,最後得到與該關鍵詞對應的多個文檔。
例如,該第一文檔中含有關鍵詞A、關鍵詞B和關鍵詞D,分別用關鍵詞A、關鍵詞B和關鍵詞D在文檔資料庫中進行查找,得到含有關鍵詞A的關鍵詞列表10個,含有關鍵詞B的關鍵詞列表20個,含有關鍵詞D的關鍵詞列表25個;
然後通過含有關鍵詞A的關鍵詞列表進行查詢,得到與10個含有關鍵詞A的關鍵詞列表一一對應的10個文檔;通過含有關鍵詞B的關鍵詞列表進行查詢,得到與20個含有關鍵詞B的關鍵詞列表一一對應的20個文檔;通過含有關鍵詞D的關鍵詞列表進行查詢,得到與25個含有關鍵詞D的關鍵詞列表一一對應的25個文檔;
因此得到與待更新至文檔資料庫的第一文檔相關的55個文檔。
通過本步驟,能夠檢索到較多的文檔,為後面步驟「選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔」的實施提供了方便。
S204,獲取至少一個關鍵詞在對應的多個文檔的每個文檔中的權值,並選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔。
在本步驟中,每個關鍵詞通過在與該關鍵詞對應的多個文檔中查詢,得到與每個關鍵詞對應的關鍵詞權值最高的第二文檔。
例如,在步驟S203中,得到10個含有關鍵詞A的文檔,20個含有關鍵詞B的文檔,25個含有關鍵詞D的文檔,
然後分別查詢關鍵詞A在含有關鍵詞A的10個文檔中的權值,並選擇含有關鍵詞A的權值最高的文檔;分別查詢關鍵詞B在含有關鍵詞B的20個文檔中的權值,並選擇含有關鍵詞B的權值最高的文檔;分別查詢關鍵詞D在含有關鍵詞D的25個文檔中的權值,並選擇含有關鍵詞D的權值最高的文檔;最後,分別得到分別含有關鍵詞A、關鍵詞B、關鍵詞D的文檔各一篇。
參見圖3,圖3為本發明實施例的一種添加內鏈的方法的第三種實施例的流程圖,該方法還可以包括:
S307,在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。
在第一客戶端需要查閱文檔時,發送獲取該文檔的請求,伺服器在獲取到查閱該文檔的請求指令後,首先從文檔資料庫中獲取該文檔,生成包含有該文檔的網頁,經過緩存後返回給第一客戶端,其中,上述的網頁還可以包含其他內容,比如,相關文檔標題列表、推薦文檔列表、文檔搜索框等內容,這裡不作限定。
通過緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,能夠使得第一客戶端在點擊該第一文檔中的任一關鍵詞後,能夠快速獲取與該關鍵詞添加內鏈的第二文檔,提高用戶體驗。
應當理解的是,上述的第一客戶端是與伺服器進行通信的任一客戶端,可以是桌上型電腦、還可以是筆記本電腦、手機、平板電腦,第一客戶端可以通過網頁發送獲取該文檔的請求,還可以通過安裝在第一客戶端上的應用軟體程序發送獲取該文檔的請求,這裡不作限定,只要是能夠實現上述功能的方法都應當是被允許的。
參見圖4,圖4為本發明實施例的一種添加內鏈的方法的第四種實施例的流程圖,該方法還可以包括:
S404,獲取至少一個關鍵詞在對應的多個文檔的每個文檔的權值,並判斷權值是否大於或等於預設閾值;
S405,在權值大於或等於所述預設閾值時,將與至少一個關鍵詞對應的多個文檔按權值由大到小的順序進行排序,並生成與至少一個關鍵詞對應的文檔列表。
在本步驟中,首先獲取與每個關鍵詞對應的多個文檔的每個文檔的權值,然後將每個文檔的權值與預設閾值進行對比,並選擇權值大於預設閾值的文檔,在對比時,可以通過使用預設閾值在多個文檔中進行一一篩選的方式來獲得權值大於預設閾值的文檔,也可以通過使用預設閾值同時對各個文檔的關鍵詞權值進行對比的方式來獲得權值大於預設閾值的文檔,其中,預設閾值是在根據實際需要設置的閾值。
其中,文檔列表至少包括文檔標題和文檔作者。
例如,含有關鍵詞A的10個文檔的關鍵詞A的權值分別為:0.91、0.88、0.93、0.82、0.76、0.58、0.44、0.63、0.32、0.69,預設閾值為0.65,那麼,獲取大於預設閾值0.65的含有關鍵詞A的文檔,並按權值由大到小的順序排序,排序為:0.93、0.91、0.88、0.82、0.76、0.69,生成含有關鍵詞A的文檔列表,
通過設置預設閾值,能夠在生成文檔列表時,限定需要展示的文檔與該文檔的相關度,並且可以限定需要展示的文檔的個數,提高用戶的體驗。
相應的,該方法還包括:
S409,在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔和與至少一個關鍵詞對應的文檔列表在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔及文檔列表中包含的文檔,並返回給所述第一客戶端。
通過本步驟,能夠在第一客戶端用戶獲取第一文檔時,同時給用戶推薦與該文檔相關的文檔,給第一客戶端用戶提供更多的閱讀選擇,提高用戶體驗。
相應於上述方法實施例,本發明實施例提供了一種添加內鏈的裝置,如圖5所示,圖5為本發明實施例的添加內鏈的裝置的第一種實施例的結構圖,所述的裝置可以包括:
關鍵詞分析模塊501,用於獲取待更新至文檔資料庫的第一文檔,使用關鍵詞庫中的關鍵詞對第一文檔進行關鍵詞分析,得到至少一個關鍵詞;
權值計算模塊502,用於統計至少一個關鍵詞在第一文檔中出現的次數,計算至少一個關鍵詞在第一文檔中的權值,並根據權值由大到小的順序生成關鍵詞列表,其中,權值用於表示至少一個關鍵詞在第一文檔中所佔的比例;
內鏈添加模塊503,用於根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔,其中至少一個關鍵詞與第二文檔一一對應;
更新模塊504,用於將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中。
本發明實施例提供的一種添加內鏈的裝置,通過使用關鍵詞庫對待更新至文檔資料庫的第一文檔進行關鍵詞分析,計算每個關鍵詞的權重,然後在文檔資料庫中進行查找,得到關鍵詞權值最高的第二文檔,對每個關鍵詞和與每個關鍵詞對應的權值最高的第二文檔添加內鏈,得到添加內鏈後的第一文檔,並將添加內鏈後的第一文檔更新至文檔資料庫中。能夠在將待更新至文檔資料庫的文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度。
需要說明的是,本發明實施例的裝置是應用上述添加內鏈的方法的裝置,則上述添加內鏈的方法的所有實施例均適用於該裝置,且均能達到相同或相似的有益效果。
具體地,本發明實施例的添加內鏈的裝置還包括:
標識添加模塊,用於對第一文檔的每一個關鍵詞添加標識,以區分至少一個關鍵詞和第一文檔中的其他文字。
具體地,內鏈添加模塊503還包括:
查找子模塊,用於根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔;
選擇子模塊,用於獲取至少一個關鍵詞在對應的多個文檔的每個文檔中的權值,並選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔。
具體地,本發明實施例的添加內鏈的裝置還包括:
頁面返回模塊,用於在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。
具體地,本發明實施例的內鏈添加模塊503還包括:
閾值判斷子模塊,用於獲取至少一個關鍵詞在對應的多個文檔的每個文檔的權值,並判斷權值是否大於或等於預設閾值;
文檔列表生成子模塊,用於在權值大於或等於預設閾值時,將與至少一個關鍵詞對應的多個文檔按權值由大到小的順序進行排序,並生成與至少一個關鍵詞對應的文檔列表。
具體地,所述頁面返回模塊,還用於在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔和與至少一個關鍵詞對應的文檔列表在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔及文檔列表中包含的文檔,並返回給所述第一客戶端。
通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到上述實施例方法可藉助軟體加必需的通用硬體平臺的方式來實現,當然也可以通過硬體,但很多情況下前者是更佳的實施方式。基於這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,該計算機軟體產品存儲在一個存儲介質(如ROM/RAM、磁碟、光碟)中,包括若干指令用以使得一臺服務端設備(可以是計算機、伺服器或者網絡設備等)執行本發明各個實施例所述的方法。
需要說明的是,在本文中,諸如第一和第二等之類的關係術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關係或者順序。而且,術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句「包括一個……」限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
本說明書中的各個實施例均採用相關的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認為是用於實現邏輯功能的可執行指令的定序列表,可以具體實現在任何計算機可讀介質中,以供指令執行系統、裝置或設備(如基於計算機的系統、包括處理器的系統或其他可以從指令執行系統、裝置或設備取指令並執行指令的系統)使用,或結合這些指令執行系統、裝置或設備而使用。就本說明書而言,"計算機可讀介質"可以是任何可以包含、存儲、通信、傳播或傳輸程序以供指令執行系統、裝置或設備或結合這些指令執行系統、裝置或設備而使用的裝置。計算機可讀介質的更具體的示例(非窮盡性列表)包括以下:具有一個或多個布線的電連接部(電子裝置),可攜式計算機盤盒(磁裝置),隨機存取存儲器(RAM),只讀存儲器(ROM),可擦除可編輯只讀存儲器(EPROM或閃速存儲器),光纖裝置,以及可攜式光碟只讀存儲器(CDROM)。另外,計算機可讀介質甚至可以是可在其上列印所述程序的紙或其他合適的介質,因為可以例如通過對紙或其他介質進行光學掃描,接著進行編輯、解譯或必要時以其他合適方式進行處理來以電子方式獲得所述程序,然後將其存儲在計算機存儲器中。
本說明書中的各個實施例均採用相關的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
以上所述僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發明的保護範圍內。