新四季網

一種添加內鏈的方法及裝置與流程

2023-07-26 05:21:56 2


本發明涉及網際網路技術領域,特別是涉及一種添加內鏈的方法及裝置。



背景技術:

隨著網際網路的廣泛應用,網際網路信息的增長呈現爆炸式增長,各種各樣的信息可以通過網際網路快速傳播,例如:有關經濟的、政治的、娛樂的、教育的、生活的、科技的信息,而網際網路的應用,可以使人們輕易地獲取到這些信息,人們在獲取這些信息的時候,除了採用主動查找的方式獲取想要的信息外,還可以通過被動推薦的方式獲取這些信息。

目前,針對被動推薦的方式,較為普遍採用的方法是:通過對網頁文本中出現的關鍵詞給予一個指向另一個網頁的連結;用戶在閱讀網頁文本時,若對該關鍵詞感興趣,可以通過點擊該關鍵詞,獲取與該關鍵詞有關的內容,而不待採用主動查找方式尋找感興趣的內容。這種位於同一個網站下的一個網頁文本與一個關鍵詞之間的連結,也被成為內鏈。

但是,現有的設置內鏈的方式主要包括由人工添加和由系統自動添加。對於人工添加的方式,由於其添加內鏈是憑藉自身的知識能力/經驗來決定如何添加內鏈的,主觀任意性較強,造成內鏈遺漏和內鏈閒置等問題,而且人工添加的方式,待耗費大量的人力物力,且人工添加的方式效率低下。對於系統自動添加的方式,首先對待添加內鏈的文檔進行分詞處理,獲取待添加內鏈的文檔關鍵詞,再對關鍵詞添加內鏈,分詞處理使得伺服器處理速度降低,增加了處理複雜度。



技術實現要素:

本發明實施例的目的在於提供一種添加內鏈的方法及裝置,以實現在將文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度。具體技術方案如下:

第一方面,本發明實施例提供了一種添加內鏈的方法,包括:

獲取待更新至文檔資料庫的第一文檔,使用關鍵詞庫中的關鍵詞對第一文檔進行關鍵詞分析,得到至少一個關鍵詞;

統計至少一個關鍵詞在第一文檔中出現的次數,計算至少一個關鍵詞在第一文檔中的權值,並根據權值由大到小的順序生成關鍵詞列表,其中,權值用於表示至少一個關鍵詞在第一文檔中所佔的比例;

根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔,其中,至少一個關鍵詞與第二文檔一一對應;

將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中。

可選的,所述根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,包括:

根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔;

獲取至少一個關鍵詞在對應的多個文檔的每個文檔中的權值,並選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔。

可選的,在所述根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔之後,本發明實施例的添加內鏈的方法還包括:

獲取至少一個關鍵詞在對應的多個文檔的每個文檔的權值,並判斷權值是否大於或等於預設閾值;

在權值大於或等於預設閾值時,將與至少一個關鍵詞對應的多個文檔按權值由大到小的順序進行排序,並生成與至少一個關鍵詞對應的文檔列表。

可選的,在所述根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔之後,本發明實施例的添加內鏈的方法還包括:

對至少一個關鍵詞添加標識,以與第一文檔中的其他文字進行區分。

可選的,本發明實施例的添加內鏈的方法還包括:

在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。

可選的,本發明實施例的添加內鏈的方法還包括:

在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔和與至少一個關鍵詞對應的文檔列表在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔及文檔列表中包含的文檔,並返回給所述第一客戶端。

另一方面,本發明實施例還提供了一種添加內鏈的裝置,包括:

關鍵詞分析模塊,用於獲取待更新至文檔資料庫的第一文檔,通過關鍵詞庫中的關鍵詞對第一文檔進行關鍵詞分析,得到至少一個關鍵詞;

權值計算模塊,用於統計至少一個關鍵詞在第一文檔中出現的次數,計算至少一個關鍵詞在第一文檔中的權值,並根據權值由大到小的順序生成關鍵詞列表,其中,權值用於表示至少一個關鍵詞在第一文檔中所佔的比例;

內鏈添加模塊,用於根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔,其中至少一個關鍵詞與第二文檔一一對應;

更新模塊,用於將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中。

可選的,本發明實施例的內鏈添加模塊包括:

查找子模塊,用於根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔;

選擇子模塊,用於獲取至少一個關鍵詞在對應的多個文檔的每個文檔中的權值,並選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔。

可選的,本發明實施例的內鏈添加模塊還包括:

閾值判斷子模塊,用於獲取至少一個關鍵詞在對應的多個文檔的每個文檔的權值,並判斷權值是否大於或等於預設閾值;

文檔列表生成子模塊,用於在權值大於或等於預設閾值時,將與至少一個關鍵詞對應的多個文檔按權值由大到小的順序進行排序,並生成與至少一個關鍵詞對應的文檔列表。

可選的,本發明實施例的添加內鏈的裝置還包括:

標識添加模塊,用於對至少一個關鍵詞添加標識,以區分至少一個關鍵詞和第一文檔中的其他文字。

可選的,本發明實施例的添加內鏈的裝置還包括:

頁面返回模塊,用於在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。

可選的,所述頁面返回模塊,還用於在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔和與至少一個關鍵詞對應的文檔列表在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔及文檔列表中包含的文檔,並返回給第一客戶端。

本發明實施例提供的一種添加內鏈的方法及裝置,可以通過使用關鍵詞庫對待更新至文檔資料庫的第一文檔進行關鍵詞分析,計算每個關鍵詞的權重,然後在文檔資料庫中進行查找,得到關鍵詞權值最高的第二文檔,對每個關鍵詞和與每個關鍵詞對應的權值最高的第二文檔添加內鏈,得到添加內鏈後的第一文檔,並將添加內鏈後的第一文檔更新至文檔資料庫中,在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。通過本發明實施例,能夠在將待更新至文檔資料庫的文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度,在第一客戶端獲取所述文檔時,能夠快速獲得所述文檔,提高用戶體驗。當然,實施本發明的任一產品或方法必不一定需要同時達到以上所述的所有優點。

附圖說明

為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。

圖1為本發明實施例的一種添加內鏈的方法的第一種實施例的流程圖;

圖2為本發明實施例的一種添加內鏈的方法的第二種實施例的流程圖;

圖3為本發明實施例的一種添加內鏈的方法的第三種實施例的流程圖;

圖4為本發明實施例的一種添加內鏈的方法的第四種實施例的流程圖;

圖5為本發明實施例的一種添加內鏈的裝置的第一種實施例的結構圖。

具體實施方式

下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。

為了解決現有技術問題,本發明實施例提供了一種添加內鏈的方法及裝置,以實現在將文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度。

下面,首先對本發明實施例提供的一種添加內鏈的方法進行介紹。如圖1所示,為本發明實施例提供的一種添加內鏈的方法的第一種實施例的流程圖,所述的方法可以包括:

S101,獲取待更新至文檔資料庫的第一文檔,使用關鍵詞庫中的關鍵詞對第一文檔進行關鍵詞分析,得到至少一個關鍵詞;

在本步驟中,可以通過逐一使用關鍵詞遍歷該第一文檔的方式檢索該第一文檔中是否存在關鍵詞庫中的關鍵詞;還可以通過使用多個關鍵詞同時遍歷該第一文檔的方式檢索該文檔中是否存在關鍵詞庫中的關鍵詞。

需要說明的是,上述方式在這裡僅僅是為了更清楚說明得到關鍵詞的方式,並不是用於限定本步驟中獲取關鍵詞的方式,通過其他方式獲取關鍵詞的方式也應當是被允許的。

例如關鍵詞資料庫中包含:關鍵詞A、關鍵詞B、關鍵詞C和關鍵詞D,對上述的文檔進行關鍵詞分析後,得到該文檔中含有關鍵詞A、關鍵詞B和關鍵詞D。

與現有技術的添加內鏈的方法中對第一文檔進行分詞處理不同,本發明實施例的添加內鏈的方法通過預設的關鍵詞庫對第一文檔進行關鍵詞分析,不需要分詞處理,縮短了分析文檔的時間,降低了伺服器處理難度。

其中,關鍵詞庫可以是根據實際需要設置的關鍵詞庫,還可以是對文檔資料庫中的文檔進行分詞處理得到的關鍵詞資料庫,所述的關鍵詞庫可以進行周期更新,以使關鍵詞庫能夠更好的對待更新至文檔資料庫的文檔進行關鍵詞分析,所述的更新周期是根據實際需要進行設置的。

例如:從第三方獲取含有關鍵詞的excel文件,通過PHPexcel擴展程序把excel文件中的關鍵詞存儲至關鍵詞庫,在存儲時,通過對每個關鍵詞賦一個鍵值的方式進行存儲。

S102,統計至少一個關鍵詞在第一文檔中出現的次數,計算至少一個關鍵詞在第一文檔中的權值,並根據權值由大到小的順序生成關鍵詞列表,其中,權值用於表示至少一個關鍵詞在第一文檔中所佔的比例;

在進行關鍵詞分析時,得到多個關鍵詞,記錄每一個關鍵詞在該第一文檔中出現的次數,並統計所有關鍵詞在該第一文檔中出現的次數,根據每一個關鍵詞在該第一文檔中出現的次數和所有關鍵詞在該第一文檔中出現的次數,得到每一個關鍵詞在該第一文檔中的權值,然後根據權值由大到小的順序,生成關鍵詞列表。

在本步驟中,通過生成關鍵詞列表,在其他文檔更新至該文檔資料庫時,通過獲取該關鍵詞列表,能夠快速得到該第一文檔的關鍵詞,並且得到該文檔中關鍵詞的排序,縮短對其他文檔添加內鏈的時間,提高伺服器處理速度,其中,該第一文檔為待更新至上述文檔資料庫的任一文檔。

假設,關鍵詞A在該第一文檔中出現的次數為40次,關鍵詞B在該第一文檔中出現的次數為25次,關鍵詞D在該第一文檔中出現的次數為35次,則關鍵詞A在該第一文檔中的權值為0.4,關鍵詞B在該第一文檔中的權值為0.25,關鍵詞D在該第一文檔中的權值為0.35,因此可以得到關鍵詞列表為:關鍵詞A、關鍵詞D、關鍵詞B。

S103,根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔,其中至少一個關鍵詞與第二文檔一一對應;

在本步驟中,首先使用一個關鍵詞,查找文檔資料庫中各個文檔的關鍵詞列表,獲取含有該關鍵詞的多個關鍵詞列表,並獲取該關鍵詞在各個關鍵詞列表中的權值,選擇含有該關鍵詞的權值最高的關鍵詞列表,再根據該關鍵詞列表得到含有該關鍵詞的權值最高的第二文檔。

在得到含有該關鍵詞的權值最高的第二文檔後,對該關鍵詞和與該關鍵詞對應的權值最高的第二文檔添加內鏈,得到添加內鏈後的第一文檔。

例如,在步驟S101中得到該第一文檔中含有關鍵詞A、關鍵詞B和關鍵詞D,分別用關鍵詞A、關鍵詞B和關鍵詞D在文檔資料庫中進行查找,得到含有關鍵詞A的關鍵詞列表10個,含有關鍵詞B的關鍵詞列表20個,含有關鍵詞D的關鍵詞列表25個;

分別獲取關鍵詞A在與關鍵詞A對應的10個關鍵詞列表中的權值,選擇含有關鍵詞A權重最高的關鍵詞列表,然後獲取與該關鍵詞列表對應的權值最高的第二文檔,對關鍵詞A和與關鍵詞A對應的權值最高的第二文檔添加內鏈;

分別獲取關鍵詞B在與關鍵詞B對應的20個關鍵詞列表中的權值,選擇含有關鍵詞A權重最高的關鍵詞列表,然後獲取與該關鍵詞列表對應的權值最高的第二文檔,對關鍵詞B和與關鍵詞B對應的權值最高的第二文檔添加內鏈;

分別獲取關鍵詞D在與關鍵詞D對應的10個關鍵詞列表中的權值,選擇含有關鍵詞A權重最高的關鍵詞列表,然後獲取與該關鍵詞列表對應的權值最高的第二文檔,對關鍵詞D和與關鍵詞D對應的權值最高的第二文檔添加內鏈;

通過上述步驟,能夠得到與每一個關鍵詞相關度最高的第二文檔,通過對每一個關鍵詞和與每一個關鍵詞對應的權值最高的第二文檔添加內鏈,能夠提供相關度最高的文檔,提高用戶體驗。

S104,將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中。

在本步驟中,通過將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中,能夠實現在將其他文檔更新至文檔資料庫時,首先獲取該文檔的關鍵詞列表,減少訪問文檔資料庫中文檔的次數,提高伺服器處理速度。

本發明實施例提供的一種添加內鏈的方法,通過使用關鍵詞庫對待更新至文檔資料庫的第一文檔進行關鍵詞分析,計算每個關鍵詞的權重,然後在文檔資料庫中進行查找,得到關鍵詞權值最高的第二文檔,對每個關鍵詞和與每個關鍵詞對應的權值最高的第二文檔添加內鏈,得到添加內鏈後的第一文檔,並將添加內鏈後的第一文檔更新至文檔資料庫中。能夠在將待更新至文檔資料庫的文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度。

具體地,在所述根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔之後,本發明實施例的添加內鏈的方法還包括:

對所述至少一個關鍵詞添加標識,以區分所述至少一個關鍵詞和所述第一文檔中的其他文字。

通過添加標識,能夠使關鍵詞與該文檔的其他文字具有差異,使第一客戶端用戶能夠更清楚的看到該關鍵詞,提高用戶體驗。

其中,所述的標識可以是改變關鍵詞的顏色,也可以是對關鍵詞添加下劃線,還可以是改變關鍵詞的字體,這裡不作限定。

參見圖2,圖2為本發明實施例的一種添加內鏈的方法的第二種實施例的流程圖,該方法還可以包括:

S203,根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔;

在得到多個關鍵詞後,首先使用一個關鍵詞,查找文檔資料庫中各個文檔的關鍵詞列表,獲取含有該關鍵詞的多個關鍵詞列表,通過含有該關鍵詞的多個關鍵詞列表查詢與多個關鍵詞列表對應的文檔,最後得到與該關鍵詞對應的多個文檔。

例如,該第一文檔中含有關鍵詞A、關鍵詞B和關鍵詞D,分別用關鍵詞A、關鍵詞B和關鍵詞D在文檔資料庫中進行查找,得到含有關鍵詞A的關鍵詞列表10個,含有關鍵詞B的關鍵詞列表20個,含有關鍵詞D的關鍵詞列表25個;

然後通過含有關鍵詞A的關鍵詞列表進行查詢,得到與10個含有關鍵詞A的關鍵詞列表一一對應的10個文檔;通過含有關鍵詞B的關鍵詞列表進行查詢,得到與20個含有關鍵詞B的關鍵詞列表一一對應的20個文檔;通過含有關鍵詞D的關鍵詞列表進行查詢,得到與25個含有關鍵詞D的關鍵詞列表一一對應的25個文檔;

因此得到與待更新至文檔資料庫的第一文檔相關的55個文檔。

通過本步驟,能夠檢索到較多的文檔,為後面步驟「選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔」的實施提供了方便。

S204,獲取至少一個關鍵詞在對應的多個文檔的每個文檔中的權值,並選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔。

在本步驟中,每個關鍵詞通過在與該關鍵詞對應的多個文檔中查詢,得到與每個關鍵詞對應的關鍵詞權值最高的第二文檔。

例如,在步驟S203中,得到10個含有關鍵詞A的文檔,20個含有關鍵詞B的文檔,25個含有關鍵詞D的文檔,

然後分別查詢關鍵詞A在含有關鍵詞A的10個文檔中的權值,並選擇含有關鍵詞A的權值最高的文檔;分別查詢關鍵詞B在含有關鍵詞B的20個文檔中的權值,並選擇含有關鍵詞B的權值最高的文檔;分別查詢關鍵詞D在含有關鍵詞D的25個文檔中的權值,並選擇含有關鍵詞D的權值最高的文檔;最後,分別得到分別含有關鍵詞A、關鍵詞B、關鍵詞D的文檔各一篇。

參見圖3,圖3為本發明實施例的一種添加內鏈的方法的第三種實施例的流程圖,該方法還可以包括:

S307,在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。

在第一客戶端需要查閱文檔時,發送獲取該文檔的請求,伺服器在獲取到查閱該文檔的請求指令後,首先從文檔資料庫中獲取該文檔,生成包含有該文檔的網頁,經過緩存後返回給第一客戶端,其中,上述的網頁還可以包含其他內容,比如,相關文檔標題列表、推薦文檔列表、文檔搜索框等內容,這裡不作限定。

通過緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,能夠使得第一客戶端在點擊該第一文檔中的任一關鍵詞後,能夠快速獲取與該關鍵詞添加內鏈的第二文檔,提高用戶體驗。

應當理解的是,上述的第一客戶端是與伺服器進行通信的任一客戶端,可以是桌上型電腦、還可以是筆記本電腦、手機、平板電腦,第一客戶端可以通過網頁發送獲取該文檔的請求,還可以通過安裝在第一客戶端上的應用軟體程序發送獲取該文檔的請求,這裡不作限定,只要是能夠實現上述功能的方法都應當是被允許的。

參見圖4,圖4為本發明實施例的一種添加內鏈的方法的第四種實施例的流程圖,該方法還可以包括:

S404,獲取至少一個關鍵詞在對應的多個文檔的每個文檔的權值,並判斷權值是否大於或等於預設閾值;

S405,在權值大於或等於所述預設閾值時,將與至少一個關鍵詞對應的多個文檔按權值由大到小的順序進行排序,並生成與至少一個關鍵詞對應的文檔列表。

在本步驟中,首先獲取與每個關鍵詞對應的多個文檔的每個文檔的權值,然後將每個文檔的權值與預設閾值進行對比,並選擇權值大於預設閾值的文檔,在對比時,可以通過使用預設閾值在多個文檔中進行一一篩選的方式來獲得權值大於預設閾值的文檔,也可以通過使用預設閾值同時對各個文檔的關鍵詞權值進行對比的方式來獲得權值大於預設閾值的文檔,其中,預設閾值是在根據實際需要設置的閾值。

其中,文檔列表至少包括文檔標題和文檔作者。

例如,含有關鍵詞A的10個文檔的關鍵詞A的權值分別為:0.91、0.88、0.93、0.82、0.76、0.58、0.44、0.63、0.32、0.69,預設閾值為0.65,那麼,獲取大於預設閾值0.65的含有關鍵詞A的文檔,並按權值由大到小的順序排序,排序為:0.93、0.91、0.88、0.82、0.76、0.69,生成含有關鍵詞A的文檔列表,

通過設置預設閾值,能夠在生成文檔列表時,限定需要展示的文檔與該文檔的相關度,並且可以限定需要展示的文檔的個數,提高用戶的體驗。

相應的,該方法還包括:

S409,在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔和與至少一個關鍵詞對應的文檔列表在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔及文檔列表中包含的文檔,並返回給所述第一客戶端。

通過本步驟,能夠在第一客戶端用戶獲取第一文檔時,同時給用戶推薦與該文檔相關的文檔,給第一客戶端用戶提供更多的閱讀選擇,提高用戶體驗。

相應於上述方法實施例,本發明實施例提供了一種添加內鏈的裝置,如圖5所示,圖5為本發明實施例的添加內鏈的裝置的第一種實施例的結構圖,所述的裝置可以包括:

關鍵詞分析模塊501,用於獲取待更新至文檔資料庫的第一文檔,使用關鍵詞庫中的關鍵詞對第一文檔進行關鍵詞分析,得到至少一個關鍵詞;

權值計算模塊502,用於統計至少一個關鍵詞在第一文檔中出現的次數,計算至少一個關鍵詞在第一文檔中的權值,並根據權值由大到小的順序生成關鍵詞列表,其中,權值用於表示至少一個關鍵詞在第一文檔中所佔的比例;

內鏈添加模塊503,用於根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,對至少一個關鍵詞和與至少一個關鍵詞對應的第二文檔添加內鏈,得到添加內鏈後的第一文檔,其中至少一個關鍵詞與第二文檔一一對應;

更新模塊504,用於將添加內鏈後的第一文檔與關鍵詞列表更新至文檔資料庫中。

本發明實施例提供的一種添加內鏈的裝置,通過使用關鍵詞庫對待更新至文檔資料庫的第一文檔進行關鍵詞分析,計算每個關鍵詞的權重,然後在文檔資料庫中進行查找,得到關鍵詞權值最高的第二文檔,對每個關鍵詞和與每個關鍵詞對應的權值最高的第二文檔添加內鏈,得到添加內鏈後的第一文檔,並將添加內鏈後的第一文檔更新至文檔資料庫中。能夠在將待更新至文檔資料庫的文檔更新至文檔資料庫時,通過關鍵詞庫統計待添加內鏈的文檔的關鍵詞,實現自動添加內鏈,降低伺服器處理難度,提高伺服器處理速度。

需要說明的是,本發明實施例的裝置是應用上述添加內鏈的方法的裝置,則上述添加內鏈的方法的所有實施例均適用於該裝置,且均能達到相同或相似的有益效果。

具體地,本發明實施例的添加內鏈的裝置還包括:

標識添加模塊,用於對第一文檔的每一個關鍵詞添加標識,以區分至少一個關鍵詞和第一文檔中的其他文字。

具體地,內鏈添加模塊503還包括:

查找子模塊,用於根據至少一個關鍵詞在文檔資料庫中進行查找,得到與至少一個關鍵詞對應的多個文檔;

選擇子模塊,用於獲取至少一個關鍵詞在對應的多個文檔的每個文檔中的權值,並選擇與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔。

具體地,本發明實施例的添加內鏈的裝置還包括:

頁面返回模塊,用於在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔,並返回給第一客戶端。

具體地,本發明實施例的內鏈添加模塊503還包括:

閾值判斷子模塊,用於獲取至少一個關鍵詞在對應的多個文檔的每個文檔的權值,並判斷權值是否大於或等於預設閾值;

文檔列表生成子模塊,用於在權值大於或等於預設閾值時,將與至少一個關鍵詞對應的多個文檔按權值由大到小的順序進行排序,並生成與至少一個關鍵詞對應的文檔列表。

具體地,所述頁面返回模塊,還用於在接收到第一客戶端發送的獲取添加內鏈後的第一文檔的請求指令後,生成包含添加內鏈後的第一文檔和與至少一個關鍵詞對應的文檔列表在內的網頁,緩存與至少一個關鍵詞對應的關鍵詞權值最高的第二文檔及文檔列表中包含的文檔,並返回給所述第一客戶端。

通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到上述實施例方法可藉助軟體加必需的通用硬體平臺的方式來實現,當然也可以通過硬體,但很多情況下前者是更佳的實施方式。基於這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,該計算機軟體產品存儲在一個存儲介質(如ROM/RAM、磁碟、光碟)中,包括若干指令用以使得一臺服務端設備(可以是計算機、伺服器或者網絡設備等)執行本發明各個實施例所述的方法。

需要說明的是,在本文中,諸如第一和第二等之類的關係術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關係或者順序。而且,術語「包括」、「包含」或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句「包括一個……」限定的要素,並不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。

本說明書中的各個實施例均採用相關的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。

在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認為是用於實現邏輯功能的可執行指令的定序列表,可以具體實現在任何計算機可讀介質中,以供指令執行系統、裝置或設備(如基於計算機的系統、包括處理器的系統或其他可以從指令執行系統、裝置或設備取指令並執行指令的系統)使用,或結合這些指令執行系統、裝置或設備而使用。就本說明書而言,"計算機可讀介質"可以是任何可以包含、存儲、通信、傳播或傳輸程序以供指令執行系統、裝置或設備或結合這些指令執行系統、裝置或設備而使用的裝置。計算機可讀介質的更具體的示例(非窮盡性列表)包括以下:具有一個或多個布線的電連接部(電子裝置),可攜式計算機盤盒(磁裝置),隨機存取存儲器(RAM),只讀存儲器(ROM),可擦除可編輯只讀存儲器(EPROM或閃速存儲器),光纖裝置,以及可攜式光碟只讀存儲器(CDROM)。另外,計算機可讀介質甚至可以是可在其上列印所述程序的紙或其他合適的介質,因為可以例如通過對紙或其他介質進行光學掃描,接著進行編輯、解譯或必要時以其他合適方式進行處理來以電子方式獲得所述程序,然後將其存儲在計算機存儲器中。

本說明書中的各個實施例均採用相關的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。

以上所述僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。凡在本發明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發明的保護範圍內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀