基於改進的k‑means算法實現搜尋引擎關鍵詞優化的製作方法
2023-10-04 17:48:39 3

本發明涉及語義網絡技術領域,具體涉及一種基於改進的k-means算法實現搜尋引擎關鍵詞優化。
背景技術:
人們在網際網路上獲取信息很大程度上依賴著搜尋引擎,網站能被其收錄並排名相對靠前,能獲得更多用戶訪問,隨著百度、谷歌的著名搜尋引擎的迅速發展,它們各自形成了比較成熟的排序算法。搜尋引擎優化(SEO)是指在搜尋引擎許可的優化原則下,通過對網站中代碼連結和文字描述的重組優化,以及後期對網站進行合理的反向連結操作,最終實現被優化的網站在搜尋引擎的檢索結果中得到排名提升。而搜尋引擎優化中,關鍵詞優化策略尤為重要,關鍵詞始終貫穿於搜尋引擎優化的整個過程。關鍵詞優化策略一般包括關鍵詞的選擇、關鍵詞的分布及密度控制等等,關鍵詞的使用是否得當,直接關係到網站在搜尋引擎的搜索結果中的位置。在研究網絡搜索關鍵詞搜索量數據與相關問題的關係時,選擇哪些關鍵詞是首先要解決的關鍵問題,閱讀文獻,筆者發現,對於關鍵詞的選取大多憑藉經驗和主觀因素,缺少系統的方法和總結。為使關鍵詞的選取更具科學性和客觀性,基於上述需求,本發明提供了基於改進的k-means算法實現搜尋引擎關鍵詞優化。
技術實現要素:
針對於關鍵詞優化實現搜尋引擎優化的技術問題,本發明提供了一種基於改進的k-means算法實現搜尋引擎關鍵詞優化。
為了解決上述問題,本發明是通過以下技術方案實現的:
步驟1:根據企業業務確定核心關鍵詞,利用搜尋引擎搜集相關關鍵字,這些關鍵字在搜尋引擎中有相應數據項,如本國每月搜索量、競爭程度和估算每次點擊費用(CPC)等
步驟2:結合企業產品和市場分析,篩選降維上述搜索到的相關關鍵字集合;
步驟3:針對篩選降維後的關鍵詞集合,通過搜尋引擎搜索關鍵詞對應的頁面,這裡記錄首頁網頁數和總搜索頁面數,即每個關鍵詞就是一個五維向量;
步驟4:利用改進的k-means算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:初始化簇的數目k,從數據對象集合D中隨機選擇k個初始簇中心;
步驟4.2:對每個關鍵詞i(i∈(1,2,…,m)),按目標函數f(i)選擇聚類中心j;
步驟4.3:根據分類的結果,重新計算各簇中心;
步驟4.4:如果簇中心發生變化,則轉到步驟(2),否則迭代結束,輸出聚類結果。
步驟5:根據企業具體情況,綜合關鍵詞效能優化和價值率優化,選擇合適的關鍵詞優化策略達到網站優化目標。
本發明有益效果是:
1,此算法可以精簡關鍵詞分析流程,進而減少整個網站優化工作量。
2,此算法的運行時間複雜度低,處理速度更快。
3、此算法具有更大的利用價值。
4、能幫助網站在短時間內快速提升其關鍵詞的排名。
5、為企業網站帶來一定的流量和詢盤,從而達到理想的網站優化目標。
附圖說明
圖1基於改進的k-means算法實現搜尋引擎關鍵詞優化結構流程圖
圖2改進的k-means算法在聚類分析中的應用流程圖
具體實施方式
為了解決關鍵詞優化實現搜尋引擎優化的技術問題,結合圖1對本發明進行了詳細說明,其具體實施步驟如下:
步驟1:根據企業業務確定核心關鍵詞,利用搜尋引擎搜集相關關鍵字,這些關鍵字在搜尋引擎中有相應數據項,如本國每月搜索量、競爭程度和估算每次點擊費用(CPC)等。
步驟2:結合企業產品和市場分析,篩選降維上述搜索到的相關關鍵字集合;
步驟3:針對篩選降維後的關鍵詞集合,通過搜尋引擎搜索關鍵詞對應的頁面,這裡記錄首頁網頁數和總搜索頁面數,即每個關鍵詞由五維向量再降維為四維的,其具體描述如下:
這裡相關關鍵詞個數為m,既有下列m×5矩陣:
Ni、Ldi、CPCi、NiS、NiY依次為第i個關鍵詞對應的本國每月搜索量、競爭程度、估算每次點擊費用(CPC)、首頁網頁數、總搜索頁面數。
再降維為四維,即
Xi∈(1,2,…,m)為搜索效能,Zi∈(1,2,…,m)為價值率,即為下式:
步驟4:利用改進的k-means算法,對上述關鍵詞進行聚類處理,其具體子步驟如下:
步驟4.1:初始化簇的數目k,從數據對象集合D中隨機選擇k個初始簇中心;
步驟4.2:對每個關鍵詞i(i∈(1,2,…,m)),按目標函數f(i)選擇聚類中心j,其具體計算過程如下:
上式diq為關鍵詞i到空間中全局最優位置的距離,(di1,di2,…,dik)依次為關鍵詞i到k類中心的距離。
上式α、β為權重值,這裡α+β=1,α>β,Xq、XiJ分別為k類關鍵詞彙搜索效能的全局最佳坐標值、局部最佳坐標值,Zq、ZiJ分別為k類關鍵詞彙價值率的全局最佳坐標值、局部最佳坐標值,Nsq、NSiJ分別為k類關鍵詞彙首頁網頁數的全局最佳坐標值、局部最佳坐標值,NYq、NYiJ分別為k類關鍵詞彙總搜索頁面數的全局最佳坐標值、局部最佳坐標值。
步驟4.3:根據分類的結果,重新計算各簇中心;
步驟4.4:如果簇中心發生變化,則轉到步驟(2),否則迭代結束,輸出聚類結果,其具體計算過程如下:
判定函數如下:
上式為關鍵詞i的向量,為類j中心向量,i∈j關鍵詞i屬於類j。
當判定函數最小,或是保持不變,則聚類結束。
步驟5:根據企業具體情況,綜合關鍵詞效能優化和價值率優化,選擇合適的關鍵詞優化策略達到網站優化目標。
基於改進的k-means算法實現搜尋引擎關鍵詞優化,其偽代碼過程
輸入:網站提取的核心關鍵詞
輸出:一系列優化後的高質量關鍵詞。