基於場景模式的圖像多維度標註模型的社區圖像推薦方法與流程
2023-06-15 16:09:21
本發明涉及信息服務領域,特別是一種基於場景模式的圖像多維度標註模型的社區圖像推薦方法。
背景技術:
社區用戶可以通過社區信息推薦功能獲取更全面多樣的信息,同時獲取的信息滿足用戶的個性化需求。社區信息推薦內容主要包括兩方面:用戶可能感興趣的圖像數據和圖像相關聯的場景信息,例如推薦停車狀況主題的圖像數據,同時得到每個推薦圖像對應的場景信息,包括時間、地點、主題內容等。本模塊功能的目的有兩個:一是完善社區信息服務的功能和方式,可以滿足不同用戶的個性化需求,服務方式由被動的信息發布轉換為主動為用戶提供多樣化的信息,使用戶獲得更全面的社區信息;二是提高社區圖像數據的價值和利用率,居民在獲取信息中增強參與社區服務的意願,通過拍照貢獻圖像,形成社區服務良性互動。
中國發明專利CN 105303501A公開了一種基於圖片推薦的社區信息服務方法,包括以下步驟:
(1)獲取用戶查詢輸入的時間、地點和主題關鍵詞,確定用戶關注地點信息;
(2)依據目標時間和用戶關注地點,查詢匹配相關的圖片和信息;
(3)根據用戶關注地點信息確定相關的社會區域,查詢獲取在該社區區域的圖片信息,作為推薦圖片推送給用戶;
(4)通過用戶交互界面,將查詢和推薦結果展示給用戶。
技術實現要素:
本發明需要解決的技術問題是提供一種簡單可靠、實用性強的基於場景模式的圖像多維度標註模型的社區圖像推薦方法。
為解決上述的技術問題,本發明的基於場景模式的圖像多維度標註模型的社區圖像推薦方法,包括以下步驟,
S101:依靠網際網路爬蟲技術和手機APP上傳分享功能,獲取社區圖像數據,保存到本地和伺服器上;
S102:對獲取的數據進行預處理,同時進行語義分析,將圖像語義場景化;
S103:在步驟S102的基礎上,形成社區圖像多維度標註模型;
S104:以社區圖像多維度標註模型為基礎,利用VSM方法對圖像進行相似度計算,得到相似圖像列表;
S105:結合實際場景,利用圖像相似度列表進行圖像的排序推薦。
進一步的,所述步驟S101中對於獲取到的圖像數據和對應的文本數據分別以圖像文件格式和excel格式(資料庫記錄格式)保存到本地和伺服器資料庫。
進一步的,所述步驟S102中將圖像數據和對應的文本數據進行清洗,並同時結合實際情況進行語義分析,將圖像語義場景化。
進一步的,所述步驟S103中在圖像語義場景化的基礎上,抽取選擇圖像的特定主題標籤,形成圖像多維度標註信息。
進一步的,所述步驟S104以圖像多維度標註信息為基礎,對圖像標註信息構造特徵空間,形成特徵向量,最終計算圖像之間的相似度,以上圖像相似度計算能夠為圖像推薦提供可靠的依據支撐。
更進一步的,將圖像數據標籤信息進行類別映射,並將類別中標籤個數作為特徵項詞頻,形成特徵空間;利用TF-IDF模型計算各個特徵項的權重,並且構造特徵向量。
更進一步的,向量相似度常使用向量餘弦夾角來計算。
進一步的,經過對用戶搜索的場景信息的分析,得到用戶感興趣的場景,根據相似度計算方法得到用戶關注信息與其他信息的相關度,然後按相關度排序推薦圖像。
採用上述方法後,本發明對獲取的社區圖像數據格式進行場景構建,在場景構建基礎上,建立場景模式下的社區圖像數據多維度標註模型,之後對社區圖像採用VSM方法進行相似度計算,結合場景相關信息和相似度進行排序推薦。
附圖說明
下面結合附圖和具體實施方式對本發明作進一步詳細的說明。
圖1為本發明基於場景模式的圖像多維度標註模型的社區圖像推薦方法的流程示意圖。
具體實施方式
如圖1所示,本發明的基於場景模式的圖像多維度標註模型的社區圖像推薦方法,包括以下步驟,
S101:依靠網際網路爬蟲技術和手機APP上傳分享功能,獲取社區圖像數據,保存到本地和伺服器上;
S102:對獲取的數據進行預處理,同時進行語義分析,將圖像語義場景化;
S103:在步驟S102的基礎上,形成社區圖像多維度標註模型;
S104:以社區圖像多維度標註模型為基礎,利用VSM方法對圖像進行相似度計算,得到相似圖像列表;
S105:結合實際場景,利用圖像相似度列表進行圖像的排序推薦。
進一步的,所述步驟S101中對於獲取到的圖像數據和對應的文本數據分別以圖像文件格式和excel格式(資料庫記錄格式)保存到本地和伺服器資料庫。
進一步的,所述步驟S102中將圖像數據和對應的文本數據進行清洗,並同時結合實際情況進行語義分析,將圖像語義場景化。
進一步的,所述步驟S103中在圖像語義場景化的基礎上,抽取選擇圖像的特定主題標籤,形成圖像多維度標註信息。
進一步的,所述步驟S104以圖像多維度標註信息為基礎,對圖像標註信息構造特徵空間,形成特徵向量,最終計算圖像之間的相似度,以上圖像相似度計算能夠為圖像推薦提供可靠的依據支撐。
更進一步的,將圖像數據標籤信息進行類別映射,並將類別中標籤個數作為特徵項詞頻,形成特徵空間;利用TF-IDF模型計算各個特徵項的權重,並且構造特徵向量。
更進一步的,向量相似度常使用向量餘弦夾角來計算。
進一步的,經過對用戶搜索的場景信息的分析,得到用戶感興趣的場景,根據相似度計算方法得到用戶關注信息與其他信息的相關度,然後按相關度排序推薦圖像。
雖然以上描述了本發明的具體實施方式,但是本領域熟練技術人員應當理解,這些僅是舉例說明,可以對本實施方式作出多種變更或修改,而不背離本發明的原理和實質,本發明的保護範圍僅由所附權利要求書限定。