新四季網

一種基於混合多種模式的廢舊行業推薦系統以及其方法與流程

2023-04-25 21:21:47 2


本發明涉及計算機應用
技術領域:
,尤其涉及一種基於混合多種模式的廢舊行業推薦系統以及其方法。
背景技術:
:目前,隨著網絡信息量爆炸式的遞增,消費者面臨眾多選擇、未知的領域、過載的信息時,往往無所適從;然而與此同時,產品的商家也在苦苦尋覓合適的用戶,尋找最便捷的渠道,而解決這兩類矛盾的最好工具就是推薦系統。數據是一切推薦系統的基礎。準確的數據對於良好的推薦效果,如同一片文章的標題對於文章內容的作用。基於模型的協同過濾推薦,基於樣本的用戶喜好信息,訓練一個推薦模型,然後根據實時的用戶喜好的信息進行預測,計算推薦,這種方法對於一些特殊品味的用戶不能給予很好的推薦;基於內容的推薦,它的核心思想是根據推薦物品或內容的元數據,發現物品或者內容的相關性,然後基於用戶以往的喜好記錄,推薦給用戶相似的物品,這種方法物品相似度的衡量標準只考慮到了物品本身,有一定的片面性。因此,單純使用某一個推薦算法在推薦結果的精度和多樣性方面存在不足,針對存在的問題,本發明提出一種基於混合多種模式的廢舊行業推薦系統以及其方法,能夠使得推薦結果更準確,更能滿足用戶的需求。技術實現要素:有鑑於此,本發明的主要目的在於提供一種基於混合多種模式的廢舊行業推薦系統以及其方法,在用戶購買商品時候,給用戶推薦感興趣的商品信息,更能滿足用戶的個性化需求。為達到上述目的,本發明的技術方案是這樣實現的:A模塊:關聯推薦、熱點推薦、TopN推薦三種混合推薦模式;B模塊:初始化推薦結果;C模塊:過濾、結果排序、推薦解釋、最終的推薦結果。其中所述模塊A中的關聯推薦,根據商品內容的相似性進行推薦,其中根據商品內容進行推薦需要將原來保存在索引中的原始數據導入到現在的資料庫中;所述的TopN推薦,也就是瀏覽歷史推薦,每一個用戶某一段時間內點擊數TopN商品推薦;所述的熱點推薦,將實時熱銷商品推薦給用戶,給每一個用戶推薦可能感興趣的數據。對網站常用用戶,關聯推薦和TopN推薦設置較高權重,熱點推薦次之;對無任何記錄用戶,將熱點推薦設置較高的權重,通過分析用戶所屬的適應人群,也可進行關聯推薦。進一步地,所述的TopN推薦主要包括以下兩個策略:TopN策略:1)最近30天的點擊日誌;2)總點擊數TopN的數據;3)總點擊數不少於某個閾值;4)平均每一個人的點擊次數不少於某個閾值;連續遞增策略:1)最近30天的點擊日誌;2)連續若干天的點擊呈現遞增趨勢;3)連續的天數不少於某個閾值;4)平均每一天的點擊次數不少於某個閾值。所述模塊B初始化推薦結果,返回的推薦結果為推薦解釋:resysExplain,供求編號:M_gqinfo.gqid,產品分類:M_gqinfo.classid,供求分類:M_gqinfo.type,信息靜態頁面地址:M_gqinfo.htmlurl,圖片:M_gqinfo.photo,標題:M_gqinfo.title,新舊程度:M_gqinfo.xjcd,供貨數量:M_gqinfo.pronum,型號規格:M_gqinfo.proxh,交易價格:M_gqinfo.proprice產品所在地:M_gqinfo.province,存放方式:M_gqinfo.cffs,權限:sys_user.rankid,會員編號:sys_user.uid,用戶名:sys_user.uname,企業名稱:sys_user.comname,聯繫人:sys_user.linkman,性別:sys_user.sex,公司所在地:sys_user.comaddress,德保指數:czizhi_rz.frrz,是否通過德保認證:czizhi_rz;所述模塊C主要步驟如下:步驟C1、推薦數據的過濾主要包括:過濾掉用戶已經訪問過的頁面,過濾掉用戶沒有訪問權限的頁面,過濾掉重複數據;步驟C2、結果排序主要是對推薦的結果進行排序,按照網頁的受歡迎程度排序,也就是網頁被點擊過的次數;步驟C3、推薦解釋主要是總的點擊次數:totalClickNum;每一個用戶的點擊數據:List<Entry>userClickNumForAll;第一天的點擊時間:DatesDate;步驟C4、最終的推薦結果主要是經過步驟C1、C2、C3處理過的推薦數據,以更清晰準確的方式呈現給用戶。進一步地,本發明對推薦結果進行評估,主要通過以下三個評估標準:1)訓練數據與評分:在本發明推薦系統中,提取一小段真實數據作為測試數據來仿真;2)查準率:是top推薦中間有「好」結果的比例;3)查全率:是「好」結果出現在top推薦中的比例。本發明所提供的混合多種模式個性化推薦方法,具有以下優點:1)混合了關聯推薦、熱點推薦、TopN推薦三種模式,提高了推薦結果的精度;2)更能符合用戶需求,使得推薦的商品購買率增加,從而提高商品的訂單轉化率;3)增加推薦的多樣性,使特殊喜好的用戶得到推薦。附圖說明圖1為本發明混合多種模式的廢舊行業推薦系統流程示意圖;圖2為本發明混合多種模式的廢舊行業推薦系統製作訓練集示意圖;圖3為本發明混合多種模式的推薦行為交互過程示意圖。具體實施方式下面結合附圖及本發明的實施例對本發明的混合多種模式的個性化推薦方法作進一步詳細的說明。該系統A模塊中關聯推薦主要採用聚類計算相似商品的方法,主要包含以下幾個流程:1)創建一個實體類SimilarityData,設定三個欄位row(行)、column(列)、similarityValue(相似度),其中所述實體類SimilarityData主要作用是三元組,矩陣中的某一個元素,用來保存稀疏矩陣;其中所述的相似度在進行聚類計算之前,通過訓練集測試得出將最小相似度設定minSimilarity為0.8較為合適;2)創建實例SimilarityData[][]allSimilarityData,用來保存的是所有的相似數據;3)創建數組int[]countArray,用來保存每一條數據相似的數據的總數;4)初始化矩陣;5)計算兩兩之間的相似度,其中所述的相似度,採用Jaccard係數計算兩個向量的相似度;6)和第row條數據相似的數據的總數;7)給相似數據賦值;其中所述的給相似數據賦值的時候,當有一條新的數據的時候:如果所在行的數據還沒有填滿,則直接插入到最後一個元素的後面;如果所在行的數據已經填滿,則用當前數據和所在行的最小元素進行比較,如果大於最小的元素則替換,否則不做任何操作。進一步地,計算相似商品所需數據來源於訓練集,訓練集製作流程如圖2所示,主要包含以下過程:1)資料庫讀取的數據進行分詞,並將分詞之後的數據以空格形式存在默認文件夾resys,其中在讀取數據之前還需要判斷是否需要更新訓練集;2)讀取分詞之後的訓練數據;3)使用TF-IDF和LDA混合模型進行特徵抽取,用於聚類;其中所述TF-IDF這種語言模型主要是用詞彙的統計特徵來作為特徵集,每個特徵都能夠說得出物理意義,抽取效果不錯,然而,這些特徵的一個關鍵問題,在於並沒有對樣本特徵進行很大程度的壓縮,沒有提取出關鍵的信息。也就是訓練好的分類器只在訓練它的數據集中有效,換一個數據集效果就會很差;所述LDA就是文本的稀疏表示,代表的這一類語言模型叫做TopicModel。認為單詞量再大的文本,其文章主題就那麼幾個。一個K個主題的LDA模型,可以把一個文本壓縮成K維的向量:每一個維度就是該文本屬於該主題的概率,這個向量也叫做TopicProportion。然後得到壓縮後的K維數據集後,再使用任何的分類器,甚至最簡單的餘弦相似性指標,都可以得到非常好的分類效果;因此,本發明將兩者結合起來進行特徵抽取效果更佳。4)使用TF對商品進行向量化,同時初始化LDA主題模型,並輸出每一個主題對應的所有詞;其中文本的特徵,可能是topic,也可能是word;5)聚類,計算相似商品。本發明為解決個性化推薦的問題,主要採用了以下技術,下面對這些技術進行簡單介紹。1)分詞技術。本發明中主要採用IK分詞,主要在製作訓練集時候使用,其中IK分詞使用了「正向迭代最細粒度切分算法」,簡單說來就是:Segmenter會逐字識別詞元,本發明對IK進行重寫,將IKAnalyzerSegmenter類中將useSmart設定true,其中所述的useSmart當其值為false為非智能分詞,細粒度輸出所有可能的切分結果;當其值為true為智能分詞,合併數詞和量詞,對分詞結果進行歧義判斷。2)聚類技術。本發明主要用在計算相似商品時候使用了聚類技術,聚類相識度計算商品的算法首先創建一個實體類SimilarityData,設定三個欄位row(行)、column(列)、similarityValue(相似度),其中所述實體類SimilarityData主要作用是三元組,矩陣中的某一個元素,用來保存稀疏矩陣,其次初始化矩陣,最後計算商品之間的相似度。3)文本特徵抽取技術。本發明主要使用了兩種特徵抽取方式,一種是使用TF-IDF和LDA混合模型進行特徵抽取,用於聚類。4)推薦結果排序技術。本發明將推薦結果按照totalClickNum降序排列,totalClickNum就是按照網頁點擊次數,也就是受歡迎程度。參考圖3,本發明的個性化推薦方法實施例如下。下面介紹該方法的幾個典型應用場景:應用場景一:本發明的推薦行為的交互過程,如下表1所示。表1元數據含義舉例API接口中的對應詞用戶名執行此次推薦的用戶名用戶名是「張三」username推薦時刻系統執行推薦的時刻「張三」在時刻「2016-12-2515:55:00」登陸系統,「15:55:00」即是系統執行推薦的時刻recommendTime被推薦頁面針對該次推薦,系統給出的推薦結果頁面的ID「張三」在時刻「2016-12-2515:55:00」登陸系統,被推薦頁面ID為「1,3,47,556,1007」等recommendPageID被推薦頁面排序序號推薦結果呈現給用戶時,每個頁面的排序序號ID號為「1,3,47,556,1007」的5篇商品作為推薦結果呈現出來時的排序是「556,3,47,1,1007」那麼它們對應的排序號為「1,2,3,4,5」recommendPageRankID頁面被點擊時刻點擊推薦結果頁面時的時刻用戶點擊ID號為「556」的時刻是「2012-08-0515:56:24」clickedTime頁面駐留時間在每個被點擊頁面上駐留的時間用戶查看ID號為「556」的商品,在時刻「2016-12-2515:57:26」離開,駐留時間為「62」秒用戶每次登陸調用setRecommendInfo,點擊推薦頁面時調用updateRecommendInfo,例如:張三在時刻「2016-12-2516:00:00」登陸系統,系統向他推薦了3個頁面,其頁面序號為「1,3,47」,排序序號為「2,3,1」,此時調用setRecommendInfo(StringuserName,DaterecommendTime,long[]recommendPageID,long[]recommendPageRankID),recommendPageID存儲3個頁面序號,recommendPageRankID存儲3個頁面的排序序號。應用場景二:本發明的推薦方法應用在某廢舊行業系統詳情頁展示關聯推薦,其中,所述詳情頁是在該廢舊網站搜索框輸入關鍵詞,點擊搜索,進入廢舊網的產品列表頁,然後點擊某一個商品,進入商品詳情頁。輸入:廢鋼鐵回收,相關推薦結果展示如下:{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"9cdddb1a9a3146a5984510e7057613e6","pmCode":null,"name":"煉鋼廢鋼鬥招標公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-11","releaseTime":"2016-11-08","num":0,"address":"河北省-邢臺市","endTime":"2016-11-1100:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"d9e18ea7fbb94a19adf5d8b470cc0d43","pmCode":null,"name":"報廢宿營車廢鋼競賣公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-16","releaseTime":"2016-11-08","num":0,"address":"北京市-市轄區","endTime":"2016-11-1600:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"c74d9959c6f64b71af8e532107ed0714","pmCode":null,"name":"報廢貨車廢鋼競賣公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-15","releaseTime":"2016-11-08","num":0,"address":"北京市-市轄區","endTime":"2016-11-1500:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"303c762d475d4bb28053ccb270ab00e6","pmCode":null,"name":"煤業公司320噸廢鋼絲繩芯輸送帶轉讓公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-21","releaseTime":"2016-11-08","num":0,"address":"寧夏回族自治區-銀川市","endTime":"2016-11-2100:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"5721a3dad2bb4fac94e6c5359bf5cd44","pmCode":null,"name":"300噸廢鋼絲繩轉讓公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-21","releaseTime":"2016-11-08","num":0,"address":"寧夏回族自治區-銀川市","endTime":"2016-11-2100:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"a3dad8ab200c42ff8d734a2f7ed61b10","pmCode":null,"name":"2000噸廢鋼(中型)轉讓公告","imgUrl":null,"price":null,"valuation":"50-100萬","status":null,"time":"2016-11-21","releaseTime":"2016-11-08","num":0,"address":"寧夏回族自治區-銀川市","endTime":"2016-11-2100:00:00","bidCompany":""},{"isLoolApply":"","applyStatus":1,"lookApply":1,"auctionStatus":"","code":"31e00b9286454f35b70b2f4bce1adbd8","pmCode":null,"name":"物流公司雜廢鋼630噸報廢設備物資一批處置公告","imgUrl":null,"price":null,"valuation":"無","status":null,"time":"2016-11-16","releaseTime":"2016-11-08","num":0,"address":"湖北省-武漢市","endTime":"2016-11-1500:00:00","bidCompany":""}以上所述,僅為本發明的較佳實施例而已,並非用於限定本發明的保護範圍。所述領域的技術人員可以清楚地了解到,為了描述的方便和簡潔,上述描述的系統、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。在本發明所提供的幾個實施例中,應該理解到,所揭露的系統、裝置和方法,可以通過其它的方式實現。例如,以上所描述到的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件可以結合或可以集成到另一個系統,或一些特徵可以忽略,或不執行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性、機械或其它的形式。所述作為分離部件說明的單元可以是或者也可以是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現,可以採用軟體功能單元的形式實現。需要說明的是,本領域普通技術人員可以理解實現上述實施例方法中的全部或部分流程,是可以通過電腦程式來指令相關的硬體來完成,所述的程序可存儲於一計算機可讀取存儲介質中,該程序在執行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質可為磁碟、光碟、只讀存儲記憶體(Read-OnlyMemory,ROM)或隨機存儲記憶體(RandomAccessMemory,RAM)等。以上對本發明所提供的基於混合多種模式的廢舊行業推薦系統以及其方法進行了詳細介紹,本文中應用了具體實施例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本發明的方法及其核心思想;同時,對於本領域的一般技術人員,依據本發明的思想,在具體實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。當前第1頁1&nbsp2&nbsp3&nbsp

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀