一種基於隱語義概率模型的個性化服務推薦系統及方法
2023-10-09 07:45:59
一種基於隱語義概率模型的個性化服務推薦系統及方法
【專利摘要】本發明涉及一種基於隱語義概率模型的個性化服務推薦系統及方法,屬於服務計算【技術領域】,包括以下步驟:確定用於評價一系列功能相似服務的性能優劣的QoS指標體系;建立用戶、用戶指標偏好以及服務情境三者之間的隱語義概率模型;收集系統內不同用戶在不同的服務情境下使用不同功能的服務時通過與系統交互提供的指標偏好信息,並存入歷史經驗資料庫;用已收集的數據訓練隱語義概率模型的參數;當用戶不熟悉某種服務情境,但需要在該服務情景下調用特定功能服務時,利用已訓練的隱語義概率模型對該用戶的指標偏好進行預測;根據預測出的用戶個性化的QoS指標偏好,對候選服務進行綜合篩選,從中選出最貼近該用戶需求的服務,從而實現個性化服務推薦。
【專利說明】一種基於隱語義概率模型的個性化服務推薦系統及方法
【技術領域】
[0001]本發明屬於服務計算【技術領域】,具體涉及一種基於隱語義概率模型的個性化服務推薦系統及方法。
【背景技術】
[0002]隨著網際網路技術的飛速發展,服務計算技術得到了廣泛應用,Web服務就是這樣一種分布運行於Internet之上、支持不同平臺之間互操作的鬆耦合軟體系統,它主要通過「發布-查找-綁定」的模式允許服務使用者和提供者之間形成鬆散的綁定關係,這為服務的使用奠定了基礎。但web服務的使用者和提供者相分離的特性,增加了服務使用者理解服務的難度,同時隨著Internet上運行的web服務數量不斷增多,服務使用者需要從眾多功能相似的服務中選出最符合自身需求的一個或一組服務,這對大多數缺乏專業知識的服務使用者來說無疑是一項繁重的任務,所以發展有效的服務推薦技術是服務選擇的必然需求。
[0003]經過對現有技術的檢索發現,中國專利申請號200710162463.8,記載了一種自適應服務推薦設備,該裝置主要包括:語義分析裝置、服務選擇裝置、服務推薦裝置;語義分析裝置用於對用戶的查詢進行語義上的分析;服務選擇裝置用於找出與語義分析後的查詢對應的選擇的服務,並根據選擇的服務更新服務相關資料庫;最後服務推薦裝置用於利用獲取的選擇的服務來查找服務相關資料庫以向用戶推薦相關服務。
[0004]進一步檢索發現,中國專利申請號200910236492.3,記載了一種個性化服務推薦系統和方法,該方法主要包括:用戶信息收集器監控在終端進行的各種操作信息,並進行預處理後存入用戶信息資料庫,若用戶信息資料庫方法更新,則啟動用戶行為分析器進行分析;用戶行為分析器掃描用戶信息資料庫,提取新的用戶信息並計入資源信息資料庫,計算新的推薦策略並記入推薦策略資料庫;上下文感知處理器感知用戶的當前上下文,輸出當前的上下文描述信息,啟動個性化推薦處理器;個性化推薦處理器接收來自上下文感知處理器的消息後,獲得當前上下文信息,通過檢索推薦策略資料庫,獲得匹配的左右推薦策略,並按照左右推薦策略通過檢索資源信息資料庫,匹配合適的資源信息,實時生成個性化推薦服務。
[0005]進一步檢索發現,中國專利申請號20121014234.2記錄了一種基於上下文感知和用戶偏好的空間信息服務匹配方法,在用戶的服務請求和候選空間信息服務的功能性匹配和非功能性匹配的基礎上,考慮上下文敏感的用戶偏好,計算出用戶服務需求與智能空間中的各候選空間信息服務的匹配度,然後依據匹配度將候選空間信息服務推薦給用戶;雖然用戶可能具有固定的或者重複的偏好,但這些偏好不是在任何時候都相關,該發明基於上下文感知和用戶偏好的空間信息服務匹配方法從上下文的角度對用戶偏好進行精簡,剔除與用戶無關的用戶偏好;該發明從功能匹配和非功能匹配兩個方面進行匹配度計算,提高空間信息服務匹配的準確率。
[0006]進一步檢索發現,中國專利申請號201210253884.2記錄了一種用於Web服務推薦的個性化搜索方法,包括以下步驟:步驟1,預處理WSDL文檔:通過去除停用詞和提取詞幹兩個預處理步驟,形成詞袋;步驟2,抽取用戶興趣:使用改進的TF-1DF公式計算詞袋中的每一個詞的權重,並乘以該詞的時間衰減因子,得到新的權重;選擇權重由大至小前k個詞作為用戶的興趣詞,以及每個詞的對應權重,組成k維的用戶興趣向量;步驟3,計算興趣相似度:設定相似度閾值,超過閾值的用戶入選為目標用戶的鄰居用戶;步驟4,排序服務檢索結果,根據鄰居用戶的相似度及其選擇服務的次數計算服務的推薦預測值,並將檢索結果按照推薦預測值降序排列,從而得到個性化搜索結果。
[0007]上述的方法都涉及了個性化的服務推薦,但很少針對Web服務的非功能屬性篩選服務以滿足用戶的個性化需求,服務的非功能屬性往往是服務性能的主要體現,所以如何利用服務的非功能屬性客觀地評價服務的性能同時又能滿足不同用戶的個性化需求是服務推薦需要解決的問題。
【發明內容】
[0008]本發明技術解決問題:針對現有技術存在的不足,提供一種基於隱語義概率模型的個性化服務推薦系統及方法,旨在為用戶在不熟悉的服務情境下提供指標偏好預測,從而完成基於多維QoS指標的服務綜合排序,為用戶提供個性化的服務推薦結果。
[0009]本發明的技術解決方案:一種個性化服務推薦中基於隱語義概率模型的用戶指標偏好預測方法,具體步驟如下:
[0010]步驟1、確定評價服務性能優劣的服務QoS指標體系
[0011 ] 所述的服務QoS指標體系是指整個Web服務系統統一採用的用於評價一系列功能相似服務性能優劣所用QoS指標的集合,不同的系統可以根據需要選取適當的QoS指標組成自己的QoS指標體系用於評價服務的性能優劣;
[0012]步驟2、建立用戶、用戶指標偏好以及服務情境三者之間的隱語義概率模型
[0013]所述的用戶指標偏好是指用戶對步驟I中所述服務QoS指標體系中各個QoS指標的偏好程度,對每個QoS指標的偏好程度值介於O到I之間,並且對各個QoS指標的偏好值總和為I ;所述的服務情境是指在何種場景下使用何種功能的服務,每一個服務情境e用三元組(WDWhW3)表示,其中W1表示服務完成的與業務無關的基本功能,如視頻功能、導航功能等,W2表示用戶使用該功能的服務完成的具體業務活動,如學術會議、軍事導航等,W3表示用戶調用服務的終端設備,如手機、PC機等;所述的用戶、用戶指標偏好、服務情境三者之間的隱語義概率模型是指單個用戶以不同的概率依賴不同的用戶隱類而存在,單則服務情境以不同的概率依賴不同的服務情境隱類存在,指標偏好同時以不同的概率同時依賴不同的用戶隱類和服務情境隱類存在的概率模型,模型的圖像化表示如7所示。
[0014]所述的用戶隱類是指非人為事先確定的而是從歷史經驗數據中學習得到的用戶聚簇;所述的服務情境隱類是指非人為事先確定的而是從歷史經驗數據中學習得到的服務情境聚簇;
[0015]步驟3、收集不同用戶在不同的服務情境下使用不同功能服務時自主提供的指標偏好信息,作為歷史經驗數據存入資料庫,為訓練步驟2中建立的隱語義概率模型的參數作準備,存儲格式為(用戶,服務情境、指標偏好)三元組;
[0016]步驟4、用EM算法及已收集的歷史經驗數據訓練隱語義概率模型的參數[0017]所述的隱語義概率模型的參數是指所有用戶隱類的先驗概率P(Ui) ( )、服務情境隱類取,E2,, EjI先驗概率P (Ej) ( 隱類Ui的情況下單個用戶u出現的條件概率P (UlUi) (l^i^ I)、給定一個服務情境隱類Ej的情況下單則服務情境e出現的條件概率P (e I Ej) (I ^ j ^ J)、給定用戶隱類Ui和服務情境隱類Ej的情況下用戶指標偏好向量r出現的概率P(I^Ej) ( 其中I,J分別表示用戶隱類和服務情境隱類的總個數,i,j分別表示用戶隱類和服務情境隱類的編號;
[0018]步驟5、獲得用戶需要服務推薦的請求,包括個人信息、服務推薦所依賴的服務情境;
[0019]步驟6、用已訓練的隱語義概率模型預測指定用戶在特定服務情境下的未知指標偏好;
[0020]步驟7、根據預測出的用戶個性化的QoS指標偏好,對候選服務進行綜合篩選,從而選出最貼近該用戶需求的服務,將推薦結果返回給用戶。
[0021]所述步驟3中收集歷史經驗數據的過程如下:
[0022](I)用戶在其熟悉的服務情境下調用熟悉的web服務時可以直接與系統交互,使用層次分析法給出自己給出對各個指標偏好的兩兩比較結果,建立比較矩陣;
【權利要求】
1.一種基於隱語義概率模型的個性化服務推薦系統,其特徵在於包括: 歷史信息收集模塊:收集不同用戶在不同服務情境下通過層次分析法自主提供的指標偏好比較矩陣,檢查該矩陣滿足一致性約束後,計算該矩陣最大特徵值對應的特徵向量,歸一化後得出不同用戶在不同服務情境下的指標偏好,並將用戶,服務情境、指標偏好以三元組形式存入資料庫,為隱語義概率模型參數訓練模塊提供歷史訓練數據; 隱語義概率模型參數訓練模塊:從資料庫中獲取歷史信息收集模塊收集的用戶,服務情境、指標偏好三元組作為訓練樣本,根據事先設定的隱語義概率模型參數初值,利用EM算法在訓練數據上迭代訓練模型參數,直至模型參數收斂,保存所得訓練參數,提供給個性化指標偏好預測模塊; 用戶服務推薦請求模塊:該模塊獲取用戶登錄是提供的個性資料信息及用戶登錄後錄入的需要進行服務推薦的服務情境信息,最後將這兩項信息提供給個性化指標偏好預測模塊; 個性化指標偏好預測模塊:獲取用戶服務推薦請求模塊提供的用戶個人信息和服務情境信息,結合隱語義概率模型參數訓練模塊提供的已經訓練好的模型參數,預測該用戶在該服務情境下的指標偏好,並將預測的指標偏好提供過個性化服務推薦模塊; 個性化服務推薦模塊:接收來自個性化指標偏好模塊的用戶指標偏好,及來自用戶服務推薦請求模塊的服務情境信息,獲取適用於該服務情境的所有功能相似的服務,及服務各維度的QoS指標值,與用戶個性化的指標偏好作點積,給出服務的綜合排序,作為推薦列表返回給用戶,用戶根據推薦的結果選擇自己感興趣的項目進行關注。
2.根據權利要求1所述的基於隱語義概率模型的個性化服務推薦系統,其特徵在於:所述隱語義概率模型參數訓練 模塊實現過程: (1)從資料庫中獲取歷史信息收集模塊存入的用戶、服務情境、指標偏好三元組,作為歷史訓練數據; (2)人工設置用戶隱類和服務情境隱類的個數,以及模型的參數初值,包括用戶隱類和服務情境隱類的先驗概率,單個用戶在給定不同用戶隱類時的條件概率,單則服務情境在給定不同服務情境隱類時的條件概率,以及各個指標偏好在給定不同用戶隱類和不同服務情境隱類時的正態分布均值和方差; (3)用EM算法,結合歷史訓練數據,對模型參數進行迭代訓練,直至收斂,保存模型參數,提供給個性化指標偏好預測模塊。
3.一種基於隱語義概率模型的個性化服務推薦方法,其特徵在於實現步驟如下: 步驟1、確定評價服務性能優劣的服務QoS指標體系 所述的服務QoS指標體系是指整個Web服務系統統一採用的用於評價一系列功能相似服務性能優劣所用QoS指標的集合,不同的系統可以根據需要選取適當的QoS指標組成自己的QoS指標體系用於評價服務的性能優劣; 步驟2、建立用戶、用戶指標偏好以及服務情境三者之間的隱語義概率模型 所述的用戶指標偏好是指用戶對步驟I中所述服務QoS指標體系中各個QoS指標的偏好程度,對每個QoS指標的偏好程度值介於O到I之間,並且對各個QoS指標的偏好值總和為I ;所述的服務情境是指在何種場景下使用何種功能的服務,每一個服務情境e用三元組(W1, W2, W3)表示,其中W1表示服務完成的與業務無關的基本功能,如視頻功能、導航功能等,W2表示用戶使用該功能的服務完成的具體業務活動,W3表示用戶調用服務的終端設備; 所述的用戶、用戶指標偏好、服務情境三者之間的隱語義概率模型是指單個用戶以不同的概率依賴不同的用戶隱類而存在,單則服務情境以不同的概率依賴不同的服務情境隱類存在,指標偏好同時以不同的概率同時依賴不同的用戶隱類和服務情境隱類存在的概率模型, 所述的用戶隱類是指非人為事先確定的而是從歷史經驗數據中學習得到的用戶聚簇;所述的服務情境隱類是指非人為事先確定的而是從歷史經驗數據中學習得到的服務情境聚簇; 步驟3、收集不同用戶在不同的服務情境下使用不同功能服務時自主提供的指標偏好信息,作為歷史經驗數據存入資料庫,為訓練步驟2中建立的隱語義概率模型的參數作準備,存儲格式為用戶,服務情境、指標偏好三元組; 步驟4、用EM算法及已收集的歷史經驗數據訓練隱語義概率模型的參數 所述的隱語義概率模型的參數是指所有用戶隱類的先驗概率P(Ui)(I≤i≤I)、服務情境隱類取,E2,, EjI先驗概率P(Ej) (I≤j≤J)、給定一個用戶隱類仏的情況下單個用戶u出現的條件概率P (UlUi) (l≤i≤ I)、給定一個服務情境隱類Ej的情況下單則服務情境e出現的條件概率P (e I Ej) (I ≤ j ≤ J)、給定用戶隱類Ui和服務情境隱類Ej的情況下用戶指標偏好向量r出現的概率P(IHUpEj) (I≤i≤I,I≤j≤J);其中I,J分別表示用戶隱類和服務情境隱類的總個數,i,j分別表示用戶隱類和服務情境隱類的編號; 步驟5、獲得用戶需要服務推薦的請求,包括個人信息、服務推薦所依賴的服務情境; 步驟6、用已訓練的隱語義概率模型預測指定用戶在特定服務情境下的未知指標偏好; 步驟7、根據預測出的用戶個性化的QoS指標偏好,對候選服務進行綜合篩選,從而選出最貼近該用戶需求的服務,將推薦結果返回給用戶。
4.根據權利要求3所述的基於隱語義概率模型的個性化服務推薦方法,其特徵在於:所述步驟3中收集歷史經驗數據的過程如下: (1)用戶在其熟悉的服務情境下調用熟悉的web服務時,直接與系統交互,使用層次分析法給出自己給出對各個指標偏好的兩兩比較結果,建立比較矩陣;
5.根據權利要求3所述的基於隱語義概率模型的個性化服務推薦方法,其特徵在於:所述步驟4中隱語義概率模型的參數訓練過程如下, (I)從資料庫中取出所有的用戶、服務情境、指標偏好三元組作為訓練數據,是用戶在其熟悉的服務情境下利用層次分析法給出的個性化指標偏好權值,每個三元組(U,e, r)表示用戶u在服務情境e下對服務的各個QoS指標的偏好權重為r,r是一個K維向量(r1; r2,..., rK),為簡單起見,假設權重向量r的每一維相互獨立並且服從正態分布,則聯合概率P (u,e,r)用下面兩個公式表示,
6.根據權利要求3所述的基於隱語義概率模型的個性化服務推薦方法,其特徵在於:步驟6中利用已訓練的隱語義概率模型預測用戶指標偏好的實現方式如下: (1)用戶Ut登陸服務推薦系統,提供需要進行服務推薦的服務情境一; (2)推薦系統獲取用戶的個人數據及其提供的服務情境信息,用下面的公式對該用戶在該服務情境下的各個QoS指標偏好進行獨立預測:
7.根據權利要求3所述的基於隱語義概率模型的個性化服務推薦方法,其特徵在於:步驟7中根據預測出的用戶個性化的QoS指標偏好,對候選服務進行篩選的過程如下:用戶Ut在服務情境J下已得到多個功能相似的候選服務,假設每個服務的各QoS指標上的性能可有其他方法得到,記為(qi,q2,...,qK),每一個服務的總得分採用R^r\-ql+r\-q2 +...+ fK _ ^表示,最後根據各個服務的總得分給出服務的排序,作為服務推薦的依據。
【文檔編號】G06F17/30GK103473291SQ201310392446
【公開日】2013年12月25日 申請日期:2013年9月2日 優先權日:2013年9月2日
【發明者】彭啟民, 胡堰, 胡曉惠 申請人:中國科學院軟體研究所