一種目標用戶位置數據的處理方法及裝置的製作方法
2023-05-29 21:09:31 1
專利名稱:一種目標用戶位置數據的處理方法及裝置的製作方法
技術領域:
本發明涉及計算機應用技術領域,尤其涉及一種目標用戶位置數據的處理方法及
裝置
背景技術:
目前的信息推送技術可以通過自動傳送信息給目標用戶,來減少目標用戶在網絡上搜索的時間。具體可以根據目標用戶的興趣來搜索、過濾信息,並將其定期推給目標用戶,幫助目標 用戶高效率地發掘有價值的信息。目前應用較多的是根據目標用戶的位置數據來向目標用戶推送其所在位置附近的各類購物、旅遊、住宿以及商店信息等。推送伺服器獲取到的目標用戶的位置數據大多是通過基站定位、wifi熱點定位以及GPS (Global Positioning System,全球定位系統)定位等定位技術獲取。通過這些現有方式獲取的位置數據主要為包括目標用戶當前的位置坐標的數據。僅根據這些原始的位置數據,伺服器無法根據用戶的行為執行相應的基於用戶位置的服務。
發明內容
本發明實施例所要解決的技術問題在於,提供一種目標用戶位置數據的處理方法及裝置,可快速、準確地對目標用戶位置數據進行分析處理得到用於描述目標用戶行為的信息,以便於實現根據用戶行為進行相應的基於用戶位置的服務。為了解決上述技術問題,本發明實施例提供了一種目標用戶位置數據的處理方法,包括:獲取目標用戶在預設時間範圍閾值內的各位置數據,得到位置數據集合,其中,所述位置數據集合中每一個位置數據的數據格式中至少包括位置坐標、發生時間值;根據每一個位置數據中包括的位置坐標,確定所述目標用戶的聚集區;根據確定的聚集區以及每一個位置數據包括的發生時間值,確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,所述用戶行為描述信息包括該目標用戶在不同時間場景下在確定的對應聚集區的出現頻率。相應地,本發明實施例還提供了一種目標用戶位置數據的處理裝置,包括:獲取模塊,用於獲取目標用戶在預設時間範圍閾值內的各位置數據,得到位置數據集合,其中,所述位置數據集合中每一個位置數據的數據格式中至少包括位置坐標、發生時間值;確定模塊,用於根據每一個位置數據中包括的位置坐標,確定所述目標用戶的聚集區;處理模塊,用於根據確定的聚集區以及每一個位置數據包括的發生時間值,確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,所述用戶行為描述信息包括該目標用戶在不同時間場景下在確定的對應聚集區的出現頻率。本發明實施例能夠在用戶原始的位置數據的基礎上確定用戶的聚集區,根據用戶聚集區快速、準確地得到關於該用戶的行為描述信息,方便後續根據用戶的行為較好地實現針對該用戶的信息推送應用等基於用戶位置的服務。
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1是本發明實施例的一種目標用戶位置數據的處理方法的流程示意圖;圖2是本發明實施例的另一種目標用戶位置數據的處理方法的流程示意圖;圖3是本發明實施例的獲取目標用戶的位置數據的其中一種方法的流程示意圖;圖4是本發明實施例的確定 目標用戶的聚集區的其中一種具體方法的流程示意圖;圖5是確定目標用戶的聚集區的其中一種示例圖;圖6是本發明實施例的確定目標用戶的用戶行為描述信息的其中一種具體方法的流程示意圖;圖7是本發明實施例的一種目標用戶位置數據的處理裝置的結構示意圖;圖8是本發明實施例的另一種目標用戶位置數據的處理裝置的結構示意圖;圖9是圖8中的獲取模塊的其中一種具體結構示意圖;圖10是圖8中的確定模塊的其中一種具體結構示意圖;圖11是圖8中的處理模塊的其中一種具體結構示意圖。
具體實施例方式下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。請參見圖1,是本發明實施例的一種目標用戶位置數據的處理方法的流程示意圖,本發明實施例的所述方法可應用於各類型的基於LBS(Location Based Service,基於位置的服務)的信息推送伺服器或者應用在用於對員工工作進行管理的伺服器中,具體的,本發明實施例的所述方法包括:SlOl:獲取目標用戶在預設時間範圍閾值內的各位置數據,得到位置數據集合,其中,所述位置數據集合中每一個位置數據的數據格式中至少包括位置坐標、發生時間值;可以通過採用GPS、基站定位等技術實時地對目標用戶的移動終端等設備進行定位,目標用戶的位置數據可對應存儲在其所使用的各類應用伺服器中,例如即時通訊伺服器、社交應用伺服器等。在預設時間範圍閾值到達時,從各類伺服器中獲取預設時間範圍閾值內,即預設的統計周期內目標用戶的歷史位置數據,例如獲取目標用戶當月的各個時間點的位置數據,具體可以以每天的整點時間進行統計,獲取每天的整點時間時,該目標用戶的位置數據。
每一個位置數據的格式至少包括位置坐標和發生時間值,具體的,位置數據的格式可以為:uin-lat-lng-time-type,其中uin:號碼(目標用戶的標識、如即時通信帳號等),Iat:經諱度(位置坐標),Ing:精度,time:發生時刻,type:業務類型。在獲取到目標用戶的位置數據後,可以進行初步的數據清理操作得到所述位置數據集合,清理操作包括對獲取到的各位置信息進行去重操作,例如根據發生時間值清理掉一些在相同或者相近時間點處於同一位置的位置數據,和/或不完整信息的去除操作,例如將位置坐標不全或者發生時刻丟失的位置數據去除。S102:根據所述位置數據集合中每一個位置數據中包括的位置坐標,確定所述目標用戶的聚集區;在所述S102中,根據每一個位置數據中的位置坐標來確定聚集區,聚集區的確定原則為:每一個聚集區中任何兩個位置坐標之間的距離在一定距離範圍內(例如I千米的距離內),並且聚集區內的位置坐標點的數量大於一定閾值(例如20個)。在所述S102中確定出的聚集區可能包括多個,其中可能包括該目標用戶工作、學習、生活對於的聚集區。S103:根據確定的聚集區以及每一個位置數據包括的發生時間值,確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,所述用戶行為描述信息包括該目標用戶在不同時間場景下在確定的對應聚集區的出現頻率。根據該目標用戶的辦公區域所在的區域,將該目標用戶的聚集區中落入在為辦公區域預置區域內的聚集區作為工 作聚集區,在為學習區域預置的區域內的聚集區作為學習聚集區,等等。然後根據位置數據中包括的發送時間值,計算該目標用戶在工作日期間和非工作日期間等時間場景下,出現在所述工作聚集區、學習聚集區以及生活聚集區的頻率,得到該目標用戶的用戶行為描述信息。另外,時間場景還可以為8點到12點的上午時間場景、12點到14點的中午時間場景以及14點子18點的下午時間場景,以及晚上時間場景等。例如,假設確定的工作聚集區中的位置數據有200個數據,而根據每一個位置數據的發生時間值,確定出在工作日期間在工作聚集區中的發生時間值為早上8點的位置數據有20個,那麼,由於在本次統計周期內(例如本月)工作日一共有22天,那麼,該目標用戶在早上8點鐘在工作聚集區中的出現頻率為20/22*100%=91%。那麼對於發生時間值在早上8點鐘、且位於所述工作聚集區中的每一個位置數據的用戶行為描述信息為91%。進一步的,如果統計得到在本次統計周期內非工作日有8天,而在非工作日期間在工作聚集區中的發生時間值為早上8點的位置數據有2個,那麼,該目標用戶在早上8點鐘在工作聚集區中的非工作日出現頻率為2/8*100%=25%。本發明實施例能夠在用戶原始的位置數據的基礎上確定用戶的聚集區,根據用戶聚集區快速、準確地得到關於該用戶的行為描述信息,方便後續根據用戶的行為較好地實現針對該用戶的信息推送應用等基於用戶位置的服務。再請參見圖2,是本發明實施例的另一種目標用戶位置數據的處理方法的流程示意圖,本發明實施例的所述方法包括:S201:獲取目標用戶在預設時間範圍閾值內的各位置數據,得到位置數據集合,其中,所述位置數據集合中每一個位置數據的數據格式中至少包括位置坐標、發生時間值;S202:根據所述位置數據集合中每一個位置數據中包括的位置坐標,確定所述目標用戶的聚集區;
S203:根據確定的聚集區以及每一個位置數據包括的發生時間值,確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,所述用戶行為描述信息包括該目標用戶在不同時間場景下在確定的對應聚集區的出現頻率。S204:根據確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,得到所述目標用戶的位置狀態數據;所述位置狀態數據的數據格式中至少包括位置坐標、發生時間值以及用戶行為描述信息。上述的S201至S204的實現方式與上一實施例中的SlOl至S103的實現方式相同,在此不贅述。在所述S204中,輸出的每一個位置數據的位置狀態數據的數據格式具體可以為:uin、lat、lng、wt0_c、…、wt23_c、nwt0_c、...、nwt23_c (uin:目標用戶,Iat:諱度,lng:精度,wtn_c:工作日時間模式中η時段的頻率也即置信度,nwtn_c:非工作日時間模式中η時段的也即置信度)。根據該格式的位置數據,可以方便後續直接統計確定目標用戶的工作情況。
具體的,請參見圖3,是本發明實施例的獲取目標用戶的位置數據的其中一種方法的流程示意圖,本發明實施例的所述方法對應於SlOl或S201,所述方法包括:S301:獲取目標用戶在預設時間範圍閾值內的各位置信息;S302:對獲取到的各位置信息進行清理操作得到所述目標用戶在預設時間範圍閾值內的位置數據集合,所述清理操作包括對獲取到的各位置信息進行去重操作和/或不完整信息的去除操作。可以從手機即時通訊、手機地圖、手機社交網等業務伺服器中抽取該目標用戶的歷史位置數據,並且針對每個位置數據的特點,設置轉換邏輯,並且最終轉換成本系統的數據格式:uin-lat-lng-time-type (uin:號碼,Iat:經糹韋度,Ing:精度,time:發生時刻,type:業務類型)。完成位置數據的抽取和轉換後,由於是在不同的伺服器中獲取的目標用戶的位置數據,所以,需要根據發生的時間間隔去除重複的位置數據,例如,將兩者相隔I分鐘且位置坐標相同的位置數據去除一個,僅保留一個位置數據。由於數據在伺服器中存儲以及傳輸的過程中可能導致數據丟失,因此需要去除殘缺的髒數據,例如將位置坐標缺失或者發生時間值缺失的位置數據去掉。得到最終的所述目標用戶的位置數據。再請參見圖4,是本發明實施例的確定目標用戶的聚集區的其中一種具體方法的流程示意圖,本發明實施例的所述方法對應於上述S102或者S202,所述方法包括:S401:根據所述位置數據集合中每一個位置數據的位置坐標,並根據預設的坐標點距離閾值,確定多個初始聚集區;S402:將所述多個初始聚集區中位置坐標的數量大於預設的數量閾值的初始聚集區作為所述目標用戶的聚集區。具體的,可以將所述目標用戶的歷史位置數據(如統計周期一個月內的位置數據)進行層次聚類,計算出聚集的區域,排除散點,計算的規則為:聚集區域之間的無重合,聚集區域內的密度>20 (即歷史位置點數>20),且各點距離中心不超過lkm。根據該規則,可以從可能的多個聚集區中,得到密度相對較大的聚集區。例如,可以參見圖5,是確定的聚集區的其中一種示例圖,圖5中,X軸坐標代表經度,Y軸坐標代表緯度。在圖5中確定了兩個聚集區,可能包括目標用戶的位於預置的辦公區域內的工作聚集區以及位於預置的生活區域內的生活聚集區。再請參見圖6,是本發明實施例的確定目標用戶的用戶行為描述信息的其中一種具體方法的流程示意圖,本發明實施例的所述方法可應用於上述的S103或者S203,所述方法包括:S501:將所述目標用戶的聚集區中的位於預置的工作區域內聚集區標記為工作聚集區;同樣可以得到用戶的生活聚集區、學習聚集區等等。S502:計算工作日期間位於所述工作聚集區中的每一個位置數據的出現頻率,並計算非工作日期間位於所述工作聚集區中的每一個位置數據的出現頻率;即根據工作聚集區中每一個位置數據的發生時間值,確定在預設的工作日期間(根據當月日曆確定)和非工作日期間的出現在工作聚集區中的頻率。S503:計算工作日期間位於所述工作聚集區之外的每一個位置數據的出現頻率,並計算非工作日期間位於所述工作聚集區之外的每一個位置數據的出現頻率。即根據工作聚集區以外的每一個位置數據中的發生時間值,確定在預設的工作日期間(根據當月日曆確定)和非工作日期間的出現在工作聚集區外的頻率。在本發明實施例中,可以簡單地將目標用戶的聚集區區分為工作聚集區以及非工作聚集區,以此來對目標用戶的位置數據進行關於工作情況的標記以完成目標用戶工作情況的統計,在其他 實施例中,還可以進一步地細化為工作聚集區、生活聚集區、學習聚集區等,以對目標用戶的位置數據進行關於工作、生活、學習等情況的標記以完成目標用戶工作、生活、學習等情況的統計,實現過程與所述S501至S503類似,通過根據用戶生活的區域和學習的區域得到相應的生活聚集區以及學習聚集區,然後對相應聚集區中的位置數據進行標記和統計。具體的,下圖展示了一個用戶在2012年11月份在辦公區域的時間模式,工作日期間是指傳統的周一至周五,而非工作日則為周末以及法定節假日等時期,用於進行統計的裝置或者伺服器可以根據系統時間以及內置的日曆表來區分工作日期間和非工作日期間,並確定當月總的工作日和總的非工作日。非工作日期間表明用戶基本在早上8點就到公司了,12點後外出(可能是就餐),50%的可能在13點回到辦公室,14點繼續工作,67%的可能是18點下班,33%的是可能要加班;從非工作日模式可以看到,用戶在11月份有過2次加班,I次是從15點-18點,另外一次是從15-17點;表I:
權利要求
1.一種目標用戶位置數據的處理方法,其特徵在於,包括: 獲取目標用戶在預設時間範圍閾值內的各位置數據,得到位置數據集合,其中,所述位置數據集合中每一個位置數據的數據格式中至少包括位置坐標、發生時間值; 根據所述位置數據集合中每一個位置數據中包括的位置坐標,確定所述目標用戶的聚集區; 根據確定的聚集區以及每一個位置數據包括的發生時間值,確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,所述用戶行為描述信息包括該目標用戶在不同時間場景下在確定的對應聚集區的出現頻率。
2.如權利要求1所述的方法,其特徵在於,所述獲取目標用戶在預設時間範圍閾值內的各位置數據,得到位置數據集合,包括: 獲取目標用戶在預設時間範圍閾值內的各位置信息; 對獲取到的各位置信息進行清理操作,得到所述目標用戶在預設時間範圍閾值內的位置數據集合,所述清理操作包括對獲取到的各位置信息進行去重操作和/或不完整信息的去除操作。
3.如權利要求2所述的方法,其特徵在於,所述根據所述位置數據集合中每一個位置數據中包括的位置坐標,確定所述目標用戶的聚集區,包括: 根據所述位置數 據集合中每一個位置數據的位置坐標,並根據預設的坐標點距離閾值,確定多個初始聚集區; 將所述多個初始聚集區中位置坐標的數量大於預設的數量閾值的初始聚集區作為所述目標用戶的聚集區。
4.如權利要求3所述的方法,其特徵在於,所述根據確定的聚集區以及每一個位置數據包括的發生時間值,確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,包括: 將所述目標用戶的聚集區中位於預置的工作區域內的聚集區標記為工作聚集區; 計算工作日期間位於所述工作聚集區中的每一個位置數據的出現頻率,並計算非工作日期間位於所述工作聚集區中的每一個位置數據的出現頻率; 計算工作日期間位於所述工作聚集區之外的每一個位置數據的出現頻率,並計算非工作日期間位於所述工作聚集區之外的每一個位置數據的出現頻率。
5.如權利要求1-4任意一項所述的方法,其特徵在於,還包括: 根據確定的所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,得到所述目標用戶的位置狀態數據;所述位置狀態數據的數據格式中至少包括位置坐標、發生時間值以及用戶行為描述信息。
6.一種目標用戶位置數據的處理裝置,其特徵在於,包括: 獲取模塊,用於獲取目標用戶在預設時間範圍閾值內的各位置數據,得到位置數據集合,其中,所述位置數據集合中每一個位置數據的數據格式中至少包括位置坐標、發生時間值; 確定模塊,用於根據所述位置數據集合中每一個位置數據中包括的位置坐標,確定所述目標用戶的聚集區; 處理模塊,用於根據確定的聚集區以及每一個位置數據包括的發生時間值,確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,所述用戶行為描述信息包括該目標用戶在不同時間場景下在確定的對應聚集區的出現頻率。
7.如權利要求6所述的裝置,其特徵在於,所述獲取模塊包括: 獲取單元,用於獲取目標用戶在預設時間範圍閾值內的各位置信息; 清理單元,用於對獲取到的各位置信息進行清理操作,得到所述目標用戶在預設時間範圍閾值內的位置數據集合,所述清理操作包括對獲取到的各位置信息進行去重操作和/或不完整信息的去除操作。
8.如權利要求7所述的裝置,其特徵在於,所述確定模塊包括: 第一確定子單元,用於根據所述位置數據集合中每一個位置數據的位置坐標,並根據預設的坐標點距離閾值,確定多個初始聚集區; 第二確定子單元,用於將所述多個初始聚集區中位置坐標的數量大於預設的數量閾值的初始聚集區作為所述目標用戶的聚集區。
9.如權利要求7所述的裝置,其特徵在於,所述處理模塊包括: 標記單元,用於將所述目標用戶的聚集區中位於預置的工作區域內的聚集區標記為工作聚集區; 第一計算單元,用於計算工作日期間位於所述工作聚集區中的每一個位置數據的出現頻率,並計算非工作日期間位於所述工作聚集區中的每一個位置數據的出現頻率; 第二計算單元,用於計算工作日期間位於所述工作聚集區之外的每一個位置數據的出現頻率,並計算非工作日期間位於所述工作聚集區之外的每一個位置數據的出現頻率。
10.如權利要求6-9任一項所述的裝置,其特徵在於,還包括: 狀態數據獲取模塊,用於根據確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,得到所述目標用戶的位置狀態數據;所述位置狀態數據的數據格式中至少包括位置坐標、發生時間值以及用戶行為描述信息。
全文摘要
本發明實施例公開了一種目標用戶位置數據的處理方法及裝置,其中,所述方法包括獲取目標用戶在預設時間範圍閾值內的各位置數據,得到位置數據集合,其中,位置數據集合每一個位置數據的數據格式中至少包括位置坐標、發生時間值;根據每一個位置數據中包括的位置坐標,確定所述目標用戶的聚集區;根據確定的聚集區以及每一個位置數據包括的發生時間值,確定所述目標用戶在每一個位置數據對應位置處的用戶行為描述信息,所述用戶行為描述信息包括該目標用戶在工作日期間和非工作日期間在對應聚集區的出現頻率。採用本發明,可對目標用戶位置數據進行分析處理得到用於描述目標用戶行為的信息,以便實現根據用戶行為進行相應的基於用戶位置的服務。
文檔編號H04W4/02GK103227821SQ20131011597
公開日2013年7月31日 申請日期2013年4月3日 優先權日2013年4月3日
發明者李玉煌, 賀鵬, 胡勇, 陳川, 聶晶 申請人:騰訊科技(深圳)有限公司