商圈識別方法及設備與流程
2023-11-30 12:57:27 1

本申請涉及計算機領域,尤其涉及一種商圈識別方法及設備。
背景技術:
興趣點(Point of Inters t,POI)是指在局部範圍內具有地理標誌意義的建築物,細分為機構,商鋪和單位等。地理信息系統中的興趣點是獨立的地理標誌點,通常按照興趣點類型組織,興趣點相互獨立,每個興趣點主要包括類型、名稱、地址、地理位置坐標等信息,以提供定位、導航、查詢等基於位置的服務(Location Based Service,LBS),但在商業推廣活動及定位數據分析等應用場景下,關注的不僅是獨立的興趣點,更為關注的大量商業消費興趣點所聚集的熱門商圈區域,而這些熱門商圈區域的信息難以直接從興趣點數據中獲取。
現有的商圈生成技術主要基於電子地圖通過以下步驟生成:
步驟一,根據消費者步行時間和步行速度計算出距離臨界值;
步驟二,設定起始中心點,找到地圖上所有與中心點的實際道路距離處於臨界值的點;
步驟三,將所有臨界點連接形成的最小凸包即構成一個商圈。
然而,上述現有基於電子地圖的商圈生成方法在實際的操作中較難應用,主要表現為以下兩點:
第一,上述現有方法以電子地圖作為輸入,處理數據量大,尤其是在大型城市中商圈規模和數量較大的情況下,計算成本高;
第二,上述現有方法以指定中心點和步行臨界距離構成商圈,忽略了商圈的形成是因為大量商業場所的聚集自然形成,並不是從選定中心點向外等距放射延伸,因此該方法生成的「商圈」嚴格意義上應該稱為已知商圈的範 圍計算,並不能真正的對實際中的商圈完成自動識別。
技術實現要素:
本申請的一個目的是提供一種用於商圈識別方法及設備,解決目前無法精確、高效識別出該目標地區內的商圈分布以及各商圈的構成情況的問題。
根據本申請的一個方面,提供了一種商圈識別方法,該方法包括:
根據目標地區內的興趣點的特徵信息,計算每兩個興趣點之間的相似度;
根據所述相似度和預設的興趣點之間的相似度閾值將興趣點進行聚合生成商圈;
根據所述商圈內的興趣點的特徵信息計算並輸出所述商圈的地理範圍。
進一步的,上述方法中,根據所述商圈內的興趣點的特徵信息計算並輸出所述商圈的地理範圍,包括:
基於所述商圈的興趣點密度確定刪選標準,根據所述刪選標準所述對所述商圈包含的所有興趣點進行篩選,刪除所述商圈不符合標準的興趣點,得到最終的商圈;
根據所述最終的商圈內的興趣點的特徵信息計算並輸出所述商圈的地理範圍。
進一步的,上述方法中,基於所述商圈的興趣點密度確定刪選標準,包括:
根據公式M=n/S計算所述商圈的興趣點密度,其中,M表示所述商圈的興趣點密度,n表示所述商圈內的興趣點數目,S表示所述商圈的面積範圍;
所述刪選標準包括:以所述圈內每個興趣點為中心點,如果在該興趣 點周圍局部εM的範圍內沒有其他興趣點存在,則將該興趣點移出該商圈,其中,ε≥1。
進一步的,上述方法中,所述特徵信息包括經度、緯度信息,所述相似度包括根據所述經度、緯度信息計算得到的距離相似度。
進一步的,上述方法中,所述距離相似度根據如下公式Ds=1-L/Z獲取,其中,L表示兩個興趣點間距離,Z表示預設的商圈直徑。
進一步的,上述方法中,所述特徵信息還包括地址信息,所述相似度還包括根據所述地址信息計算得到的地址相似度。
進一步的,上述方法中,所述特徵信息還包括名稱信息,所述相似度還包括根據所述名稱信息計算得到的名稱相似度。
進一步的,上述方法中,根據目標地區內的興趣點的特徵信息,計算每兩個興趣點之間的相似度,包括:
根據每兩個興趣點的所述經度、緯度、地址和名稱信息,計算每兩個興趣點之間的距離、地址和名稱相似度;
對距離、地址和名稱相似度賦予對應的權重,並將距離、地址和名稱相似度根據對應的權重進行加權合成綜合相似度;
根據所述相似度和預設的興趣點之間的相似度閾值將興趣點進行聚合生成商圈,包括:
根據所述綜合相似度和預設的興趣點之間的綜合相似度閾值將興趣點進行聚合生成商圈。
進一步的,上述方法中,根據所述相似度和預設的興趣點之間的相似度閾值將興趣點進行聚合生成商圈,包括:
選取所述目標地區內任意未歸處理的起始興趣點,逐步聚合所述目標地區內與所述起始興趣點滿足所述相似度閾值的其他未處理興趣點,構成所述商圈。
根據本申請的另一個方面,還提供一種商圈識別設備,其中,該設備 包括:
興趣點相似度計算裝置,用於根據目標地區內的興趣點的特徵信息,計算每兩個興趣點之間的相似度;
商圈聚合裝置,用於根據所述相似度和預設的興趣點之間的相似度閾值將興趣點進行聚合生成商圈;
商圈整合輸出模塊,用於根據所述商圈內的興趣點的特徵信息計算並輸出所述商圈的地理範圍。
進一步的,上述設備中,所述設備還包括誤判興趣點篩選裝置,用於基於所述商圈的興趣點密度確定刪選標準,根據所述刪選標準所述對所述商圈包含的所有興趣點進行篩選,刪除所述商圈不符合標準的興趣點,得到最終的商圈;
所述商圈整合輸出模塊,用於根據所述最終的商圈內的興趣點的特徵信息計算並輸出所述商圈的地理範圍。
進一步的,上述設備中,誤判興趣點篩選裝置,用於根據公式M=n/S計算所述商圈的興趣點密度,其中,M表示所述商圈的興趣點密度,n表示所述商圈內的興趣點數目,S表示所述商圈的面積範圍;
並確定所述刪選標準包括:以所述圈內每個興趣點為中心點,如果在該興趣點周圍局部εM的範圍內沒有其他興趣點存在,則將該興趣點移出該商圈,其中,ε≥1。
進一步的,上述設備中,所述特徵信息包括經度、緯度信息,所述相似度包括根據所述經度、緯度信息計算得到的距離相似度。
進一步的,上述設備中,所述興趣點相似度計算裝置,根據如下公式Ds=1-L/Z獲取距離相似度,其中,L表示兩個興趣點間距離,Z表示預設的商圈直徑。
進一步的,上述設備中,所述特徵信息還包括地址信息,所述相似度還包括根據所述地址信息計算得到的地址相似度。
進一步的,上述設備中,所述特徵信息還包括名稱信息,所述相似度還包括根據所述名稱信息計算得到的名稱相似度。
進一步的,上述設備中,所述興趣點相似度計算裝置,用於根據每兩個興趣點的所述經度、緯度、地址和名稱信息,計算每兩個興趣點之間的距離、地址和名稱相似度;及對距離、地址和名稱相似度賦予對應的權重,並將距離、地址和名稱相似度根據對應的權重進行加權合成綜合相似度;
商圈聚合裝置,用於根據所述綜合相似度和預設的興趣點之間的綜合相似度閾值將興趣點進行聚合生成商圈。
進一步的,上述設備中,所述商圈聚合裝置,用於選取所述目標地區內任意未歸處理的起始興趣點,逐步聚合所述目標地區內與所述起始興趣點滿足所述相似度閾值的其他未處理興趣點,構成所述商圈。
與現有技術相比,本申請通過選擇目標地區內的所有商業消費類興趣點作為輸入,通過提取興趣點特徵,對其進行聚類分析,聚合形成商圈結構,能夠實現基於興趣點進行商圈的自動識別,可以根據目標地區內大量獨立的興趣點識別出該地區的商圈分布以及各商圈的構成情況,由於地理信息系統中某一目標地區內的興趣點數量有限,因此本實施例可以快速有效地識別出目標地區的大小商圈分布以及各商圈中的商業興趣點組合構成情況,從而為商業推廣活動、定位數據分析以及城市商業功能區域規劃等應用場景提供支持。
進一步的,由於現實中的商圈在地理位置上大多分布形狀不規則,而僅根據所述相似度和預設的興趣點之間的相似度閾值生成的商圈中可能會有誤判興趣點引入,所以本申請通過增加誤判興趣點篩選,可以保證興趣點歸入對應商圈的準確性。
進一步的,在興趣點相似度計算方面,興趣點中包括了類型、名稱、地址、經度、緯度等信息特徵,考慮到實際商圈中的興趣點,通常在名稱、地址上存在相關性,同時在地理位置上呈現聚集特徵,本申請中選取興趣點的 名稱、地址和經緯度信息來計算相似度從而得到更精確的相似度,便於後續商圈的聚類。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特徵、目的和優點將會變得更明顯:
圖1示出根據本申請一個方面的一種商圈識別方法的流程圖;
圖2示出本申請一實施例的形成的初級商圈的結構圖;
圖3示出根據本申請一優選的實施例的商圈識別方法的流程圖;
圖4示出根據本申請一個優選實施例的合成興趣點的綜合相似度的原理圖;
圖5示出根據本申請一具體的應用實施例的流程圖;
圖6示出根據本申請另一個方面的商圈識別設備的模塊圖;
圖7示出根據本申請一個優選實施例的商圈識別設備的模塊圖。
附圖中相同或相似的附圖標記代表相同或相似的部件。
具體實施方式
下面結合附圖對本發明作進一步詳細描述。
在本申請一個典型的配置中,終端、服務網絡的設備和可信方均包括一個或多個處理器(CPU)、輸入/輸出接口、網絡接口和內存。
內存可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內存等形式,如只讀存儲器(ROM)或快閃記憶體(flash RAM)。內存是計算機可讀介質的示例。
計算機可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現信息存儲。信息可以是計算機可讀指令、數據結構、程序的模塊或其他數據。計算機的存儲介質的例子包括,但不限於相 變內存(PRAM)、靜態隨機存取存儲器(SRAM)、動態隨機存取存儲器(DRAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、快閃記憶體或其他內存技術、只讀光碟只讀存儲器(CD-ROM)、數字多功能光碟(DVD)或其他光學存儲、磁盒式磁帶,磁帶磁碟存儲或其他磁性存儲設備或任何其他非傳輸介質,可用於存儲可以被計算設備訪問的信息。按照本文中的界定,計算機可讀介質不包括非暫存電腦可讀媒體(transitory media),如調製的數據信號和載波。
如圖1所示,根據本申請的一個方面,提供一種商圈識別方法,該方法包括:
步驟S1,根據目標地區內的興趣點的特徵信息,計算每兩個興趣點之間的相似度;
步驟S2,根據所述相似度和預設的興趣點之間的相似度閾值將興趣點進行聚合生成商圈;
步驟S3,根據所述商圈內的興趣點的特徵信息計算並輸出所述商圈的地理範圍。在此,在目標地區內的大量的興趣點中,分析其特徵信息,如地理位置相似程度,識別出在地理位置上呈現出聚集特點的興趣點,並將這些有同一聚集特點的興趣點劃分入同一個商圈,以支持相關的應用場景。本實施例步驟S3是進行商圈信息整合輸出,對經過前述步驟處理後生成的所有商圈,根據其中興趣點的特徵信息,如地理位置坐標特徵,計算確定商圈範圍,並將商圈中的興趣點組織為需要的結構輸出。本實施例通過選擇目標地區內的所有商業消費類興趣點作為輸入,通過提取興趣點特徵,對其進行聚類分析,聚合形成商圈結構,能夠實現基於興趣點進行商圈的自動識別,可以根據目標地區內大量獨立的興趣點識別出該地區的商圈分布以及各商圈的構成情況,由於地理信息系統中某一目標地區內的興趣點數量有限,因此本實施例可以快速有效地識別出目標地區的大小商圈分布以及各商圈中的商業 興趣點組合構成情況,從而為商業推廣活動、定位數據分析以及城市商業功能區域規劃等應用場景提供支持。
本申請的商圈識別方法一優選的實施例中,所述特徵信息包括經度、緯度信息,所述相似度包括根據所述經度、緯度信息計算得到的距離相似度,相應的所述相似度閾值包括距離相似度閾值。具體的,在興趣點相似度計算方面,興趣點中包括了類型、名稱、地址、經度、緯度等信息特徵,考慮到實際商圈中的興趣點,通常在地理位置上呈現聚集特徵,故本實施例中可選取興趣點經緯度信息來計算相似度。
本申請的商圈識別方法一優選的實施例中,所述距離相似度根據如下公式Ds=1-L/Z獲取,其中,L表示兩個興趣點間距離,Z表示預設的商圈直徑。具體的,對於距離相似度的計算,首先根據城市規模設定商圈預估範圍的直徑Z(可以適當擴大,以儘可能包含商圈內興趣點),並計算興趣點間距離L,然後根據式(1)得到興趣點距離相似度Ds。
Ds=1-L/Z (1)
式(1)中,L—興趣點間距離;Z—預設商圈直徑,商圈聚合過程中,在L0,對於合成相似度S產生正向作用,推動興趣點的聚合;在L≥Z時,興趣點距離相似度Ds≤0,對於合成相似度S產生負向作用,阻止興趣點的聚合。
本申請的商圈識別方法一優選的實施例中,步驟S3,根據所述商圈內的興趣點的特徵信息計算並輸出所述商圈的地理範圍,包括:
基於所述商圈的興趣點密度確定刪選標準,根據所述刪選標準所述對所述商圈包含的所有興趣點進行篩選,刪除所述商圈不符合標準的興趣點,得到最終的商圈;
根據所述最終的商圈內的興趣點的特徵信息計算並輸出所述商圈的地理範圍。具體的,本實施例中,由於現實中的商圈在地理位置上大多分布 形狀不規則,而僅根據所述相似度和預設的興趣點之間的相似度閾值生成的商圈中可能會有誤判興趣點引入,所以通過增加誤判興趣點篩選,可以保證興趣點歸入對應商圈的準確性,如距離相似度的引入,使得聚合形成的初級商圈會有以起始興趣點為中心等距放射分布的特點,生成的商圈中可能會有誤判興趣點引入,因此本實施例中設計了誤判興趣節點篩選過程。
本申請的商圈識別方法一優選的實施例中,基於所述商圈的興趣點密度確定刪選標準,包括:
根據公式M=n/S計算所述商圈的興趣點密度,其中,M表示所述商圈的興趣點密度,n表示所述商圈內的興趣點數目,S表示所述商圈的面積範圍;
所述刪選標準包括:以所述圈內每個興趣點為中心點,如果在該興趣點周圍局部εM的範圍內沒有其他興趣點存在,則將該興趣點移出該商圈,其中,ε≥1。具體的,如圖2所示,本實施例中首先根據已經形成的初級商圈21的結構考察初級商圈中所有興趣點22,分別計算經緯度變化區間作為商圈範圍,並計算商圈內興趣點密度M,如式(2):
M=n/S (2)
式(2)中,n—初級商圈內興趣點數目;S—初級商圈面積範圍,
對於商圈內的興趣點,以其自身為中心點,如果在周圍局部εM的範圍內沒有其他興趣點存在,則將該興趣點移出該商圈,從而得到最終的商圈結構,其中,ε根據分析地區規模和具體應用場景選取,ε≥1。
本申請的商圈識別方法一優選的實施例中,所述特徵信息還包括地址信息,所述相似度還包括根據所述地址信息計算得到的地址相似度,相應的所述相似度閾值還包括地址相似度閾值。具體的,同一商圈內的興趣點通常在名稱上類似,如李寧萬達店、耐克萬達店、阿迪達斯萬達店等,在興趣點相似度計算方面,興趣點中包括了類型、名稱、地址、經度、緯度等信息特徵,考慮到實際商圈中的興趣點,通常在地址上存在相關性,同時在 地理位置上呈現聚集特徵,本方案中選取興趣點的地址和經緯度信息來計算相似度,從而得到更精確的相似度,便於後續商圈的聚類。
本申請的商圈識別方法一優選的實施例中,所述特徵信息還包括名稱信息,所述相似度還包括根據所述名稱信息計算得到的名稱相似度,相應的所述相似度閾值還包括名稱相似度閾值。具體的,在興趣點相似度計算方面,興趣點中包括了類型、名稱、地址、經度、緯度等信息特徵,考慮到實際商圈中的興趣點,通常在名稱、地址上存在相關性,同時在地理位置上呈現聚集特徵,本方案中選取興趣點的名稱、地址和經緯度信息來計算相似度從而得到更精確的相似度,便於後續商圈的聚類。
如圖3所示,本申請的商圈識別方法一優選的實施例中,步驟S1,根據目標地區內的興趣點的特徵信息,計算每兩個興趣點之間的相似度,包括:
步驟S11,根據每兩個興趣點的所述經度、緯度、地址和名稱信息,計算每兩個興趣點之間的距離、地址和名稱相似度;
步驟S12,對距離、地址和名稱相似度賦予對應的權重,並將距離、地址和名稱相似度根據對應的權重進行加權合成綜合相似度;
步驟S2,根據所述相似度和預設的興趣點之間的相似度閾值將興趣點進行聚合生成商圈,包括:
步驟S21,根據所述綜合相似度和預設的興趣點之間的綜合相似度閾值將興趣點進行聚合生成商圈。具體的,興趣點中包括了類型、名稱、地址、經度、緯度等信息特徵,考慮到實際商圈中的興趣點,通常在名稱、地址上存在相關性,同時在地理位置上呈現聚集特徵,如圖4所示,本實施例中選取興趣點的名稱、地址和經緯度信息,首先分別構造了名稱相似度NS、地址相似度AS以及距離相似度DS,以從三個不同方面興趣點的聚合標準進行定義,然後可採用AHP(Analytic Hierarchy Process)層次分析法,分析這三 個相似度對於商圈的重要程度並確定各相似度的權重,加權合成興趣點的綜合相似度S,如式(3)所示:
S=αNS+βAS+γDS (3)
式(3)中,NS—興趣點的名稱相似度;AS—興趣點的地址相似度;DS—興趣點的距離相似度;α、β、γ—三個相似度的權重,滿足α+β+γ=1。其中,由於興趣點名稱和地址通常為字符串格式,因此,這兩種相似度的定義均可採用了字符串相似度。
本申請的商圈識別方法一優選的實施例中,步驟S2,根據所述相似度和預設的興趣點之間的相似度閾值將興趣點進行聚合生成商圈,包括:
選取所述目標地區內任意未歸處理的起始興趣點,逐步聚合所述目標地區內與所述起始興趣點滿足所述相似度閾值的其他未處理興趣點,構成所述商圈。具體的,本實施例中根據已經計算得到的兩兩興趣點相似度和設定的相似度閾值,首先選取任意未處理的起始興趣點,然後逐步聚合與起始興趣點滿足相似度閾值的其他未處理興趣點,構成商圈,本實施例可以重複進行多次,從而可能基於多個起始興趣點生成多個商圈,從而將目標區域內的所有商圈都識別出來,例如,目標區域內有100個興趣點,第一次執行本步驟時,識別出其中50個興趣點屬於商圈A,還剩餘50個興趣點不屬於商圈A,此時,可對剩餘50個興趣點重複執行本步驟,得到剩餘50個興趣點有25個興趣點屬於商圈B,還有25個興趣點既不屬於A也不屬於B,後續可重複執行本步驟,判斷是否可將剩餘的25個興趣點歸於其他商圈,直至剩餘的興趣點無法歸入任何商圈才結束重複本步驟。
本申請一具體的應用實施例中,可選取目標地區商業消費相關的興趣點作為輸入,對其進行計算分析,最終得到該目標地區的商圈分布情況,主要由興趣點相似度計算、初級商圈聚合、誤判興趣點篩選、商圈信息整合輸出共四個步驟組合而成,方案流程圖如圖5所示:
步驟S51,在興趣點相似度計算中,根據輸入興趣點的名稱、地址、經緯度特徵計算得到興趣點之間的相似度矩陣;
步驟S52,在商圈聚合中,根據設定的興趣點相似度閾值將興趣點進行聚合形成初級商圈結構;
步驟S53,在誤判興趣點篩選中,對已經形成的初級商圈結構,基於該初級商圈的興趣點密度,對其包含的所有興趣點進行篩選,刪除不符合標準的興趣點,得到最終的商圈結構;
步驟S54,在商圈信息整合輸出模塊中,對已經生成的商圈,根據其內部興趣點的特徵信息,計算商圈的地理範圍,標記內部興趣點,輸出結果。
如圖6所示,根據本申請的另一面,還提供一種商圈識別設備,該設備100包括:
興趣點相似度計算裝置1,用於根據目標地區內的興趣點的特徵信息,計算每兩個興趣點之間的相似度;
商圈聚合裝置2,用於根據所述相似度和預設的興趣點之間的相似度閾值將興趣點進行聚合生成商圈;
商圈整合輸出模塊3,用於根據所述商圈內的興趣點的特徵信息計算並輸出所述商圈的地理範圍。在此,在目標地區內的大量的興趣點中,分析其特徵信息,如地理位置相似程度,識別出在地理位置上呈現出聚集特點的興趣點,並將這些有同一聚集特點的興趣點劃分入同一個商圈,以支持相關的應用場景。本實施例商圈整合輸出模塊3對經過前述裝置處理後生成的所有商圈,根據其中興趣點的特徵信息,如地理位置坐標特徵,計算確定商圈範圍,並將商圈中的興趣點組織為需要的結構輸出。本實施例通過選擇目標地區內的所有商業消費類興趣點作為輸入,通過提取興趣點特徵,對其進行聚類分析,聚合形成商圈結構,能夠實現基於興趣點進行商圈的自動識別,可以根據目標地區內大量獨立的興趣點識別出該地區的商圈分布以及各商圈的構成情況,由於地理信息系統中某一目標地區內的興趣點數量有限,因此 本實施例可以快速有效地識別出目標地區的大小商圈分布以及各商圈中的商業興趣點組合構成情況,從而為商業推廣活動、定位數據分析以及城市商業功能區域規劃等應用場景提供支持。
本申請的商圈識別設備一優選的實施例中,所述特徵信息包括經度、緯度信息,所述相似度包括根據所述經度、緯度信息計算得到的距離相似度,相應的所述相似度閾值包括距離相似度閾值。具體的,在興趣點相似度計算方面,興趣點中包括了類型、名稱、地址、經度、緯度等信息特徵,考慮到實際商圈中的興趣點,通常在地理位置上呈現聚集特徵,故本實施例中可選取興趣點經緯度信息來計算相似度。
本申請的商圈識別設備一優選的實施例中,所述興趣點相似度計算裝置1,根據如下公式Ds=1-L/Z獲取距離相似度,其中,L表示兩個興趣點間距離,Z表示預設的商圈直徑。具體的,對於距離相似度的計算,首先根據城市規模設定商圈預估範圍的直徑Z(可以適當擴大,以儘可能包含商圈內興趣點),並計算興趣點間距離L,然後根據式(1)得到興趣點距離相似度Ds。
Ds=1-L/Z (1)
式(1)中,L—興趣點間距離;Z—預設商圈直徑,商圈聚合過程中,在L0,對於合成相似度S產生正向作用,推動興趣點的聚合;在L≥Z時,興趣點距離相似度Ds≤0,對於合成相似度S產生負向作用,阻止興趣點的聚合。
如圖7所示,本申請的商圈識別設備一優選的實施例中,所述設備100還包括誤判興趣點篩選裝置4,用於基於所述商圈的興趣點密度確定刪選標準,根據所述刪選標準所述對所述商圈包含的所有興趣點進行篩選,刪除所述商圈不符合標準的興趣點,得到最終的商圈;
所述商圈整合輸出模塊3,用於根據所述最終的商圈內的興趣點的特 徵信息計算並輸出所述商圈的地理範圍。具體的,本實施例中,由於現實中的商圈在地理位置上大多分布形狀不規則,而僅根據所述相似度和預設的興趣點之間的相似度閾值生成的商圈中可能會有誤判興趣點引入,所以通過增加誤判興趣點篩選,可以保證興趣點歸入對應商圈的準確性,如距離相似度的引入,使得聚合形成的初級商圈會有以起始興趣點為中心等距放射分布的特點,生成的商圈中可能會有誤判興趣點引入,因此本實施例中設計了誤判興趣節點篩選過程。
本申請的商圈識別設備一優選的實施例中,誤判興趣點篩選裝置4,用於根據公式M=n/S計算所述商圈的興趣點密度,其中,M表示所述商圈的興趣點密度,n表示所述商圈內的興趣點數目,S表示所述商圈的面積範圍;
並確定所述刪選標準包括:以所述圈內每個興趣點為中心點,如果在該興趣點周圍局部εM的範圍內沒有其他興趣點存在,則將該興趣點移出該商圈,其中,ε≥1。具體的,如圖2所示,本實施例中首先根據已經形成的商圈的結構考察初級商圈中所有興趣點,分別計算經緯度變化區間作為商圈範圍,並計算商圈內興趣點密度M,如式(2):
M=n/S (2)
式(2)中,n—初級商圈內興趣點數目;S—初級商圈面積範圍,
對於商圈內的興趣點,以其自身為中心點,如果在周圍局部εM的範圍內沒有其他興趣點存在,則將該興趣點移出該商圈,從而得到最終的商圈結構,其中,ε根據分析地區規模和具體應用場景選取,ε≥1。
本申請的商圈識別設備一優選的實施例中,所述特徵信息還包括地址信息,所述相似度還包括根據所述地址信息計算得到的地址相似度,相應的所述相似度閾值還包括地址相似度閾值。具體的,同一商圈內的興趣點通常在名稱上類似,如李寧萬達店、耐克萬達店、阿迪達斯萬達店等,在興趣點相似度計算方面,興趣點中包括了類型、名稱、地址、經度、緯度等 信息特徵,考慮到實際商圈中的興趣點,通常在地址上存在相關性,同時在地理位置上呈現聚集特徵,本方案中選取興趣點的地址和經緯度信息來計算相似度,從而得到更精確的相似度,便於後續商圈的聚類。
本申請的商圈識別設備一優選的實施例中,所述特徵信息還包括名稱信息,所述相似度還包括根據所述名稱信息計算得到的名稱相似度,相應的所述相似度閾值還包括名稱相似度閾值。具體的,在興趣點相似度計算方面,興趣點中包括了類型、名稱、地址、經度、緯度等信息特徵,考慮到實際商圈中的興趣點,通常在名稱、地址上存在相關性,同時在地理位置上呈現聚集特徵,本方案中選取興趣點的名稱、地址和經緯度信息來計算相似度從而得到更精確的相似度,便於後續商圈的聚類。
本申請的商圈識別設備一優選的實施例中,所述興趣點相似度計算裝置1,用於根據每兩個興趣點的所述經度、緯度、地址和名稱信息,計算每兩個興趣點之間的距離、地址和名稱相似度;及對距離、地址和名稱相似度賦予對應的權重,並將距離、地址和名稱相似度根據對應的權重進行加權合成綜合相似度;
所述商圈聚合裝置2,用於根據所述綜合相似度和預設的興趣點之間的綜合相似度閾值將興趣點進行聚合生成商圈。具體的,興趣點中包括了類型、名稱、地址、經度、緯度等信息特徵,考慮到實際商圈中的興趣點,通常在名稱、地址上存在相關性,同時在地理位置上呈現聚集特徵,如圖4所示,本實施例中選取興趣點的名稱、地址和經緯度信息,首先分別構造了名稱相似度NS、地址相似度AS以及距離相似度DS,以從三個不同方面興趣點的聚合標準進行定義,然後可採用AHP(Analytic Hierarchy Process)層次分析法,分析這三個相似度對於商圈的重要程度並確定各相似度的權重,加權合成興趣點的綜合相似度S,如式(3)所示:
S=αNS+βAS+γDS (3)
式(3)中,NS—興趣點的名稱相似度;AS—興趣點的地址相似度;DS—興趣點的距離相似度;α、β、γ—三個相似度的權重,滿足α+β+γ=1。其中,由於興趣點名稱和地址通常為字符串格式,因此,這兩種相似度的定義均可採用了字符串相似度。
本申請的商圈識別設備一優選的實施例中,所述商圈聚合裝置2,用於選取所述目標地區內任意未歸處理的起始興趣點,逐步聚合所述目標地區內與所述起始興趣點滿足所述相似度閾值的其他未處理興趣點,構成所述商圈。具體的,本實施例中根據已經計算得到的兩兩興趣點相似度和設定的相似度閾值,首先選取任意未處理的起始興趣點,然後逐步聚合與起始興趣點滿足相似度閾值的其他未處理興趣點,構成商圈,本實施例可以重複進行多次,從而可能基於多個起始興趣點生成多個商圈,從而將目標區域內的所有商圈都識別出來,例如,目標區域內有100個興趣點,第一次執行本步驟時,識別出其中50個興趣點屬於商圈A,還剩餘50個興趣點不屬於商圈A,此時,可對剩餘50個興趣點重複執行本步驟,得到剩餘50個興趣點有25個興趣點屬於商圈B,還有25個興趣點既不屬於A也不屬於B,後續可重複執行本步驟,判斷是否可將剩餘的25個興趣點歸於其他商圈,直至剩餘的興趣點無法歸入任何商圈才結束重複本步驟。
綜上所述,本申請通過選擇目標地區內的所有商業消費類興趣點作為輸入,通過提取興趣點特徵,對其進行聚類分析,聚合形成商圈結構,能夠實現基於興趣點進行商圈的自動識別,可以根據目標地區內大量獨立的興趣點識別出該地區的商圈分布以及各商圈的構成情況,由於地理信息系統中某一目標地區內的興趣點數量有限,因此本實施例可以快速有效地識別出目標地區的大小商圈分布以及各商圈中的商業興趣點組合構成情況,從而為商業推廣活動、定位數據分析以及城市商業功能區域規劃等應用場景提供支持。
進一步的,由於現實中的商圈在地理位置上大多分布形狀不規則,而僅根據所述相似度和預設的興趣點之間的相似度閾值生成的商圈中可能會有 誤判興趣點引入,所以本申請通過增加誤判興趣點篩選,可以保證興趣點歸入對應商圈的準確性。
進一步的,在興趣點相似度計算方面,興趣點中包括了類型、名稱、地址、經度、緯度等信息特徵,考慮到實際商圈中的興趣點,通常在名稱、地址上存在相關性,同時在地理位置上呈現聚集特徵,本申請中選取興趣點的名稱、地址和經緯度信息來計算相似度從而得到更精確的相似度,便於後續商圈的聚類。
顯然,本領域的技術人員可以對本申請進行各種改動和變型而不脫離本申請的精神和範圍。這樣,倘若本申請的這些修改和變型屬於本申請權利要求及其等同技術的範圍之內,則本申請也意圖包含這些改動和變型在內。
需要注意的是,本發明可在軟體和/或軟體與硬體的組合體中被實施,例如,可採用專用集成電路(ASIC)、通用目的計算機或任何其他類似硬體設備來實現。在一個實施例中,本發明的軟體程序可以通過處理器執行以實現上文所述步驟或功能。同樣地,本發明的軟體程序(包括相關的數據結構)可以被存儲到計算機可讀記錄介質中,例如,RAM存儲器,磁或光碟機動器或軟磁碟及類似設備。另外,本發明的一些步驟或功能可採用硬體來實現,例如,作為與處理器配合從而執行各個步驟或功能的電路。
另外,本發明的一部分可被應用為電腦程式產品,例如電腦程式指令,當其被計算機執行時,通過該計算機的操作,可以調用或提供根據本發明的方法和/或技術方案。而調用本發明的方法的程序指令,可能被存儲在固定的或可移動的記錄介質中,和/或通過廣播或其他信號承載媒體中的數據流而被傳輸,和/或被存儲在根據所述程序指令運行的計算機設備的工作存儲器中。在此,根據本發明的一個實施例包括一個裝置,該裝置包括用於存儲電腦程式指令的存儲器和用於執行程序指令的處理器,其中,當該電腦程式指令被該處理器執行時,觸發該裝置 運行基於前述根據本發明的多個實施例的方法和/或技術方案。
對於本領域技術人員而言,顯然本發明不限於上述示範性實施例的細節,而且在不背離本發明的精神或基本特徵的情況下,能夠以其他的具體形式實現本發明。因此,無論從哪一點來看,均應將實施例看作是示範性的,而且是非限制性的,本發明的範圍由所附權利要求而不是上述說明限定,因此旨在將落在權利要求的等同要件的含義和範圍內的所有變化涵括在本發明內。不應將權利要求中的任何附圖標記視為限制所涉及的權利要求。此外,顯然「包括」一詞不排除其他單元或步驟,單數不排除複數。裝置權利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟體或者硬體來實現。第一,第二等詞語用來表示名稱,而並不表示任何特定的順序。