一種基於旅遊大數據的遊客流量預測及峰值調控方法與流程
2023-05-06 10:22:26
本發明涉及大數據預測領域,特別涉及一種基於旅遊大數據的遊客流量預測及峰值調控方法。
背景技術:
截止2015年底,我國國內旅遊人數超過41億人次,旅遊收入約4.13萬億元,旅遊業對GDP的綜合貢獻超過教育、銀行、汽車行業,佔比高達10.51%。根據國家旅遊局公布的2016年國慶節假日旅遊市場信息,僅國慶黃金周期間全國共接待遊客5.93億。旅遊市場的繁榮在推動旅遊產業發展的同時,對景區和旅遊城市提出了更高的要求,如何利用數據有效獲得遊客流量數據預測,有預見性的進行遊客的疏導調控,從而提高景區的服務質量,提升遊客的旅遊體驗。
目前,為解決上述問題,國家旅遊局已發出通知要求各地建立健全景區遊客流量控制機制。但是從目前全國各地的旅遊業發展情況來看,景區和旅遊城市尚缺乏完善的遊客流量預測與峰值調控機制。傳統的遊客流量預測大多只從門票銷售入手,數據來源單一,沒有充分利用旅遊智慧化產生的旅遊大數據,統計結果具有片面性,統計準確性不足。缺乏有效的遊客流量預測預警數據支撐,使得景區和旅遊城市的遊客調控方法仍停留在廣播提示、交通管制、消費價格調控等傳統路徑上,沒有充分利用網際網路手段,實現線上和線下的互動,進行遊客流量的引導,調控景區峰值遊客數量。
技術實現要素:
本發明的目的在於克服現有技術中的遊客流量預測方法缺乏數據支撐,統計結果準確性不足等缺陷,從而提供一種基於旅遊大數據的遊客流量預測及峰值調控方法。
為了實現上述目的,本發明提供了一種基於旅遊大數據的遊客流量預測方法,包括:
步驟101)、採集旅遊大數據,建立預測樣本;其中,
所述旅遊大數據包括歷史客流數據y1、社交網絡熱力數據y2、OTA瀏覽數據y3、周邊城市遊客數據y4、交通流量數據y5;所述預測樣板包括一個或多個時間段內的旅遊大數據;
步驟102)、建立客流量預測模型,並基於所述預測樣本求取所述客流量預測模型中的參數;其中,所述客流量預測模型為:
其中的Z為預測客流量,αk為對應樣本數據的計算參數,αk為預測修訂常量,e是去除影響後的隨機誤差,yk為預測樣板中的數據;αk、αk為所述客流量預測模型中的待求參數;
步驟103)、由步驟102)所得到的客流量預測模型計算遊客流量的預測初始值;
步驟104)、根據景區在預測日的天氣預報校正遊客流量的預測值。
上述技術方案中,在所述的步驟102)中,採用多元線性回歸的最小二乘法求取所述客流量預測模型中的參數。
上述技術方案中,所述步驟104)包括:
首先根據預測景區的天氣預報,計算人體舒適度指數,該指數的計算公式如下:
ssd=(1.818t+18.18)(0.88+0.002f)+(t-32)/(45-t)-3.2v+18.2;
其中,t為平均氣溫,f為相對溼度,v為風速;
然後根據ssd值校正參數β;具體包括:若50<ssd<76,β=1.25,若25<ssd<51或75<ssd<86,β=1;若ssd85,β=0.85;
最後在得到校正參數β後,對預測初始值進行校正,取得校正後的景區預測客流量Zβ:
Zβ=βZ;
Z為預測初始值。
本發明還提供了一種遊客流量峰值調控方法,包括:
步驟201)、將所述基於旅遊大數據的遊客流量預測方法所得到的某一景區的遊客流量預測值與該景區的接待遊客能力進行比較,根據比較結果將該景區劃分為峰值調控景區或餘量充足景區;其中,
所述峰值調控景區為遊客流量預測值大於景區的接待遊客能力,所述餘量充足景區為遊客流量預測值小於景區的接待遊客能力;
步驟202)、計算峰值調控景區與餘量充足景區之間的單體調控阻力係數;其中,所述單體調控阻力係數是衡量峰值調控景區與餘量充足景區之間調控遊客難度的無量綱指標,由景區間距離、景區間消費差額、景區吸引力比值共同決定;
步驟203)、基於步驟202)得到的單體調控阻力係數構建峰值調控計算模型;其中,所述峰值調控計算模型要求峰值遊客調控的總阻力最小,其表達式為:
其中C為總的調控阻力,cij為從峰值調控景區pi調度遊客到餘量充足景區vj的單體調控阻力係數,xij為從峰值調控景區pi調度遊客到餘量充足景區vj的遊客量;
步驟204)、基於步驟203)所建立的峰值調控計算模型,計算預計客流分配情況,確定遊客峰值調控景區對應的餘量充足景區;
步驟205)、基於步驟204)的結果進行遊客誘導。
上述技術方案中,所述步驟202)包括:
步驟202-1)、峰值調控景區pi與餘量景區vj之間進行調度,計算兩景區之間的單體調控交通消費tij;其中,dij為景區之間的距離,為當地租車費用平均單價;
步驟202-2)、計算峰值調控景區pi、餘量景區vj之間的預計遊客消費差額;其中,
預計遊客消費差額分別為峰值調控景區pi、餘量景區vj預計遊客消費平均值;
步驟202-3)、計算景區吸引力指數比;若峰值調控景區pi、餘量景區vj的景區OTA網絡評分分別為si、sj,則景區吸引力指數比為sij=si/sj;
步驟202-4)、對單體調控交通消費tij、預計遊客消費差額wij進行數據標準化處理:
步驟202-5)、根據之前計算得到的兩景區之間的單體調控交通消費tij、兩景區之間的預計遊客消費差額wij、景區吸引力指數比sij,計算兩景區之間的單體調控難度係數:
上述技術方案中,所述步驟204)包括:遍歷峰值調控計算模型中的所有的單體調控阻力係數cij,找到調控消費最低的一條路徑優先分配,取xij=min(pi,vj);循環往復,直至所有的xij均完成取值,即獲得峰值景區遊客調控目的地和預計接納人數。
上述技術方案中,在所述步驟205)中採用三級調控模式進行遊客誘導,包括:
設定閾值x1、x2,當xij<x1時,採用一級誘導模式調控,在景區附近以廣播等方式誘導遊客向目的地景區轉移;
當x1<xijx2時,採用三級誘導模式調控,全網化發布遊客誘導信息,在充分調動前兩級誘導手段的同時,利用微信公眾平臺、WEB網站、移動APP、OTA進行消息發布,從行前開始進行遊客誘導調控。
本發明的優點在於:
本發明綜合多通道的客流量預測可以有效提升景區對客流量控制的準確度和有效性,在預測的基礎上根據調控阻力係數進行峰值調控,可以有效緩解景區的管理壓力,提高運營效率,從而更好的服務遊客,釋放景區的管控壓力。
附圖說明
圖1是本發明的基於旅遊大數據的遊客流量預測方法的流程圖;
圖2是本發明的遊客流量峰值調控方法的流程圖;
圖3是客流預測樣本的結構示意圖;
圖4是峰值調控模型的示意圖;
圖5是單體調控阻力係數的影響因子的示意圖。
具體實施方式
現結合附圖對本發明作進一步的描述。
參考圖1,本發明的基於旅遊大數據的遊客流量預測方法包括:
第一步:讀取旅遊大數據,建立預測樣本。
參考圖3,本發明使用的旅遊大數據包括歷史客流數據y1、社交網絡熱力數據y2、OTA瀏覽數據y3、周邊城市遊客數據y4、交通流量數據y5。這些數據共同構成預測樣本,即某天客流數據的預測樣本為Y{y1,y2,y3,y4,y5}。
第二步:基於所述預測樣本,建立客流量預測模型。
預測客流量Z按式進行計算。其中,αk為對應樣本數據的計算參數,α0為預測修訂常量,e是去除影響後的隨機誤差。
根據預測客流量Z的上述計算公式,在n組預測樣本數據{Y1,Y2,…,Yn}的基礎上,建立客流量預測模型{Z1,Z2,…,Zn},可表示為:
其中,該客流量預測模型中的參數值αik(i=1,2,……,n;k=1,2,……,5)為未知值,其在後續步驟中進行計算。
第三步:對所述客流量預測模型中的參數進行求解,從而得到客流量預測模型。在參數求解時,採用了多元線性回歸的最小二乘法,即:使客流量實際值與預測值之間的離差平方和最小,進行參數初始化計算:
在上述計算公式中,、yk(k=1、2、3、4、5)可從前述的n組預測樣本數據中獲取,為已知值;Z可由歷史的真實客流數據得到,為已知值;六個參數α0,α1,α2,α3,α4,α5為未知值,通過上述六組關係式,可計算出六個參數的值。
在實現時,可將n組預測樣本數據隨機組合為n/6個計算組,通過上述六組關係式,得到n/6組α0,α1,α2,α3,α4,α5,最後通過取平均確定最後的參數值α0,α1,α2,α3,α4,α5。
第四步:計算預測初始值。
根據第三步求得的旅遊客流預測參數,代入計算求得預測日當日客流量Z的初始值。
第五步:校正預測日當日客流量Z的預測值。
在校正預測值時,首先根據預測景區的天氣預報,計算人體舒適度指數,該指數的計算公式如下:
ssd=(1.818t+18.18)(0.88+0.002f)+(t-32)/(45-t)-3.2v+18.2;
其中,t為平均氣溫,f為相對溼度,v為風速。
以ssd值對應校正參數β,50<ssd<76,β=1.25,25<ssd<51或75<ssd<86,β=1,ssd85,β=0.85。
在得到校正參數β後,對預測初始值進行校正,取得校正後的景區預測客流量:
Zβ=βZ。
在本發明的遊客流量預測方法所得到的景區預測客流值的基礎上,本發明的遊客流量峰值調控方法能夠對遊客流量進行調控,如圖2所示,該方法包括:
第六步:將景區預測客流值Zβ與景區接待遊客能力Zmax進行差額比較,若Zβ>Zmax則景區處於峰值待調控狀態,待調控遊客量p=Zβ-Zmax;若Zβ<Zmax則景區處於餘量充足狀態,可接待遊客餘量v=Zmax-Zβ。
第七步:景區劃分。
根據遊客流量預測,將景區劃分為峰值調控景區集和餘量充足景區集。峰值調控景區集包含m個待調控景區,記為P1,P2…Pm,其待調控遊客量為p1、p2…pm。餘量充足景區集包含n個可平衡遊客景區,記為V1,V2…Vn,其遊客容納能力為v1、v2…vn。
第八步:計算峰值調控景區與餘量充足景區之間的單體調控阻力係數。其中,所述單體調控阻力係數是衡量峰值調控景區與餘量充足景區之間調控遊客難度的無量綱指標,如圖5所示,由景區間距離、景區間消費差額、景區吸引力比值共同決定。該步驟具體包括:
峰值調控景區pi與餘量景區vj之間進行調度,兩景區之間的單體調控交通消費tij,景區之間的距離為dij,當地租車費用平均單價為則
計算兩景區之間的預計遊客消費差額,pi、vj景區預計遊客消費平均值分別為
計算景區吸引力指數比,若pi、vj景區OTA網絡評分分別為si、sj,則景區吸引力指數比為sij=si/sj。
對tij、wij進行數據標準化處理:
根據之前計算得到的兩景區之間的單體調控交通消費tij、兩景區之間的預計遊客消費差額wij、景區吸引力指數比sij,計算兩景區之間的單體調控難度係數:
第九步:構建峰值調控計算模型。
如圖4所示,假設峰值遊客調控的總阻力的表達式為:調控過程中力求其調控阻力最小。即:
其中C為總的調控阻力,cij為從峰值調控景區pi調度遊客到餘量充足景區vj的單體調控阻力係數,xij為從峰值調控景區pi調度遊客到餘量充足景區vj的遊客量。
第十步:計算預計客流分配情況,確定遊客峰值調控景區對應的餘量充足景區。
在該步驟中,遍歷所有的單體調控阻力係數cij,找到調控消費最低的一條路徑優先分配,取xij=min(pi,vj)。如此循環,直至所有的xij均完成取值。即獲得峰值景區遊客調控目的地和預計接納人數。
第十一步:按照第十步的結果進行遊客誘導,按照預計調控客流量設定三級調控模式。設定閾值x1、x2,xij<x1時,採用一級誘導模式調控,在景區附近以廣播等方式誘導遊客向目的地景區轉移。x1<xijx2時,採用三級誘導模式調控,全網化發布遊客誘導信息,在充分調動前兩級誘導手段的同時,利用微信公眾平臺、WEB網站、移動APP、OTA進行消息發布,從行前開始進行遊客誘導調控。
本發明綜合使用歷史客流數據、社交網絡熱力數據、OTA瀏覽數據、周邊城市遊客數據、交通流量數據建立多元回歸模型,進行參數擬合,獲得參數擬合值後進行指定日期的預測。初始預測完成後,根據天氣信息,對初始預測值做修訂。在客流預測的基礎上對景區進行分類,根據預測值將景區劃分為峰值調控景區和餘量重組景區,計算景區之間的調控阻力係數,利用遊客調控分配模型,計算求解得到遊客調控分配數值,依據分配數值對各調控景區實施不同的調控手段,在兩類景區之間進行遊客調度,以實現景區之間客流量的平衡分配。綜合多通道的客流量預測可以有效提升景區對客流量控制的準確度和有效性,在預測的基礎上根據調控阻力係數進行峰值調控,可以有效緩解景區的管理壓力,提高運營效率,從而更好的服務遊客,釋放景區的管控壓力。
最後所應說明的是,以上實施例僅用以說明本發明的技術方案而非限制。儘管參照實施例對本發明進行了詳細說明,本領域的普通技術人員應當理解,對本發明的技術方案進行修改或者等同替換,都不脫離本發明技術方案的精神和範圍,其均應涵蓋在本發明的權利要求範圍當中。