基於堆疊受限玻爾茲曼機的多城市建設用地規模預測預測方法與流程
2023-09-18 10:46:45 3
本發明屬於土地規劃與利用領域,涉及了一種多城市的建設用地規模預測預測方法。
背景技術:
1978年改革開放以來,中國城市化率不斷攀升,截止2014年底,中國城市化率已達到54.77%。城市擴張必然會導致城市周圍優質耕地的損失。如何在滿足經濟發展的條件下避免過多的耕地損失,保證土地資源可持續利用將是土地利用規劃管理的重點和難點。其中,準確地建設用地規模預測則是土地利用規劃的基礎與核心。
建設用地規模受經濟、地形、人口和政策等諸多因素的影響,表現出不確定性、非線性和強幹擾性的特徵。基於線性假設的傳統回歸分析方法無法準確的表達建設用地規模與其諸多影響因子之間的關係。同時由於建設用地全面統計發展較晚,單個城市可獲得的歷史數據量較少,諸多非線性時間序列趨勢預測方法很難得到廣泛的應用。
因此,如何建立起多城市的建設用地規模預測預測模型,並能夠更加準確的預測多城市的建設用地規模對土地利用與規劃至關重要。
技術實現要素:
本發明的目的是克服現有技術的不足,提出一種基於堆疊受限玻爾茲曼機的多城市建設用地規模預測方法。
本發明所採用的技術方案如下:
基於堆疊受限玻爾茲曼機的多城市建設用地規模預測預測方法,包括如下步驟:
1)多城市的建設用地規模數據及其對應影響因子的收集,其中影響因子包括:年末常住人口、GDP、第一產業產值、第二產業產值、第三產業產值、全社會固定資產、出口總額、財政總收入、地方財政收入、地方財政支出、城鄉居民儲蓄存款年末餘額、城鎮居民人均可支配收入、農村居民人均純收入、貨運量和鐵路客運量;
2)針對第二產業產值、第三產業產值兩個影響因子進行修正;
3)對多城市的建設用地規模數據、年末常住人口數據、GDP數據、第一產業產值數據、第二產業產值數據、第三產業產值數據、全社會固定資產數據、出口總額數據、財政總收入數據、地方財政收入數據、地方財政支出數據、城鄉居民儲蓄存款年末餘額數據、城鎮居民人均可支配收入數據、農村居民人均純收入數據、貨運量數據和鐵路客運量數據進行歸一化處理;
4)設置屬性數據和建設用地規模數據之間的延遲時間;
5)利用2層堆疊受限玻爾茲曼機建立多城市的建設用地規模預測模型;
6)利用步驟3)中處理後的建設用地規模數據及步驟4)中設置的延遲時間所對應的影響因子數據來對步驟5)中的模型進行訓練;設置第一層RBM學習速率為0.1,訓練步數設置為100;第二層學習速率為0.5,訓練步數設置為500;當對RBM進行訓練時,設置相鄰兩次重構誤差小於0.0001時,下調學習速率,當學習速率小於0.0001時,即停止訓練;
7)利用步驟6)中訓練後的模型,輸入歸一化後的影響因子,即能夠得到相應年份的多城市建設用地規模數據;
在上述方案基礎上,各步驟可採用如下優選方式:
所述的步驟2)中,對第二產業產值和第三產業產值進行指標修正,其修正公式如下:
式(1)中i,j,t分別代表產業、城市和年份;表示第t年(t=1,2,...)第j個城市第i產業的增長額度;和分別表示第t年和第t-1年第j個城市第i產業修正值,且初值條件為eijt-1為第t-1年第j個城市的i產業相對發展狀況;式(2)中為i產業中地均產值最小的取值,為i產業中地均產值最大的取值;Eijt-1代表j城市第t-1年的i產業的地均產值取值。
所述的步驟3)中歸一化處理公式為:
xi'=(ymax-ymin)×(x-xmin)/(xmax-xmin)+ymin (3)
其中xi'為i產業當前變量歸一化後的值;x為i產業當前變量歸一化前的值;xmin代表當前變量的最小值,xmax代表當前變量的最大值;ymax取值為1,ymin取值為0。
所述的預測模型中第一層的節點個數為8,第二層的節點個數為4。
所述的步驟6)中模型的具體訓練公式為:
其中參數rj~Bernoulli(p) (6)
其中,vi代表可視層的節點取值,hj代表隱藏層的節點取值;σ是sigmod函數;p為隨機隱藏隱層節點的比例,取值為0.5;Wij為可視層和隱藏層之間的邊的權重,bj和ai分別為可視層和隱藏層的偏置,n為訓練總步數。
本發明的有益效果是:採用了多城市的經濟指標修正方法,建立了多城市的建設用地規模統一預測模型,有效改善了單個城市建設用地規模數據量小的問題。設計了面向連續型數據的受限玻爾茲曼機訓練方法,改善了模型在處理連續型數據容易發生過擬合的問題,提高了模型預測精度。
附圖說明
圖1基於堆疊受限玻爾茲曼機的多城市建設用地規模預測模型;
具體實施方式
下面結合附圖和實施例對本發明進行進一步的說明。
基於堆疊受限玻爾茲曼機的多城市建設用地規模預測預測方法,包括如下步驟:
1)本實施例收集了杭州市、寧波市、嘉興市、金華市、溫州市、麗水市、舟山市及台州市2008年至2013年的建設用地規模數據,並在浙江省2009至2014年統計年鑑中收集了年末常住人口數據、GDP數據、第一產業產值數據、第二產業產值數據、第三產業產值數據、全社會固定資產數據、出口總額數據、財政總收入數據、地方財政收入數據、地方財政支出數據、城鄉居民儲蓄存款年末餘額數據、城鎮居民人均可支配收入數據、農村居民人均純收入數據、貨運量數據、鐵路客運量數據。
2)針對第二產業產值、第三產業產值兩個影響因子進行修正,其修正公式如下:
式(1)中i,j,t分別代表產業、城市和年份;表示第t年(t=1,2,...)第j個城市第i產業的增長額度;和分別表示第t年和第t-1年第j個城市第i產業修正值,且初值條件為eijt-1為第t-1年第j個城市的i產業相對發展狀況;式(2)中為i產業中地均產值最小的取值,為i產業中地均產值最大的取值;Eijt-1代表j城市第t-1年的i產業的地均產值取值。
3)對多城市的建設用地規模數據、年末常住人口數據、GDP數據、第一產業產值數據、第二產業產值數據、第三產業產值數據、全社會固定資產數據、出口總額數據、財政總收入數據、地方財政收入數據、地方財政支出數據、城鄉居民儲蓄存款年末餘額數據、城鎮居民人均可支配收入數據、農村居民人均純收入數據、貨運量數據和鐵路客運量數據進行歸一化處理;歸一化處理公式為:
xi'=(ymax-ymin)×(x-xmin)/(xmax-xmin)+ymin (3)
其中xi'為i產業當前變量歸一化後的值;x為i產業當前變量歸一化後的值;xmin代表當前變量的最小值,xmax代表當前變量的最大值;ymax取值為1,ymin取值為0。
4)設置屬性數據和建設用地規模數據之間的延遲時間。
5)利用2層堆疊受限玻爾茲曼機建立多城市的建設用地規模預測模型(如圖1所示)。本實施例中預測模型中第一層的節點個數為8,第二層的節點個數為4。
6)多城市建設用地規模數據具有連續性的特徵,為了使模型適用於連續型數據,同時為了改善過擬合現象,取消了受限玻爾茲曼機訓練過程中二值化的部分,並加入了Dropout方法來改善模型過擬合的現象。因此,利用步驟3)中處理後的建設用地規模數據及步驟4)中設置的延遲時間所對應的影響因子數據來對步驟5)中的模型進行訓練;設置第一層RBM學習速率為0.1,訓練步數設置為100;第二層學習速率為0.5,訓練步數設置為500;當對RBM進行訓練時,設置相鄰兩次重構誤差小於0.0001時,下調學習速率,當學習速率小於0.0001時,即停止訓練。模型的具體訓練公式為:
其中參數rj~Bernoulli(p) (6)
其中,vi代表可視層的節點取值,hj代表隱藏層的節點取值;σ是sigmod函數;p為隨機隱藏隱層節點的比例,取值為0.5;Wij為可視層和隱藏層之間的邊的權重,bj和ai分別為可視層和隱藏層的偏置,n為訓練總步數。
7)利用步驟6)中訓練後的模型,輸入歸一化後的影響因子,即能夠得到相應年份的多城市建設用地規模數據。
本實施例中,上述方法以浙江省8個地級市2008年至2012年的建設用地及相關屬性作為模型訓練數據,以2013年8個市的建設用地規模作為測試數據。研究將下一年的建設用地規模作為待預測的因變量,將本年度各個相關屬性變量作為自變量。以便達到利用本年度及以前年度所有可得數據預測下一年用地的目的。為驗證本發明的有效性,實驗利用支持向量機方法作為對比方法,不同方法預測精度結果如表1。表2展示了採用本發明提出的訓練方法和傳統的訓練方法進行對比。
表1
表2
可以得出,本發明提出的基於堆疊受限玻爾茲曼機的多城市建設用用地統一預測方法能夠很好的對多城市的建設用地規模進行預測,並且能夠有效的改善模型在處理原始訓練方法在處理連續型數據容易發生過擬合的問題。