與地籍測量有關的文獻（測繪學報吳華意）

2023-07-19 23:05:25 1

本文內容來源於《測繪學報》2022年第8期（審圖號GS京（2022）0490號）

城市人口時空分布估計研究進展

吳華意1,2,3

,胡秋實1,李銳1,2,3

,劉朝輝1

1. 武漢大學測繪遙感信息工程國家重點實驗室, 湖北武漢 430079;

2. 湖北珞珈實驗室, 湖北武漢 430079;

3. 地球空間信息技術協同創新中心, 湖北武漢 430079

基金項目：國家自然科學基金(U20A2091;41771426)

摘要：城市人口是構成城市的社會主體, 是城市發展中最為活躍的因素。城市人口時空分布是城市管理需要掌握的重要信息。正確、精細化的城市人口分布數據對於城市運行與規劃、城市經濟發展和人民生活具有極為重要的意義, 因此城市人口時空分布估計是城市地理學需要解決和研究的熱點問題之一。本文以城市人口時空分布估計的關鍵點為核心, 從以下幾個方面展開綜述: ①空間分布單元劃分方法, 即城市人口分布的空間劃分方式; ②主要的模型和方法, 從模型思想發展過程和估計對象的角度總結了6類方法並進行詳細闡述; ③估計結果在城市發展中的主要應用。在此基礎上, 本文指出了目前人口時空分布研究在空間單元構建、建模數據、建模思想和結果驗證上存在的問題, 同時探討了未來的研究方向。

關鍵詞：人口時空分布空間分布單元估計方法與模型城市人口應用綜述

引文格式：吳華意, 胡秋實, 李銳, 等. 城市人口時空分布估計研究進展[J]. 測繪學報，2022，51(9)：1827-1847. DOI: 10.11947/j.AGCS.2022.20220020

WU Huayi, HU Qiushi, LI Rui, et al. Research progress on spatio-temporal distribution estimation of urban population[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(9): 1827-1847. DOI: 10.11947/j.AGCS.2022.20220020

閱讀全文：http://xb.chinasmp.com/article/2022/1001-1595/20220901.htm

引言

人口是指生活在特定社會制度、特定地域具有一定數量和質量的人的總稱[1]。城市人口則是將生活區域限定在某個城市範圍，是構成該城市的社會主體，與城市活動密切相關。隨著城市的出現和城市化進程的推進，大量的人口流入城市，有力推動了城市的發展和繁榮。但城市人口數量的激增也帶來了很多問題，如城市交通堵塞、城市服務設施不足、城市環境惡化等[2]。城市人口是一把雙刃劍，是城市發展中的核心和最為活躍的因素[3]，對城市的規劃與管理本質上是對人口信息的獲取和管理，這就需要掌握城市人口在不同時間點上位於城市各地區中的分布狀況，即城市人口的時空分布。實踐表明，準確的人口時空信息，是城市規劃、應急管理、交通出行、疾病防控等城市管理與社會服務的科學依據[4]，因此對城市人口分布的估計和研究是城市地理學需要解決的熱點問題和基礎性研究[5]。

傳統的城市人口分布數據主要通過調研統計的方式獲得，例如，各個國家政府主要通過人口普查的方式獲得行政管理區域內的人口分布信息。然而，人口普查在統計方式和成果應用方面存在較多的不足，主要體現為：①人口普查的方法對於人力和物力成本消耗較大，不能頻繁開展，因此兩次人口普查的間隔周期較長，無法形成時間上較為連續的人口分布數據[6]；②人口普查數據的成果空間化方法是固定的，主要以行政管理屬性的單元呈現，對於如交通、城市功能等多樣化場景應用的適應能力較弱；③公開獲取的人口普查數據一般以縣區為單位，空間粒度較大，且城市中心和郊區的行政單元面積存在差異，在表達更精細且空間連續性較平滑的人口分布信息的能力上存在缺陷[7]。因此，為了在傳統普查手段之外獲取城市人口分布數據，國內外的研究者應用不同的方法和模型獲取了不同時空解析度的城市人口分布情況，相關成果不僅提高了城市人口分布估計的準確率和精細化程度，也推動了相關研究理論和應用的發展，同時在城市建設、交通規劃、公共管理、綜合治理等應用領域產生了廣泛而積極的影響。

部分學者對城市人口時空分布的相關研究從不同角度已經做了一定的總結。文獻[8]針對基於美國住房單元(house unite，HU)進行人口估計的研究，從建模數據、方法和應用等方面進行了總結，並提出準確的住房單元人口需要持續獲取正確的住房空間單元和行政邊界。文獻[6—7, 9]主要從模型和方法的角度總結了基於遙感和地理信息技術的人口空間分布估計的研究，並且提出人口分布估計需要與自然、經濟因素相結合，同時要考慮特徵和模型的選擇。文獻[10]主要針對利用遙感數據進行人口分布估計的國內外研究進行了總結，並提出目前估計的人口主要是居住人口，未來的研究應著重考慮白天實際的活動人口。文獻[11]從人口統計數據空間化的角度，分析比較了10個主要模型的優劣，並提出人口分布城市中應加強社區級精細化尺度的研究，並考慮理論模型和統計模型的結合。文獻[12]主要針對建模中使用的方法、參考要素對人口空間分布研究進行了總結，並提出未來研究應考慮多源遙感數據和新型傳感器數據的使用。本文基於已有的研究總結成果，從城市人口分布的空間劃分單元、模型與方法、城市應用等角度對相關研究進行了綜合論述，在模型與方法中著重補充了針對動態人口和近年來最新的研究成果。

為了揭示城市人口分布估計在理論研究和應用方面的進展，本文以城市人口時空分布估計的關鍵點為核心展開綜述：①從空間劃分的角度介紹城市人口時空分布估計在空間單元構建上的研究現狀；②介紹城市人口時空分布估計在模型與方法上的進展，從靜態和動態人口的角度對其進行分類並詳細闡述；③介紹城市人口時空分布估計的典型應用狀況；④論述目前研究當中存在的不足和局限，並對未來的研究方向提出展望。

1 空間分布單元劃分方法

城市人口空間分布單元是開展人口時空分布估計時，在空間上劃分的基本空間對象。不同的劃分方式決定了人口分布數據獲取方式、可視化的效果和應用範圍，是方法模型構建和應用的基礎，並影響人口分布信息表達的精細度和準確度。因此，適宜的空間分布單元劃分方法對於有效估計人口分布信息，進而支撐城市相關應用是至關重要的。在長期的城市人口研究中，已經使用或劃分了多種空間單元，根據人口時空分布估計的空間尺度目標、應用場景的空間屬性，以及估計模型使用的研究數據形式等需求，主要的劃分方法分為3個方向：①基於空間尺度的單元劃分；②基於應用場景空間屬性的單元劃分；③基於建模數據結構形式的單元劃分。

1.1 基於空間尺度的單元劃分

面積和大小是空間分布單元的基本屬性，因此，空間尺度是城市人口時空分布優先考慮的研究目標和空間分布單元構建的基本需求。在長期的城市人口研究中，不同的空間尺度已經被城市管理者構建和規劃了多個空間分布單元，相關的研究能夠直接使用這些單元，以及其中包含的人口和其他屬性信息開展分布估計研究。空間尺度的標準主要包括宏觀、中觀和微觀3種。

宏觀和中觀的人口時空信息是城市總體規劃和管理的傳統支撐數據，相關研究者常基於該尺度構建空間單元並開展人口分布估計與研究。行政區劃是城市中常見的宏觀和中觀單元(圖 1(a))，這類空間單元是由國家行政管理分級劃分的空間區域，具體由國家民政部門進行劃分。行政區劃是政府發布人口普查數據和社會、經濟、文化等其他統計數據的基本單元，其中人口普查數據是目前權威的人口分布數據，因此在相關研究中通常將人口估計結果匯總到街道、市轄區等行政區劃單元，並以各級行政區劃中的人口普查數據作為結果驗證標準。文獻[13—14]分別基於4級行政區和街道結合人口普查數據進行了建模，驗證了多源數據特徵可以有效提高人口分布估計的精度。文獻[15]為了研究空氣汙染的總體影響，基於我國的區級行政單元的人口普查數據和手機信令數據評估了常住人口在PM2.5中的實時暴露情況，結論表明手機信令數據反映的受汙染人口與人口普查數據具有較大差異，需要調整汙染治理的區域和政策。同時，基於行政區劃的人口分布研究也對行政區劃的調整提供反饋。文獻[16]基於街道級行政單元結合計程車數據分析了城市的人口時空變化情況，並提出北京市區級行政單元根據人口分布變化情況應進行合併。另外部分研究者為了研究宏觀的人口分布中心，選擇傳統人口密度模型中的人口衰減圈層結構開展研究。文獻[17—18]為了研究城市整體人口空間結構，將城市根據人口密度大小分為中心、近郊和遠郊3個圈層。文獻[19]以城市的3級交通環線構成了3層城市圈單元並研究城市人口多中心結構(圖 1(b))。進一步，隨著人口數量劇增和城市應用場景的多樣化發展，人口的精細化管理是目前城市工作重點，傳統行政區劃單元的空間尺度較大，部分研究者使用建築物作為空間單元(圖 1(c))。建築物是人工構建的地理要素，在二維空間上的面積普遍為幾十米級，並且是人口居住的實際區域，因此適合表達微觀尺度的人口分布信息。首先，建築物本身可以提供更加精細的空間或屬性數據關聯人口分布信息。文獻[20—21]為了獲取精細化的人口分布數據，使用LiDAR導出的建築物體積信息建立了基於建築物的靜態人口分布估計模型；同時建築物可以與地名地址[22]、土地利用[23]、夜間燈光[24]、POI[25]等空間地理數據相結合，進而通過對建築物進行功能分類和空置率識別以提高人口分布估計的精度。文獻[26]為了提高精細化的人口分布估計精度基於POI數據獲取了建築物單元的功能分類。進一步，由於建築物是人口居住的實際區域，可以建立人口分布的強相關模型。文獻[27]為了研究微觀尺度的人口分布特徵，基於建築物要素結合多源大數據建立了人口-建築物引力模型。

圖 1 基於空間尺度需求的傳統單元劃分示例Fig. 1 Examples of unit construction based on spatial scale requirements

圖選項

上述劃分方法主要針對人口分布估計的空間尺度需求構建，其中行政區劃和城市圈層主要用於宏觀和中觀的人口分布研究，從而獲取城市粗粒度的人口分布信息，但這些單元的尺度相對較大，無法對城市精細空間進行表達，不能體現人口分布的空間異質性。對於建築物單元，可以表達局部精細的人口分布信息，並提供高精度的空間信息輔助人口分布估計。但是，建築物在二維空間上的分布是不連續的，對於變化頻率較低的靜態常住人口可以進行表徵；而對於變化頻率較高的動態人口，由於人口並不只聚集在建築物內部空間，建築物以外的區域也包含大量人口活動和移動信息，而這部分信息基於建築物在空間上進行表徵會有損失。同時，考慮目前動態人口研究的數據源，在精度上普遍無法獲得建築物內部的活動信息，因此將建築物作為動態研究的單元在表徵人口活動的能力和研究可行性方面存在一定的缺陷。

1.2 基於應用場景空間屬性的單元劃分

應用場景是人口分布估計的重要導向，不同的應用場景對於人口分布信息的精細程度和表達方式有多樣化的需求。在空間尺度需求的基礎上，應用場景通常需要構建具有特定空間屬性或符合場景主題的人口活動空間區域，進而需要人工構建或進行屬性篩選。因此，考慮應用場景空間屬性需求是空間分布單元劃分的重要方向。本文列舉了4類典型的應用場景，包括城市交通、衛生醫療、功能結構和居住生活。

針對城市交通，相關研究者通常以城市交通管理部門通過主幹道劃分的交通分析區(traffic analysis zone，TAZ)[28]作為空間單元(圖 2(a))。文獻[29]基於TAZ探究城市人口職住和通勤結構，分析北京市人口的時空分布和移動情況。文獻[30]基於TAZ和計程車GPS數據研究城市人口的動態分布和出行規律。進一步地，部分研究者結合相關交通設施開展場景的深入研究。文獻[31]為了研究城市主要交通站點的人口分布變化特徵，以公交車站點為中心劃分了緩衝區作為空間單元。針對城市衛生醫療，研究者通常考慮場景的具體特徵和相關事件劃分空間單元。文獻[32]為了研究新冠病毒的擴散模式，考慮武漢市封閉隔離的主體為住宅小區，同樣以主幹道劃分了1140個交通分析區，結合手機定位數據分析人口的空間交互情況。文獻[33—34]基於醫療設施和交通網絡構建緩衝區研究了人口到達公共健康設施的時空分布特徵。針對於城市人口活動功能結構，研究者以人口活動的區域或相似特徵的區域作為空間單元。文獻[35—37]為了識別人口活動功能區，根據主幹道對於人口活動的限制作用將TAZ作為空間單元。文獻[38—39]以多級城市道路網劃分符合人口生活的面狀要素以分析人口活動功能的時空結構。針對人口居住生活，相關研究者考慮場景典型的代表區域劃分空間單元。文獻[40]為了探究城市郊區人口的生活情況，以北京市城郊的多個大型社區作為空間單元, 結合GPS數據分析人口日常活動的空間變化情況。文獻[41—42]選擇了典型的居住區分別研究了城市人口的職住分離特徵和老年貧困人口的分布特徵。

圖 2 基於應用場景屬性需求和數據形式的單元劃分示例Fig. 2 Examples of unit construction based on application scenarios and data requirements

圖選項

總體而言，上述劃分方法從城市應用場景出發，根據應用場景的時空特徵需求和對人口分布信息的需求構建空間單元，能夠準確獲得支撐應用場景的人口分布數據。但是，目前基於應用場景構建的空間單元具有較強的針對性，尤其是短期或局部性場景對於空間區域屬性和範圍有較多的限制，進而導致單元的普適性和通用性較弱。同時目前對於應用場景的需求認知缺乏統一的模型和標準，無法系統地支撐空間單元的劃分。

1.3 基於建模數據結構形式的單元劃分

多源異構的城市時空數據是人口分布估計方法建模的重要信息和特徵來源，為了準確提取數據中與人口分布信息相關的特徵，避免造成信息丟失和統計偏差，同時進一步支撐多源數據的融合分析，需要匹配建模數據的獲取或統計的空間形式。本文主要以柵格類數據的解析度匹配、融合及傳感器類數據生產方式為例說明基於建模數據劃分空間單元的方法。

柵格數據是城市人口分布估計最常見的研究數據，為了匹配柵格數據的解析度，文獻[43]使用由規則多邊形構成的地理格網作為空間單元(圖 2(b))。文獻[44]採用1 km格網來分析自然與社會現象, 進而格網的概念發展成為一種地學分析方法。隨著多個全球人口數據項目的建立，如GPW、LandScan等都推動了基于格網單元人口分布與分析的發展[45-46]，通過控制格網尺寸的大小可以實現對不同空間解析度柵格數據的有效匹配和人口分布數據的展現。文獻[47—48]利用不同解析度的夜間燈光數據基於地理格網研究人口分布特徵，具有相似特徵的柵格數據還包括遙感光譜數據[49]、土地利用數據[50]和地理形態數據[51-53]等。進一步地，由於規則劃分的特點，地理格網不僅可以直接匹配上述的研究數據，也為單元內其他類型信息的快速統計和多源數據融合，以及開展人口分布估計提供了支撐[54]。例如為了多種遙感柵格數據的特徵疊加, 文獻[55—56]基於地理格網融合了多種遙感數據。文獻[57—58]基於地理格網結合遙感數據與GIS數據的特徵進行了建模。文獻[59—60]為了多源數據的快速統計減少計算量，基於地理格網綜合統計了GIS數據和帶有人口時空信息的眾源大數據。隨著新型傳感器的發展，出現了多種具有人口時空信息的個體時空標記數據，受限於部分類型數據的記錄方式，為了科學地開展人口分布估計，相關研究基於數據獲取特點結合數學理論劃分空間單元(圖 2(c))。文獻[61]根據手機信令數據的獲取方式，以手機基站位置為中心建立Voronoi多邊形表示基站的服務範圍，用於分析估計葡萄牙裡斯本的人口分布。文獻[62]根據地鐵智慧卡數據的記錄方式，以173個地鐵站點構建泰森多邊形標識地鐵服務範圍，分析了北京市人口分布動態變化情況。文獻[63]為了綜合統計3個手機運營商的手機信令數據，以3個運營商的手機基站為核心結合Delaunay三角形劃分方法構建統計分析子單元分別表示不同基站的服務範圍，進而分析了城市人口的動態分布情況。

總體而言，上述劃分方法主要從研究數據出發，根據數據的時空尺度和統計方式，充分提取了研究數據的時空和屬性特徵，並推動了數據間的融合，有效提高了人口分布估計的時空解析度和準確度。但是，這些單元由研究數據驅動劃分的同時也受到研究數據本身的限制，其空間解析度和構建過程對於數據有較強的依賴性，對於數據的完整度和獲取都提出了較高的要求。

2 人口分布估計的模型與方法

模型與方法是城市人口時空分布估計研究中的核心內容, 相關研究者從不同角度對城市人口分布估計的模型和方法做了總結。文獻[10]綜合了GIS和遙感文獻中關於人口估計的方法，將其分為區域插值和統計建模2類。文獻[9]對國內外網格化的人口分布估計模型進行了總結，將其分為面積權重模型、核心估計模型、土地利用影響模型、重力模型和多源數據融合模型5類。文獻[12]基於人口數據空間化方法的基本原理，將其歸納為城市地理學中的人口密度模型、空間插值方法和基於遙感和GIS的統計建模方法3類。本文主要從人口時空分布估計的對象出發，將其分為靜態人口和動態人口兩個類別，針對兩種估計對象分別開展方法和模型的詳細闡述。

2.1 靜態人口分布估計

靜態人口是對某一個時間節點上人口狀況的總稱，通過截取某一個時間節點的人口靜止狀況，反映連續不斷變動過程中城市某一區域人口的快照。靜態人口統計的內容，包括一定時間區間上的人口總數、人口密度和人口的地區分布。為了更準確地敘述模型與方法，本文將靜態人口定義為某個區域內的人口普查工作中的常住人口。因此，針對靜態人口分布估計，主要分為傳統人口密度模型、空間插值和統計回歸3種方法。

2.1.1 傳統人口密度模型

20世紀50年代以來，城市人口分布估計的研究吸引了大量學者的關注，研究者從地理學和經濟學的角度出發，形成了一系列描述城市人口分布的人口密度模型。最早的城市人口密度模型利用數據學模型進行表達[64]，其核心思想是人口與城市中心的距離關係為由中心向外圍呈遞減關係，Clark模型的表達式為

式中，M為常數，是城市中心的人口密度；x為該位置城市中心的距離；e為自然常數；λ為人口密度衰減的定量係數，高值表示人口密度衰減快，低值表示人口密度衰減慢；d(x)為x位置的人口密度。基於Clark模型的研究成果，相關研究者對城市人口分布描述的模型做出了進一步的探索和改進，典型的模型例如異速生長模型、正態密度模型、Smeed模型、Newling模型、Gamma模型和分形模型等[65-70]。

傳統的城市人口密度模型使用簡單，能夠快速地對城市人口分布進行宏觀或大尺度的描述。但是，這些模型是對城市人口密度的理想近似模型[7]，只考慮了城市中心對於人口分布的影響而忽略了自然、經濟和人為調控等因素的內在作用。因此，這些模型對於目前的城市人口分布估計具有一定參考價值，其估計精度和空間尺度應用範圍不能滿足精細化的人口管理需求，目前很少有研究者採用該模型進行研究。

2.1.2 空間插值方法

政府人口普查數據由於匯總方式和隱私問題，在空間上一般以行政單元的方式展示，並且只到區縣、街道一級。為了獲得空間上更為精細的人口分布數據，部分研究者利用空間插值的方法將人口普查數據根據一定權重值在更精細的空間單元上進行分配。

空間插值理論假設在空間上鄰近的點具有相似的特徵值，根據空間插值在人口分布估計中的應用範式，可將其分為面插值[71]、點插值和地統計學3類[12]。面插值即一種面狀單元到另一種面狀單元的轉換[72]，其中以面積權重法為最基本的方法。文獻[73]在傳統面積權重法的基礎上提出了對真實人口分布估計的面積內插方法。文獻[74]基於面積權重的方法估計了賓夕法尼亞州東南地區100 m格網的人口分布。點插值是採用一定的採樣點代替面從而進行插值，核密度函數是人口數據點插值最常用的方法[73]，典型研究如文獻[75]利用核心估計方法將人口密度分配到1 km格網上。地統計學以區域化變量理論為基礎，研究分布於空間中並顯示出一定結構性和隨機性的現象。文獻[76]利用變量理論以瀋陽市為例，證明了人口密度尺度效應的存在。文獻[77—78]利用克裡金法進行了基于格網的地統計插值，分別估計了30、300 m格網解析度的人口分布數據。

基於空間插值的方法理論成熟，可以將傳統人口普查數據科學地分配到更精細的分析單元上。但是，其中面插值的理論基礎是行政區劃內的人口是均勻分布的，點插值則是用點要素來表徵人口密度，這些特點導致這兩類方法適合幾十千米級的大尺度人口估計，而在更精細的尺度則需要其他輔助數據進行修正。而地統計學方法則主要將人口分布信息分解為穩定量和殘差量兩個部分，其中殘差量可以結合多種高解析度遙感數據得到更精細的結果，但缺點在於模型計算複雜，實現難度較大。另外，空間插值方法的關鍵在於人口普查數據的準確性，這使得空間插值的方法在人口普查工作統計效果較差的區域，如城市偏遠地區或者非洲等地區的國家難以適用[79]。同時，由於人口普查數據的低頻更新特點，空間插值的方法也難以用於高頻的動態人口估計。

2.1.3 統計回歸方法

回歸分析指的是確定兩種或兩種以上變量間相互依賴的定量關係的一種統計分析方法。隨著遙感和GIS技術的發展，多種類型地理大數據的獲取為城市人口時空分布估計提供了新的信息來源。統計回歸方法則可以構建多源地理大數據和靜態人口分布之間的定量關係模型，是一種自下而上的估計思想，且不需要輸入人口普查數據。根據數據類型的不同，部分研究者對統計回歸方法的研究方向進行了初步總結。文獻[6]在研究中將其分為遙感光譜與人口的關係、遙感和GIS間接構建人口指標及通過遙感影像獲取土地利用數據3類研究方向。文獻[12]將其分為土地利用類型法、基於像元特徵法和多源信息融合法3類。綜合相關研究成果，本文將統計回歸方法歸納為基於遙感圖像像元特徵、基於遙感和GIS數據特徵融合2類。

基於遙感圖像像元特徵的回歸方法期望建立人口分布與遙感圖像像元特徵的關係模型, 常見的特徵量包括波譜、紋理、夜間燈光。文獻[80]使用遙感圖像的像元結合多元回歸方法建立了人口分布估計的模型，並在日本關東和東京市進行了500 m格網的人口分布估計。文獻[81]研究了TM影像中不同波段的光譜值與城市人口密度之間的關係並利用Spot影像對香港基於行政區劃TPU單元進行了人口分布的估計[82]。文獻[83]在波譜值的基礎上引入紋理信息共同估計人口分布。文獻[47, 84—85]引入了美國的國防氣象衛星計劃數據，研究表明燈光強度、燈光等級、燈光區面積等屬性與人口分布存在較高的相關性。除了直接利用遙感數據像元特徵估計人口分布以外，相關研究者從遙感圖像中進一步提取與城市人口分布相關的信息對城市人口分布進行研究。文獻[86]根據遙感影像上解譯的建築物數量對人口普查數據的精度進行了驗證和比較。另一種常見的從遙感數據中提取的信息是土地利用數據，相關研究表明人口與土地利用類型尤其是居住地最為密切。文獻[87]利用遙感影像獲取土地利用數據繪製了英國萊斯特郡1×1 km格網的人口分布數據。文獻[88]建立了土地利用類型與人口數量的回歸模型並對中國多個城市進行了1×1 km的人口分布估計。然而，由於不同地區獲取的遙感圖像數據在難易程度、數據質量和空間解析度上具有較大差異，導致僅輸入遙感圖像特徵的模型遷移性較弱。

為了解決上述問題，相關研究者進一步引入多種類型城市地理要素作為影響因子構造多源數據特徵融合的回歸模型。文獻[46]基於全球人口數據集Landscan結合夜間遙感、土地利用數據、人口普查、DEM和道路網等數據建立了1×1 km網格的人口分布數據。文獻[51]分析了與人口分布相關的GIS因子，如土地利用、高程帶、坡度帶、坡向帶等。文獻[89]基於遙感影像、土地覆蓋和DEM等數據結合決策樹建立空間單元的權重估計了城市100×100 m的人口分布。文獻[56]基於遙感和多種GIS數據採用單個空間單元內影響因子貢獻比重的方法，構建了回歸估計模型，有效提高了估計的精度。近年來，城市興趣點(POI)是靜態人口分布估計中最流行的建模數據，由於其類型多、數量大，以及與靜態人口分布關係密切的特點，眾多研究者增加POI數據建立了更準確、精細化程度更高的回歸模型[90-95]。文獻[96—97]引入了建築物數據，利用建築物與靜態人口的強相關關係修正估計結果，提高了估計精度。進一步，隨著深度學習技術的發展，文獻[98—99]將高解析度夜間燈光、土地利用和地形等遙感數據輸入卷積神經網絡進行訓練，得到大範圍的高精度人口分布估計結果，在人口數量稀疏地區具有良好的精度。

高解析度遙感影像城市人口分布估計模型的建模方法較為簡單且估計精度較高並且隨著近年來的遙感數據獲取方式和類型增多，該方法具有很好的空間覆蓋性和穩健性。而基於遙感和GIS數據特徵融合的回歸方法考慮了多種因素對於人口分布的影響，可以科學地為多個影響因子分配權重，較大程度地提高了城市人口分布估計的精度，空間解析度可以達到幾十米格網甚至建築物級[5]。同時，該方法擁有良好的可擴展性，易與不同的GIS數據結合，是目前城市靜態人口時空分布估計的最常用的方法。但是，隨著建模要素的增加，該方法缺少數據間的相關性分析，各因子權重的確定與模型計算較為複雜並增加了信息冗餘，同時也影響了對人口分布估計結果的可解釋性。因此，上述方法中涉及的數據，如遙感數據、道路數據和POI數據的更新頻率較低，一般以年為單位，在對高時間解析度下的城市人口進行估計時較難利用其數據特徵。

2.2 動態人口分布估計

與靜態人口的定義相對，動態人口指的是在多個時間點上的人口狀況總稱。通過截取一段時間區間，以不同時間粒度反映城市某一區域人口的連續變化過程，即動態人口的狀況是隨時間不斷改變的。由於動態人口分布變化的隨機性和複雜性[100]，並且缺少權威的動態人口分布數據，目前的研究方法主要圍繞數據展開，實際上研究的是不同時間粒度下的人口活動量和相關特徵。本文針對主要研究數據類型將相關方法分為基於土地利用類型、基於帶有個體時空標記的數據和其他動態估計方法3類。

2.2.1 基於人口普查和土地利用分類數據的估計方法

遙感和GIS數據由於數據獲取頻率較低，一般為某一時刻下的靜態值，不能直接適用於動態人口分布估計，但是部分研究者以人口普查數據和土地利用類型數據在不同時刻存在人口數量的規律為基礎，建立了土地利用-時間-人口數量的關係模型，從而對城市人口分布進行粗粒度的動態估計。文獻[101]以重慶市北碚區為試驗區域，從Google Earth影像中解譯結合實地調研獲取北碚區13種土地利用類型，同時引入土地利用類型吸引權重，根據居民上班、休息等出行行為，結合白天、夜晚兩個典型時間特徵構建7個時間段並將人口普查數據按權重進行分配。文獻[102]根據城市人口活動規律將人口分為家庭人口、鐘擺人口和隨機人口3類，並建立了這3類人口與土地利用類型和時間的關係模型，進而利用不同土地利用類型的面積權重結合人口普查數據分配得到了北京市海澱區250 m格網下的晝夜人口分布情況。文獻[103]採用相似的方法並進一步結合建築物功能、樓層數和面積等信息估計了南京市秦淮區100 m格網的晝夜人口分布情況。

基於土地利用類型的方法初步實現了一天不同時間段內城市人口分布的估計，並以白天和夜晚兩個主要時間段進行區分，同時通過土地利用數據並結合其分類語義描述的建模方法對人口活動模式具有較好可解釋性和空間範圍覆蓋性，與人口統計數據的結合能夠反映人口分布數量的空間特徵。但是，由於對人口出行規律認識不足、人口行為隨機性和土地利用類型劃分不精細等問題，這類方法的研究結果時間解析度較低，通常只能達到晝夜的粗粒度估計，對於晝夜時間段中更精細的人口活動表達和挖掘能力較低。

2.2.2 基於個體時空標記數據的估計方法

隨著傳感器、無線通信技術和網絡技術的發展，行動電話、智慧卡、GPS等泛在傳感器被大量普及[104-105]，產生了大量內容豐富、屬性詳細和細粒度的新型數據，這些數據大都帶有個體粒度的時空標記，為長時間、高精度、高效地跟蹤個體空間移動提供了可能性[106-109]。因此，大量人類時空研究開始基於如GPS數據、智慧卡數據、社交媒體數據和手機數據等進行開展[110-113]，這也推動了城市人口時空分布估計的方法從「計量假設」到「實際行為」的轉變，為城市人口分布研究提供了新的研究範式[114]。本文根據近年來的研究成果中數據的類型、用戶群體和時空間粒度等特點的不同，將其歸納為基於智慧卡刷卡數據、基於社交媒體數據和基於手機數據3類方法。

(1) 基於智慧卡刷卡數據的估計方法。隨著現代城市的發展，城市公共運輸體系的建設也逐漸完善，在方便城市人口出行改善城市交通狀況的同時也儲存了大量由智慧卡產生的刷卡記錄數據，例如公交車、城市地鐵等[115-116]。這些記錄中通常包含精細的時間和空間信息[117]，結合廣泛分布的公共運輸站點，可以為動態人口時空分布估計提供新的研究思路。文獻[28]基於北京市公交車站點數據，結合公交車刷卡記錄估計了北京市人口在早晚就業通勤和家庭活動時刻的位置分布進而識別了持卡人的居住地、就業地。文獻[62]基於北京市173個地鐵站的刷卡進出數據構建了以北京社區為空間單元的小時級粒度人口分布估計模型，並基於夜晚休息、早通勤、白天工作、晚通勤和晚間活動等多個典型時間段進行了研究。文獻[118]基於上海市289個地鐵站點，基於一周的地鐵刷卡數據識別單元內通勤、工作和休閒時間段的人口數量，通過面積權重將人口數分配到街道級別。

基於智慧卡刷卡數據的估計方法具有較為連續的時間解析度，相比土地利用數據，可以估計一天內任意時刻的人口活動情況，並且對人口的通勤空間分布特徵有較好的反映。但是，智慧卡刷卡記錄只能反映人口的行為片段，該方法在城市人口出行高峰的時間段精度和採樣頻率較高，對於沒有出行行為人口或出行活動較少的時間段無法很好地表徵。目前的研究一般以某一種公共運輸數據為研究對象，以此來研究人口活動具有一定的局限性，隨著智慧卡功能的升級和公共運輸體系的統一，在未來其數據仍然有很大的研究價值。

(2) 基於社交媒體數據的估計方法。網絡信息技術和智能感知設備的發展提供了各類豐富的應用軟體，改變了人們的生活行為方式，這其中有越來越多的應用軟體使用基於位置的服務(LBS)技術或由於用戶記錄從而提供大量關於個人的時空信息[119]，社交媒體就是其中的典型應用[120]。在使用社交媒體的功能中會產生定位信息，如社交媒體的籤到功能可以直接捕捉人口的活動位置[121]；社交媒體用戶發布的消息和內容也包含著用戶的時間和空間信息，從而形成用戶的時空分布軌跡。例如Twitter、Flickr的推文[122-123]，因此這就為動態人口分布估計提供了新的數據源。文獻[124]分析得出Twitter的推文可以提供小於10 m空間解析度的大量人口樣本。文獻[125]基於新浪微博籤到數據結合聚類算法將南京市劃分為90個空間子單元，並將一天24 h根據休息、工作、通勤、休閒活動分為8個典型時間段進行人口分布特徵研究。文獻[13]基於Twitter的地理推文數據將印度尼西亞雅加達地區3級行政區域的人口分布數據映射到4級行政區域，結果表明地理推文數據有效提高了人口分布估計的精度。文獻[79]提出社交媒體數據不僅可以作為傳統人口分布估計的一種協變量，也可以單獨作為數據源估計動態的人口分布情況。

基於社交媒體數據的方法具有米級空間解析度和小時級時間解析度，數據中包含的用戶信息可以持續地對大量人口在時間和空間上進行直接映射。相較於智慧卡刷卡數據，該類數據在連續單位時間上的用戶採樣更為均勻，避免了不同時間段內的數據稀疏性，並且對夜晚休閒時間的活動人口特徵進行了較好表達。但是，社交媒體數據具有明顯的採樣偏差問題，其用戶主要反映的是城市人口中的年輕人群的活動特徵，從而導致在空間上存在較多的零分布單元或稀疏單元即數據盲區，進而對研究結果產生誤差；同時社交媒體數據的數據量較大，錯誤數據、無效數據和重複數據較多，數據預處理工作較為複雜。目前社交媒體數據一般作為參考數據或協變量應用於城市人口時空分布估計，由於其數據記錄詳細、時空信息準確等特點，一直是相關研究關注的熱點。

(3) 基於手機數據的估計方法。智慧型手機作為現代化的通信設備已經在社會上廣泛普及[126]，手機的通信行為、應用行為和管理行為產生了大量帶有手機用戶時空特徵的信息，例如信令數據、通話記錄數據等，這些數據由手機網絡運營商收集且成本低廉[127]，因此已經有眾多學者利用手機數據對城市人口的時空活動進行了跟蹤、分析和研究[128-132]。

基於手機數據的特點和研究成果，近十年來使用手機數據對動態人口時空分布進行估計已經成為國內外研究的熱點。針對手機通話記錄數據，文獻[133]利用每個移動基站的話務量數據建立了深圳市1 km格網每小時的人口分布估計模型。文獻[134]分析了手機呼叫數量數據與人口數量之間的相關關係，並用Landscan數據集進行了驗證。文獻[61]將手機呼叫記錄數據及裡斯本的人口普查數據映射到100 m格網，並分析了手機數據在動態人口分布估計上的可能性。文獻[59]基於手機呼叫數據結合人口出行調查數據，利用多元回歸模型建立了日本多個城市500 m格網每30 min的人口分布估計模型。針對手機信令數據，文獻[63]綜合了3個手機運營商的手機信令數據，以3個運營商的基站服務範圍為基礎建立人口分析子單元，並利用POI數據將不同時刻的基站通信用戶數量分配到子單元中估計人口分布的情況，同Worldpop數據集的驗證結果表明其估計精度要高於其他模型。文獻[135—136]基於手機信令數據以基站服務範圍為空間單元，利用數據反演的方法估計了上海市每30 min的人口分布情況，並將結果分別映射到1 km和500 m的格網中。在此基礎上，文獻[137—140]結合GIS數據通過插值方法來彌補空間精度不足的問題。

基於手機數據的估計方法具有估計精度高、模型易操作和時間解析度高等優勢。相比其他新型數據，由於其用戶覆蓋群體範圍較大且不存在群體偏差，因此對於任意一天內任意時刻，典型的人口活動時間段都具有較準確的特徵表達。但是，該方法在空間解析度上直接受手機基站的密集程度的影響，在基站布設稀疏的城市就限制了其研究結果的應用範圍，並且不同手機運營商的市場佔比不同，不能直接與真實的人口分布特徵相關聯；同時以基站為質心建立數學多邊形作為空間單元偏離了城市人口的實際聚合方式，從而會導致對城市人口時空特徵認知的偏差[60]，其結果展示一般需要做插值或數據映射。

2.2.3 其他動態估計方法

除了上述估計方法以外，相關學者也採用了其他方法對動態人口分布進行研究。文獻[141]基於遺傳算法模型結合地形地貌、交通設施、土地覆蓋等GIS因子對山西省和順縣1 km格網的人口分布進行了動態模擬。文獻[142]根據耗散結構理論自組織建模原理，在費爾哈斯模型基礎上以城市區域人口為狀態變量模擬了廣州市人口分布。同時，部分研究者基於智能體模擬方法以家庭或個體為人口估計單位隨機生成人口分布數據，根據輔助GIS數據或社會經濟數據對單位人口進行遷移模擬，經過迭代達到穩定狀態即為城市人口分布的估計結果[2, 143]。另外，高解析度的遙感數據對於大範圍的動態人口分布的研究提供了進一步的支持。文獻[144]以隨機森林模型為基礎結合夜間燈光遙感數據、建築物數據及人口活動模式設計了小時級人口分布估計的框架。文獻[145]利用城市內不同功能、地形和地貌的遙感圖像和LBS軌跡數據輸入卷積神經網絡模型進行訓練，進而研究分析了多個城市的日常人口活動特徵，尤其在傳感器數據難以獲取的稀疏地區具有更好的應用效果。上述方法中以智能體為代表的模擬模型隨著模擬單位數量和影響因子的增加，計算量急劇增加，很難得到準確模擬結果[3]。而基於高解析度遙感數據的研究由於數據精度高、易獲取和覆蓋範圍廣的特點，其空間解析度較高且空間均質性較好，具有較好的方法普適性和遷移性。然而上述方法多基於更新頻率較低的數據，因此在時間解析度上還有待進一步精細化。

綜上所述，目前的人口時空分布估計方法針對估計對象可以分為靜態人口分布估計和動態人口分布估計2個方向(表 1)。其中，靜態人口分布估計方法經過長期發展，研究成果已較為豐富。以空間插值和統計回歸為代表，其估計結果的空間精度可達到幾十米級粒度，進一步可以達到建築物粒度，建模的數據和特徵也相對成熟。而對於動態人口分布估計，由於城市人口動態變化的複雜性，無法得到真實的高頻人口分布，目前的研究還主要依賴於新型的個體時空標記數據作直接統計和簡單特徵提取，並對不同時刻和典型時間段的人口活動特徵進行合理估算，估計結果取決於數據質量，時空解析度不穩定。

表 1 不同模型與方法特點Tab. 1 Characteristics of different models and methods

3 人口分布估計在城市發展管理中的應用

城市人口的研究與城市發展有著本質上的聯繫，這是因為城市的發展實質上就是人的發展，人口為城市的繁榮發展提供推動力，反之，城市的良好發展也會提高人口生活質量和幸福指數，二者緊密關聯，互相促進。相較於城市經濟、文化的研究，對城市人口的研究具有更重要的意義，其中城市人口分布具有重要的參考價值。目前，城市人口時空分布估計的研究成果已經在城市發展管理中得到了一定的應用。

3.1 城市空間規劃

城市的空間規劃是城市建設和管理的基礎內容，其具體的表現就是城市的空間結構。空間結構是城市發展的宏觀體現，是人口發展、政策規劃、自然環境等因素共同作用下人類空間活動和區位選擇的積累結果[146-147]，對城市空間結構的分析既是對已有城市空間規劃的驗證也是對未來規劃的重要參考，例如城市空間結構中的中心區域、功能區域和熱點區域都是政府管理和規劃的聚焦點[148-149]。傳統方法在解決這些問題的時候一般採用調研、政策統計、經濟文化數據推測和人為經驗等方法，這些方法具有「局部局限性」和「理論化」等問題，而通過城市人口時空分布估計的結果可以更直接和客觀地反映出城市空間結構的實際情況。文獻[78]利用空間插值結合DEM數據方法識別了瀋陽市的人口分布情況，其結果表明瀋陽市發展不符合單中心範式，具有11個明顯的人口分布核心，城市空間結構上具有多中心特徵。文獻[150—151]分別利用社交媒體數據和移動手機數據進一步識別了城市的多中心結構。文獻[152]利用英國某電信廠商的通話定位數據分析了幾十億條人口交易記錄的分布，從考慮地理區域和居民聯繫強的角度上提出了一種細粒度的城市區域劃分方法。文獻[125]利用新浪微博的籤到數據研究了南京市人口在不同時間的分布位置，並將南京市人口活動區劃分為就業活動區、居住活動區、休閒活動區、夜生活活動區和綜合活動區5類。文獻[153]利用手機數據區別了上海市用戶的日間駐留地和夜間駐留地，其結果表明上海市的空間結構在中心城區和郊區之間還存在一個中心城通勤區，中心城通勤區以內和以外區域存在顯著差異。文獻[154]利用空間句法和百度LBS大數據比較了合肥市城區理論規劃的人口密集區域和實際情況的差異，結果表明由於交通可達性、人口生活習慣等問題，理論上的人口密集區域存在與實際密集區不符的情況。

3.2 基礎設施配置與交通資源優化

城市的基礎設施和交通系統一直是城市研究和管理人員關注的重點之一，通過分析人口在城市內的行為軌跡、活動強度和行為特徵，能夠揭示城市人口的活動演化規律及城市地理現象[105]，可以為城市交通資源優化、基礎設施配置提供支持，而動態的人口分布數據可以很好地提供人口在時空中的實際變化情況。

文獻[40]利用GPS和活動日誌結合的方法對北京市郊區巨型社區的人口動態分布進行了研究，結果顯示郊區社區人口的個體活動在工作日和休息日有較大差別，總體上對市區空間的依賴性較大，顯示出郊區配套設施不完善、休閒和商業中心缺乏等問題。文獻[34]基於手機數據定量分析了肯亞居民到達公共健康設施的次數和距離，結果顯示距離醫療設施偏遠的居民到醫院出行頻率明顯增加，因為這些居民普遍缺少流行病疫苗的接種，表明肯亞的公共健康設施分布不均。文獻[62]利用地鐵智慧卡刷卡數據分析了北京市每小時的人口分布情況和人口出行特徵，結果表明北京人口活動從夜間到白天人口呈向心流動模式，同時在晚高峰的人口估計總數低於早高峰，說明晚高峰有一部分居民在沒有時間壓力的情況下選擇了其他交通出行方式。文獻[138]利用手機信令數據分析得出上海市人口白天向中心聚集，夜間向郊區分散，就業人口較居住人口具有更顯著的中心聚集度，從而產生明顯的職住關係不匹配現象，是交通擁堵發生的重要原因。

3.3 商業格局識別與規劃

城市的商業發展是城市經濟的重要組成部分，通過結合城市人口的時空分布情況可以為識別商業空間格局和商業規劃調整等應用提供信息支持。文獻[155]基於社交媒體籤到數據分析了上海市人口分布的熱點區域，同時結合百度的POI數據提出了商業店鋪選址的4個影響因素：多樣性、競爭性、相關性和客流性。文獻[156]基於百度POI和熱力圖數據分析了株洲市天元區人口空間分布和商業空間聚集情況，結果表明天元區零售業較為發達而服務業較為滯後，需要開展商業業態調整。文獻[157]以贛州市中心人口分布數據為基礎，結合經濟社會發展、POI數據、城市總體規劃數據對贛州市中心商業中O2O電商和實體商鋪的分布格局進行了分析和研究，進而提出了傳統商業轉型的一些建議。

3.4 城市綜合管理

城市人口時空分布除了上述應用之外，還可以應用於城市公共安全、城市環境與居民健康、城市防災減災等方面，為城市的綜合管理提供科學建議。文獻[158]利用行動電話數據進行實時的人口分布估計並應用於2010年尼泊爾、海地地震後受災人群和人口遷移的評估，結果顯示手機數據很好地反映了地震後人口時空分布的變化，尤其是加德滿都山谷人口數量明顯高於正常水平，較多人口也遷移到了尼泊爾中南部地區，為災害救援和人道主義機構提供了及時的信息。文獻[159]以百度地圖用戶在出行之前的查詢記錄數據，對城市人口分布進行了1~3 h的提前預測，並分析出可能的人口群體聚集區域，同時設置人群數量閾值進行人群災難預警，結果表明百度地圖查詢數據與區域內定位用戶數量之間存在強相關關係，能夠以定量方式預測群體風險事件。文獻[15, 160]通過行動電話數據獲取了動態的人口分布，同時結合基於測量站點的PM2.5的觀測值，實現了人口在PM2.5中暴露的實時估算，研究表明通過考慮人口分布和PM2.5的時空變異性建立一個環境汙染物暴露評估的框架，有效地支持了相關環境政策的調整。

4 存在的主要問題與未來研究展望

儘管對於城市人口時空分布研究的成果已經相當豐富，但由於城市人口分布的隨機性、複雜性和已有方法模型的局限，目前的研究還存在一些問題，這同時也是未來的研究方向。

4.1 場景關聯的人口分析單元構建

目前，常用的空間分布單元包括行政區劃、格網、建築物等，這些空間單元對人口分布刻畫的精細程度、表達效果都不盡相同，在實際應用時可能存在精細化程度不足、空間連續性低、與城市空間形態不符等問題。需要以人口分析為核心，以應用場景為導向，構建相應的人口分析單元。其中，場景一般具有多尺度、多類別以及動態變化的特點，然而當前對於場景的定義模糊，場景需求認知方法研究較少，同時還缺乏空間單元和場景變化關聯標準，這些問題都導致單元劃分和構建結果可能無法支撐後續的人口時空分布研究和建模。因此，需要從場景認知角度出發，研究人口分析單元的系統構建方法。首先，研究城市應用場景的具體需求認知方法，包括時間、空間、屬性等特徵，並與人口分析單元進行關聯性表達。然後，在此基礎上，人口時空分布估計的研究對象是城市人口，需要針對人口時空分布研究的目標、尺度並從人口分布特徵和規律角度出發考慮一種普適性空間單元的構建，從而提高結果的科學性和解釋性。最後，可以考慮不同尺度的人口分布特徵和主要影響因素，並結合場景認知結果，研究多個空間尺度下場景關聯的單元自適應構建方法，有效支撐應用的開展。綜合上述研究方向構建人口分析單元，可以更好地挖掘人口分布規律與模式，尤其可以獲取更長效的動態人口數據；同時可以契合場景需要的人口分布信息和可視化方式，支撐進一步的應用分析。

4.2 多源異構數據的融合

帶有個體時空標記的新型數據為城市人口分布估計帶來了豐富的信息和新型的研究模式，也具有難以相互融合的研究局限和使用誤區。目前的主要問題在於：①新型數據大多具有採樣偏差的問題，每種數據背後代表的人口群體數量、空間範圍都不同並且存在交叉，不能作簡單的相加處理進行融合；②時空尺度一致的數據很難收集，尤其在時間尺度上，是數據融合的關鍵；③對於新型數據和城市人口分布的關係，在方法模型上還比較匱乏，研究結果很大程度決定於數據；④在大數據時代的衝擊下，部分研究者以數據決定論的方式開展研究而沒有關注人口分布背後的原因和機制。因此，未來對新型數據的研究可以從以下幾點展開：①解析不同數據的具體特點，從空間覆蓋範圍和與人口相關性高低上尋找數據融合的突破點；②解決時空尺度一致問題，考慮在時間尺度上設定標準的時間尺度作映射；③引入以AI為代表的智能的建模方法，提高模型處理多源數據的能力；④數據是服務於理論的工具，是為了證明理論的前提和假設[161]，應堅持對數據確定性的追求並從數據中挖掘有效的信息。

4.3 數據依賴與規律驅動建模

數據質量一直是城市人口時空分布估計的重要基礎，目前的研究中，存在大量數據時空間尺度不匹配、數據缺失和依賴數據質量等問題，給數據的前期處理和建模帶來了較大的困難。此外，部分研究基於試驗地區特點，在數據和模型上做了特定處理和調整，導致研究結果的泛用性較差，沒有挖掘人口分布的實質規律，不同的區域或城市很難復用其成果，例如文獻[162]利用街區的人口統計數據進行建築物級的人口分布估計，而在我國公開獲得的人口統計數據只能到區縣一級。因此，在未來的研究中需要從人口分布關鍵特徵挖掘和提高模型可解釋性的角度開展以下方向研究：①基於通用、易獲取或少量的數據進行建模，提高模型的泛用性；②從空間區域屬性差異對人口分布的影響角度出發，對城市進行分區建模和估計，例如，對城市空間區域按人口密度、功能、城市開發強度、離中心距離等屬性進行分區，可以有效提高估計精度，並增強分布結果的可解釋性；③對人口分布從時間和空間特徵上進行分解，例如在時間上可分為長期分布模式、短期分布模式和隨機分布模式，在空間上可分為全局分布概率和局部分布概率的研究，進而組成可泛用、可遷移的人口分布估計框架。

城市人口分布估計的研究需要考慮基於通用的或質量一般的數據，以挖掘人口時空分布規律和模式為目標建立模型，從而提高模型的普適性和規律性，同時結合長期的數據獲取機制，使研究結果能夠持續獲取人口分布信息。

4.4 估計結果的科學驗證

人口時空分布估計結果的驗證一直是研究中的重要步驟，現有研究主要是通過與人口統計數據比較或採樣驗證的方法對結果進行驗證。但是這種方法是一種粗粒度的驗證，只能對人口總數作大致的檢驗，而對於精細化程度較高的模型無法適用，尤其是對高空間解析度和動態人口分布估計研究，由於缺少權威的數據支撐，其研究結果很難做科學驗證，從而無法對模型做有效的反饋修改。因此，除了依靠政府提供的精細化人口數據作為支撐，還需要建立估計結果的驗證機制：①參考全球的或國內的人口分布數據集進行驗證對比，例如GPW、LandScan、Worldpop等可以提供空間和時間尺度上的公開數據集；②利用不同來源和採樣頻率的數據結合機器學習、深度學習等多種模型分別進行建模，並對結果進行相互驗證，提高結果可信度；③考慮在研究區域內開展隨機採樣，並對區域內人口變化進行實地調研和統計，對比研究的總體精度，同時驗證人口活動特徵的科學性。

5 結語

綜上所述，首先在空間分布單元上，分為空間尺度需求、場景需求和研究數據需求3個方向，豐富了人口分布信息展現的方式和效果。在城市人口分布估計的方法上，針對靜態人口，從傳統城市密度模型和分配人口統計數據的空間插值法，發展為結合多種地理大數據的統計回歸方法；針對動態人口，從時間粒度較粗的土地利用數據建模到基於新型個體時空標記數據的估計方法，極大地提高了城市人口時空分布估計的精確度和時空解析度。在未來，從構建適應應用場景和表達時空分布特徵的人口分析單元出發，應考慮如何融合多源異構數據並將靜態人口建模的方法融入動態人口估計，提高模型的可解釋性和規律性並減少數據依賴，同時提供科學的驗證方法，進而獲得長效、高時空解析度的人口分布信息。

作者簡介

第一作者簡介：吳華意(1966—), 男, 教授, 研究方向為時空大數據關聯分析與知識挖掘。E-mail: [email protected]

通信作者：李銳, E-mail: [email protected]

初審：張豔玲

覆審：宋啟凡

終審：金君

資訊