基于手機信令數據的居民線下消費空間自相關分析
來源:大數據部 ??時間:2020-02-28

時空行為研究一直以來都是城市地理學研究的重點,大數據時代的到來促使傳統的時空行為研究方法產生革新,并逐漸應用到對城市空間和城市等級體系的研究中。本文以居民線下消費為應用場景,利用手機信令數據、POI、土地利用分類圖等多源數據,探索居民消費行為的時空分布特征

一、研究現狀

當前,大數據背景下對時空行為的研究分為兩類,一是基于GPS、GIS及網絡日志結合的研究,如Kwan等(2004)[1]結合波特蘭地區收集的10000個2天活動日志調查數據(日志體現的活動地點坐標是點對點數據,在獲取居民出行路徑數據時借助于GPS工具)和大尺度的地形圖數據,運用核函數分析方法及3DGIS軟件對居民的活動密度、分布以及變化進行了時空模擬;Edwards等(2009)[2]使用GPS和網頁工具(能記錄時間、速度、距離以及經緯度和運動方向),并結合Google地圖,模擬了悉尼和堪培拉2個城市76個旅游者的行動軌跡,從而分析旅游者的出行路徑、換乘的交通方式、出行遇到的障礙等特征。二是基于社交網絡、手機信令、智能卡數據的研究,如Malleson等(2012)[3]挖掘了英國利茲城40萬個用戶在1年內的Twitter數據,結合核密度分析,根據特定Twitter用戶在不同地方發布信息的密度或頻次來判斷用戶的活動地點和行為,并構建了一個基于社交網絡數據和傳統人口普查數據的居民智能行為模型;龍瀛等(2012)[4]則利用1周855萬個公交IC智能卡數據,在構建出行和“地點—時間—時長”兩種數據處理模型的基礎上,結合居民出行調查、城市土地利用信息,研究了北京居民的職住關系和通勤行為;Jun(2014)利用交通數據了解消費者行為;復旦大學城市發展研究院秘書長張伊娜副教授團隊(2017)提出,上海市各商圈數據顯示,除個別極熱門商圈外,其他商圈的成單量與人流量的比例基本在0.1上下,人流量與消費量有較強的正相關性。

總體來講,利用社交網絡數據、手機信令數據、公交卡數據進行城市居民行為的研究對于城市的空間管理、交通管治、社會服務等方面的實踐具有重要意義,較需要固定研究對象的GPS和網絡日志等手段具有大樣本量和低成本的優勢,但現有研究較少,方法也尚未成熟。因此,本課題將以重慶市居民消費為應用場景,嘗試將手機信令數據與其他多源數據相結合,從數據的時空特征角度,探究分析居民線下消費行為的影響因素。

二、研究方法

空間自相關的度量是用來檢驗在空間上具有一定規律性的空間變量在不同空間位置上的相關性。空間自相關研究方法與GIS系統相結合,可以有效地展現出空間單元的位置及與其他空間單元之間的相互關系,目前已應用到疾病傳播、人口分布、經濟發展等方面的研究中[5]-[8]。本文采用空間自相關分析方法對重慶市各區縣居民線下消費行為的空間依賴性和異質性進行了研究。

1、全域空間自相關

全域空間自相關是對屬性值在整個區域的空間特征的描述。用來檢驗空間變量的取值是否與相鄰空間上該變量取值大小有關[7]。全域空間自相關的指標和方法主要有Global Moran’s I、Geary’s C 和Getis’C。Moran Index 值是空間統計分析中被廣泛應用的空間自相關判斷指標。I的取值范圍從-1到1:當I =0時,代表空間無關;當I取正值時為正相關;當I取負值時為負相關。對于空間是否有自相關性存在,常采用統計驗證的方式,即使用z 檢驗[7]標準化Moran’s I值,z值為正且顯著時,表明存在正的空間自相關,z值為負且顯著時,表明存在負的空間自相關,z值為零時,觀測值呈獨立隨機分布。

2、局部空間自相關

全域空間自相關假定空間是同質的,即只存在一種充滿整個區域的趨勢。但事實上,區域要素的空間異質性并不少見[9]-[10],因此,需要發展區域統計方法來衡量每個空間要素屬性在“局部(一般為相鄰)”的相關性質。通過定義不同類型的“局部”范圍(不同的空間連接矩陣),區域空間自相關分析可以 幫助更準確地把握空間要素異質性特性。本文采用空間聯系區域指標(Local Indicators of Spatial Association, LISA),即Local Moran’s I來衡量局域空間自相關性[10]。每個區域單元的LISA是描述該區域單元周圍顯著的相似值區域單元之間空間集聚程度的指標,所有區域單元LISA的總和與全域的空間自相關指標成比例。

三、數據與分析

1、研究數據

本研究區域為重慶市,包括渝北、南岸、九龍坡、沙坪壩、江北、萬州、涪陵、巴南、開州、合川、永川、江津、渝中、北碚等38個區縣。所使用的數據主要包括手機信令數據、POI和土地利用分類圖(2016),其中,手機信令數據是各區縣2019722-2019728日的每日人口活躍數量。

2、試驗結果分析

上文提到,商圈人流量與消費量有較強的正相關性,而本文使用的手機信令數據僅能衡量每個區縣的人口數量,而非消費人流量,因此,首先應從手機信令數據中識別出消費人口數量。本文通過對手機信令數據與土地利用分類地圖、POI數據進行空間疊加,識別手機用戶的職住地,并且設定職住地之外、消費熱點區域、逗留時長超過30分鐘等一系列規則,篩選出區域線下消費人流量,如圖1所示。

1 重慶市各區縣日均線下消費人流量分布

基于重慶市各區縣日均線下消費人流量數據,運用ArcGISGeoDA,分別計算全域和局部空間自相關指數,分時段對比居民線下消費行為的時空分布特征。

2.1日均線下消費行為空間自相關分析

計算重慶市各區縣日均線下消費人流量的全域Moran I=0.267(圖2),說明消費人流量的分布具有強空間聚集性,各區縣之間的消費人流量受空間位置的影響較顯著。

進一步計算LISA值,并在z檢驗的基礎上繪制LISA分布圖。LISA分布圖表達了變量值在區域和其周圍區域四種模式的局域空間聯系,即高高(High-high)、高低(High-low)、低高(Low-high)和低低(Low-low)。High-high表示區域和其周圍區域的屬性值都較高,High-low表示區域的屬性值較高,但其周圍區域的屬性值較低。Low-low、Low-high的含義與High-high、High-low正好相反。High-high和Low-low表明區域間具有較高的空間正相關,揭示區域的集聚和相似性。High-low和Low-high則表示區域間存在較強的空間負相關,區域具有異質性。由圖3(右)可知,重慶市38個區縣中,10個區縣呈High-high模式,為高值聚集區;3個區域呈Low-low模式,為低值聚集區;5個區縣呈Low-high模式,被高值區包圍。

2日均線下消費人流量全域空間自相關分析

3 日均線下消費人流量局部空間自相關分析

2.2分時段線下消費行為空間自相關分析

對重慶市各區縣連續7日的消費人流量數據分時段拆分,可進一步對比分析不同時段的消費行為特征,本文選取了工作日和休息日、白天和夜間兩種劃分方式。

分別計算2019722-2019726日和2019727日-2019728日的日均消費人流量,用于衡量各區縣工作日和休息日的消費活躍度。結果顯示:工作日和休息日的消費人流量全域Moran I的數值分別為0.265和0.282,休息日消費行為的空間依賴性更強。對比兩個時段的Lisa圖(圖4),發現南川市在休息日的消費活躍度受周邊區縣影響較大,呈現Low-high聚集特征,與之重慶大都市區的生態后花園”定位不甚相符,仍有進步空間。

4 工作日/休息日線下消費行為LISA集聚圖

分別計算白天和夜晚(22:00-6:00)的日均消費人流量,用于衡量各區縣白天和夜晚的消費活躍度。結果顯示:白天和夜晚的消費人流量全域Moran I的數值分別為0.258和0.282,夜晚消費行為的空間依賴性更強。對比兩個時段的Lisa圖(圖5),發現長壽縣消費人流量白天呈Low-High模式,夜晚則呈High-High模式,夜間消費活力強勁,與該地區夜生活相關POI數量較多的現狀相匹配。

5 白天/夜晚線下消費行為LISA集聚圖

四、結論

本文基于手機信令數據,對重慶市38個區縣居民線下消費行為進行了空間自相關分析,探索了消費行為的空間依賴性及其作為經濟發展水平微觀化的空間異質性。一方面可以為我國居民消費趨勢分析與預測提供理論依據,有助于提高消費領域宏觀經濟分析研判的科學性、合理性和完整性。另一方面,本文研究方法和結論可應用于城市邊界、就業趨勢、人口流動、高新技術產業監測等具有時空特征的領域,不僅能夠輔助宏觀經濟預測研判,還能夠服務于區域產業發現、空間規劃、招商引資等環節,為區域發展帶來經濟效益。

 

參考文獻

[1] Kwan M P, Lee J. 2004. Geovisualization of human activity patterns using 3D GIS: A time-geographic approach// Goodchild M F, Janelle D G. Spatially Integrated Social Science: Examples in Best Practice. Oxford: Oxford University Press: 48-66.

[2] Edwards D, Griffin T, Hayllar B, et al. 2009. Using GPS to track tourists spatial behaviour in urban destinations[J/OL]. Available at SSRN: http://dx.doi.org/10.2139/ssrn.1905286.

[3] Malleson N, Birkin M. 2012. Analysis of crime patterns through the integration of an agent-based model and a population microsimulation. Computers, Environment and Urban Systems, 36(6): 551-561.

[4] 龍瀛,張宇,崔承印. 2012. 利用公交刷卡數據分析北京職住關系和通勤出行. 地理學報, 67(10): 1339-1352.

[5] 林琳, 馬飛. 廣州市人口老齡化的空間分布及趨勢[J]. 地理研究, 2007, 26(5): 1043-1054. LIN Lin, MA Fei. Spatial distribution and trends of the aging of population in Guangzhou[J]. Geographical Research, 2007, 26(5): 1043-1054.

[6] ORD J K, GETIS A. Local spatial autocorrelation statistics: distributional issues and an application [J]. Geographical analysis, 1995, 27(4): 286-306.

[7] 孟斌, 王勁峰, 張文忠, 等. 基于空間分析方法的中國區域差異研 究[J]. 地理科學, 2005, 25(4): 394-400. MENG Bin, WANG Jinfeng, ZHANG Wenzhong, et al. Evaluation of regional disparity in China based on spatial analysis[J]. Scientia Geographica Snica, 2005, 25(4): 394-400.

[8] 翁培文, 蔡博文. 空間離散指標:舊觀念、新公式[J]. 臺灣地理資訊 學刊, 2006, 4: 1-12. WENG Peiwen, Tsai Borwen. Spatial dispersion index: old conception, new formula [J]. Journal of Taiwan Geographic Information Science, 2006, 4: 1-12.

[9] ANSELIN L. Local indicators of spatial association-LISA [J].Geographical Analysis, 1995, 27(2): 93-115.

[10]GETIS A, ORD J K. The analysis of spatial association by use of distance statistics [J]. Geographical Analysis, 1992, 24(3): 189-206.

 

作者簡介

陳東,女,博士,國家信息中心大數據發展部工程師,研究領域為時空大數據。

黃倩倩,碩士,國家信息中心大數據發展部,研究領域為機器學習、生物信息學。

邢玉冠,博士,國家信息中心大數據發展部,研究領域為信息處理、數據分析。

本文發表于由國家信息中心數字中國研究院編輯出版的《數字中國建設通訊》2019年第5

双喜大厅棋牌 平特肖赢钱秘诀 今天上海快三开奖查询结果 七星彩走势图 广东11选5玩法介绍 专门看赛车比赛的软件 中国股票分析师排名 七乐彩预测号码 国民彩票秒速时时彩 江西多乐彩走势图基本图 东商期货配资 极速11选五是真的吗 每日三支股票推荐 福建快三推荐号码今天 浙江体彩大乐透11选5预测 宁夏十一选五期的基本走势图 吉林11选五5遗漏号码