行业新闻

黑夜给了我黑色的眼睛——全球夜间灯光数据分析

5月3日更新:

1. 数据下载地址:Earth Observation Group - Defense Meteorological Satellite Progam, Boulder,这个链接有不同年份不同卫星获取的不同类型的灯光数据。

2. 克什米尔地区的亮度问题:根据评论区朋友的提醒,那个地方应该不是克什米尔,而是印度的西北部和巴基斯坦的东北部地区。至于具体原因,还是不造。

—————————————————————————————————————————

良夜灯光簇如豆。灯火通明,一直是繁荣、热闹的象征。用夜间灯光研究人类经济生活,直觉上,倒也合理。更何况已有不少学者用更严谨的实证研究证明了灯光数据与经济指标存在着紧密的联系。

在社会科学研究中,使用最多的夜间灯光数据,是由美国国防气象卫星计划(Defense Meteorological Satellite Program,DMSP)一系列气象卫星观测所得。1976年,该计划发射的F-1卫星上首次搭载OLS传感器(Operational Linescan System,不是Ordinary Least Squares)。该传感器具有较高的光电放大能力,可探测到城市夜间的灯光、火光乃至车流等发出的低强度灯光,因此,这一系列夜间灯光作为人类活动的表征,可以成为人类活动监测研究良好的数据来源。

目前,美国国家海洋和大气管理局(NOAA)发布的灯光数据产品有四种,目前使用较多的是稳定灯光数据(stable lights),它剔除了由火灾、爆炸等造成的短暂亮光,只包含了相对稳定的灯光,且均为无云数据。

一个国家或地区的灯光亮度是其区域内部所有栅格灯光亮度的总和,其中每一个栅格表示30秒度(30秒经纬格网)。该数据的灯光灰度值(DN值)范围均为0-63,当一个栅格的DN值达到63时,将无法继续增加。这一问题使得灯光数据出现截断,并且这一现象在发达国家还比较常见。

不过有研究表明,中国目前还没有灯光取值上限的问题。毕竟我国正处于并将长期处于社会主义初级阶段。

一、灯光数据

下面这张图就是我们伟大祖国及周边地区的灯光地图。数据来源于2013年的稳定灯光数据,无灯光的背景噪音全部用0替换,颜色越白表示灯光亮度越高。

灯光亮度存在明显的集聚,在环渤海、华北平原、长三角、珠三角,以及台湾西部滨海平原等人口聚集区域存在大片亮光,而其他分布较散的高亮点也都与大城市重合。

周边国家的灯光亮度同样与人们的经济活动密切相关。韩国和日本有大片的灯光高亮区域,而蒙古高原和东南亚的亮点分布却比较零散。不过奇怪的是,为何克什米尔地区竟一片光亮?



当我们在百度或谷歌上搜索灯光数据或夜景地图时,朝鲜——我们的友好邻邦总是会出现在联想字段,这似乎是一个特别为人民群众所喜闻乐见的一个梗。在上图中,对比最明显的就是朝鲜半岛的两个国家,图中的韩国竟不像是在朝鲜半岛,反倒像个四面环海的岛屿。

根据带有灯光灰度值信息的栅格图片制作热力图,朝鲜半岛的灯光亮度情况更加清晰。



北部的朝鲜只有平壤附近有明显的灯光,要找到其他光点还是有点费眼,不过还是可以看到与我国丹东市隔江相望的新义州市,以及日本海沿岸零星点缀了些许黄色斑点,这里分布着朝鲜的大城市与经济改革的特区。

南部的韩国与之泾渭分明,越过三八线,不仅首尔与釜山等大城市附近有明显的光亮,其他人类活动区域也是灯火辉煌,仅东北太白山脉附近灯光强度稍弱。

二、灯光数据的空间分析

以上灯光数据的分析单位为像素或栅格,如果利用行政区划的矢量数据对灯光数据进行处理,则可以对行政单位进行实证分析。

ArcGIS和QGIS等地理分析工具都可以对带有数据信息的影像资料进行处理。

許多科學與環境的資料庫使用的是網格狀的影像資料,高程資料 (DEM) 同樣的也是以影像檔的方式發行。這些影像檔中,要呈現的資料數值就是影像中每個像素的像素值。有些時候,我們會需要找出在特定地點的像素值,或是把某個區域的所有像素一同囊括以進行後續分析。這些功能在 QGIS 中可以透過兩個附加元件來達成,分别是 Point Sampling Tool 和 Zonal Statistics plugin。

我依然以2013年的稳定灯光数据作为原始数据,使用中国地级市的行政区划矢量图进行边界裁剪,将得到的栅格数据与灯光数据进行叠加,计算各城市(或地区)的DN平均值(DN总值/栅格数),即灯光亮度或灯光均值。



灯光亮度位居前十的城市依次为:澳门、东莞、深圳、中山、香港、佛山、苏州、上海、厦门、无锡。由灯光亮度的计算方式所决定,西部一些地广人稀的地级市(或地区)排名较低,如阿里地区、那曲地区、和田地区、日喀则市等。总体而言,中国灯光亮度分布呈现东部最强、中部次之、西部最弱的格局,直观上,与我国人口或GDP的分布大体一致。

根据地理学第一定律,即地理事物或属性在空间分布上互为相关,存在集聚(clustering)、随机(random)、规则(Regularity)分布。我们可以利用空间自相关系数来测量和检验空间物体极其某一属性是否高高相邻分布或高低相错分布。

通过各地级市的空间位置数据建立空间权重矩阵,再根据空间权重矩阵计算各地级市灯光数据的空间自相关指标。



上图中“高-高(High-High)”表示某一空间单元和周围单元的属性都较高,该单元和周围单元组成的子区域即为通常所说的热点区域。从图上看,长三角和珠三角便是本身灯光亮度较高,以及周边城市灯光亮度也不低的区域。

“低-低(Low-Low)”的含义则相反,我国西部大部分城市则是本身灯光亮度及周边地区灯光亮度都不高的区域。

“高-低(High-Low)”表示某一空间单元属性值较高,而周围单元较低。从图上看,甘肃省的嘉峪关市和海南省的海口市、三亚市便属于这样的区域。

“低-高(Low-High)”正好与此相反,安徽省的滁州市和宣城市属于本身灯光亮度较低,而周边地区灯光亮度较高的城市。

三、灯光亮度与GDP的关系

目前,已有不少学者将灯光数据用于研究不同国家或地区经济活动的表现,他们发现夜间灯光数据可以作为一个国家或地区现行统计指标比较好的替代指标,较亮的夜间灯光照明与较高的GDP紧密相连,一个地区的卫星观测数据可以更为准确地揭示当地的经济发展水平。

我们以横轴为城市灯光均值,纵轴为GDP做散点图,可以看到,二者大体呈现一种正相关的关系。图中将与拟合直线距离较远的一些点标注了出来。图中灯光均值和GDP都取了自然对数。



接下来,我以GDP作为因变量,灯光数据为自变量进行OLS回归,看看二者是否存在显著的相关关系。

模型中的核心自变量为灯光均值,即前文提到的灯光亮度,由地区的DN总值除以栅格数而来。出于稳健性检验的考虑,我用DN总值除以地区面积得到所谓的灯光密度,来替换灯光均值进行分析。

不久前在知乎上看到一句话,大致意思是,各种XXX分布地图,归根结底都是人口分布图。仔细想来,这句话还是很有道理的,不管是GDP还是灯光亮度,都是人类活动的产物,人口密集的地方总是占据优势。所以在回归模型中,还需要控制人口数量(年平均人口)。

除此之外,我还控制了城市面积、城市级别,以及所处省份等等。模型中灯光数据和面积、人口变量都取自然对数,省份虚拟变量以安徽省为参照组,回归表格中只列出系数显著的省份。



两个模型的分析结果相差不大,灯光均值系数为1.395,灯光密度为1.267,二者都在0.001的水平上显著。与其他自变量相比,灯光数据的系数最大。

另外,城市面积与城市人口也对GDP有显著影响,这些都是意料之中的。除此之外,作为省会的城市,其GDP要显著高于非省会城市,副省级城市GDP也要显著高于其他级别的城市。

对模型进行残差分析,可以检测出模型中的离群点和高杠杆值观测点。以GDP的实际值为横轴,以根据模型计算得到的GDP预测值为纵轴画散点图,将这些强影响点标注在图形中。



图中标注了名称的点均为强影响点,深圳、大连、鄂尔多斯、大庆、宜昌、包头、铜陵等红色点标注的城市表示GDP预测值要低于其GDP实际值,而呼伦贝尔、黑河等橙色点标注的城市表示GDP预测值要高于其GDP实际值。

从分析结果看,夜间灯光亮度与GDP存在十分显著的正相关关系。所以,借助夜间灯光数据衡量一个地区的经济活动,尽管不能完全准确,但不妨碍其成为对部分经济指标的重要补充。相对于官方非官方的统计数字而言,灯光,也许稍微客观一些。

使用灯光数据的严谨和复杂的实证分析不胜枚举,本文只是游戏之作,供君消遣。欢迎批评指正,一定虚心讨教。

参考文献:

Bhandari, L., & Roychowdhury, K. (2011). Nightlights and economic activity in India: A study using DMSP-OLS night timeimages. Proceedings of theAsia-Pacific Advanced Network, 32,218–236.

万鲁河, 王绍巍, & 陈晓红. (2011). 基于 GeoDA 的哈大齐工业走廊 GDP 空间关联性. 地理研究, 30(6), 977-984.

徐康宁, 陈丰龙, 刘修岩. (2015). 中国经济增长的真实性:基于全球夜间灯光数据的检验. 经济研究, (09), 17–29–57.

平台注册入口