英文原文: Data Mining Reveals the Extent of China’s Ghost Cities
近年来,中国经历了人类历史上前所未有的城镇化发展,其城市占地面积从 1984 年的 8800 平方公里,经历短短 26 年,就扩张到了 2010 年时的 4.1 万平方公里,而这仅仅是个开始。2011 年到 2013 年,中国使用的钢筋混凝土,比美国在整个 20 世纪用的还多。
图片来自网络
然而有一些楼房是被错置的。在中国的很多地方,开发商飞速地盖起诸多房屋,即使是在这个世界第一人口大国,也早已远远超过了市场需求。这个结果正是“鬼城”现象的成因——整个城市地区多多少少地被遗弃了。
图片来自网络
但是过去很多关于“鬼城”的报道都被当做趣闻轶事看待,对“鬼城”的判定也只基于不可靠的研究数据——比如简单数一数夜间住宅建筑的亮灯数量。这是特别不准确的量化方法,尤其是它忽略了旅游业的季节性变化。很多地方在旅游旺季很热闹,但在淡季期间却空空荡荡,这样的现象不仅仅在中国有。这种研究方法本身就是个问题。
图片来自网络
于是,问题来:中国的“鬼城”问题事实上究竟有多严重呢?
今天百度给了我们答案,这个中国版谷歌,地球上网络公司巨头之一。在百度的大数据实验室中,迟光华和他的同事们用百度收集的用户位置数据,准确指出了中国鬼城的位置。与此同时,研究团队还根据时间的推移追踪人们的位置,以此分辨鬼城和“有淡季旺季之分”的普通城镇。
中国有 13.6 亿人口,其中 7 亿已经注册成为百度用户,这使得百度的数据库极具规模。当然这些用户大多数是年轻人,所以这些数据无法代表整个中国社会。不过,它确实给出了有关城市密度的思考。
图片来自网络
在 2014 和 2015 年,百度每天追踪用户位置,时长超过 6 个月,并使用了一个普遍的聚类算法来计算用户的标记位置。然后他们把这些位置信息和另一类已知的居住区域数据关联起来,得出他们的实际居住位置。最后计算出城市密度——即平均每 100 平方米内的居住人数。
中国住房和城乡建设部规定,一个标准的城市地区,每一平方公里应容纳 1 万人。迟光华和公司将人口密度只达到(或不足)以上标准一半的地区定义为鬼城。为了找出这些地区的具体位置,他们建立了一个简单的算法。他们还追踪城市密度随时间产生的变化,看看它是否会在旅游季节回升。
他们将结果写成了一篇有趣的报告:这个团队不仅在中国发现了 50 多座鬼城,他们还分析了鬼城的空间分布以及它们与周围的地理城市环境的联系。
图片来自网络
以在山东威海的乳山市为例,这里靠海,约 34 千米的美丽的海岸线已经被过度开发。这里的房屋在一年中的大部分时间中都是空着的,但在旅游旺季时人口稠密。这清楚地表明乳山市是一个旅游中心而并非鬼城。
相比之下,位于内蒙古鄂尔多斯的康巴什市,原本的居民密度就已经非常低了,而且这里还保持着一个清晰的周循环式人口变化趋势。这是一个明显的标志——康巴什是一个幽灵的城市。
这是第一次以得当的测量方式研究鬼城现象的结果。“不再只以计算一定住宅区内夜晚亮灯房屋的数量作为鬼城的指示标志。百度大数据可以精确地计算人口,在现实中,在全国范围内。”迟光华说。
考虑到结果有可能影响房地产价格,百度并没有在研究报告中给这 50 多座鬼城排名。他们认为,这应该有助于中国政府在未来做出更好的决策规划,并提醒人们可以考虑搬入这些区域中。
|