【文章框架】
贫困治理离不开基础经济社会调研数据的支持,但是当传统的数据收集无法满足现实需求时,创新型贫困测量方法是必要的。斯坦福大学团队近期公布了一项新的研究成果,他们将卫星从外太空拍摄的高清照片、卷积神经网络模型(Convolutional Neural Networks,用于对大型图像进行处理)、深度机器学习相结合,用于预测极度贫困地区消费支出和资产财富情况。
【观点摘要】
1、由于卫星无法从外太空探测到该地区的夜间灯光,也就无法分析当地经济发展状况,更无从得知该地区贫困的地域分布差异及贫困程度随时间变化情况。不仅如此,夜间灯光图片无法区分人口稠密的贫困地区和人口稀疏的富裕地区,为人均消费情况分析增加困难。
2、斯坦福大学团队采用深度机器学习方式,通过对上千种标签化图片的初步学习,结合非洲五国(尼日利亚、塔桑尼亚、乌干达、马拉维和卢旺达)有限的消费数据和资产指标,对卫星拍摄高清白昼图片内图形特征进行抽取和自动学习,实现机器对图片中有效社会经济信息的自动提取与分类,用于贫困地区家庭消费和经济状况的预测,改善其调研数据难于获取的局面,为学术研究提供廉价、较为可靠的数据支持。
3、卫星拍摄的全球高清图片含有丰富的地形特征信息,这些信息与人类经济活动相关。如贫困村落的屋顶材质、与城市距离等,这些因素都与家庭消费线性相关,并体现贫困村落之间贫困程度的差异。然而这些图片信息是非结构化的,依靠人工分析从中提取有效信息是十分困难的,因此需要借助深度机器学习对这些高清图片进行数据识别和提取。尽管被训练后的卷积神经网络可以根据卫星图片预测经济增长状况,但是传统的机器训练需要依靠大量被标记的数据,而数据的缺乏是测量非洲五国贫困的最大障碍,因此该团队选择迁移学习(Transfer Learning)方式进行机器训练。
4、经过迁移学习后的模型可感知卫星图片中具有语义的图形特征,如城市、公路、水体、农业区域等,并通过自我学习抽取影响夜间灯光强弱的图形特征,摆脱对人工标引图片的依赖。同时由于迁移学习对现有数据规模要求不高,使用公共调研数据即可满足训练需求,因而无需购买商业数据库的数据,降低了贫困测量的成本。
【作者简介】
Neal Jean,斯坦福大学计算机科学学院,斯坦福大学电子工程学院。
Marshall Burke,斯坦福大学地球系统科学学院、食物安全与环境中心、国家经济研究局。
Michael Xie1,斯坦福大学计算机科学学院。
W. Matthew Davis,食物安全与环境中心。
David B. Lobell,斯坦福大学地球系统科学学院、食物安全与环境中心。
Stefano Ermon,斯坦福大学计算机科学学院。