大型空间人口数据库在传染病研究中的应用外文翻译资料

 2023-01-03 11:29:18

大型空间人口数据库在传染病研究中的应用

Catherine Linard1,2*and Andrew J Tatem3,4,5

摘要

关于传染病的空间分布和传播的建模研究正变得越来越精细和复杂,全球风险地图和流行病模型研究现在很流行。然而,这些空间模型必须依赖于现有的全球和地区的人口分布数据,这些数据往往基于过时和粗糙的分辨率数据。此外,各种不同的方法也被用于在大型空间尺度上对种群分布进行建模。在此综述中,我们描述了主要的全球网格人口数据集,这些数据集可以供健康研究人员免费使用,并比较它们的构造方法,并强调这些人口数据集中固有的不确定性。我们回顾了过去关于疾病风险和动态的研究,并讨论数据集的选择如何影响结果。此外,我们还强调,缺乏当代、详细而可靠的人口分布在低收入国家的人口分布情况,证明了如何在风险和建立可靠的疾病传播模型的情况下获得准确的大规模人口估计的障碍,并提出进一步减少这些障碍所需的研究方向。

关键词:人口、全球、传染病、空间人口学、卫生指标

介绍

随着空间流行病学的发展,用于研究矢量传播和直接传播传染病的空间分布和传播的映射和建模方法正变得越来越普遍和复杂。空间流行病学被定义为“对疾病风险或发病率的空间变化的研究”[1],其目的是描述和理解这些变异的[2],最终目的是协助公共卫生决策。病原体、载体和宿主之间的相互作用,以及这些病原体与环境之间的相互作用决定了疾病风险的空间变异,并使媒介传播和其他传染性疾病的传播具有内在的空间过程[1,3]

大多数关于感染性疾病动力学的研究并不是在空间上明确的,也就是说,元素在空间中没有明确地定位。典型的模型是基于上一概念的,它认为孤立的子种群服从殖民和灭绝动力学[4 - 6]。如果感兴趣的物种是寄生虫,殖民意味着感染,当宿主死亡或恢复[5]时,就会发生局部灭绝。这种方法是空间隐含的,因为它避免使用地理映射来定位元素。在大多数非空间型传染病的数学模型中,总人口数被认为是恒定的[7],但人口数据已经包括,例如,在非空间的HIV[8],百日咳[9],疟疾[7],或在全球疾病计算的负担中[10 - 16]。然而,传染病的空间特性,特别是传播和传播的空间异型性,使得疾病的风险地图和空间显式的疾病发病率模型成为了解疾病动态和规划公共卫生干预措施的宝贵工具[1,2,17]。将传染病的范围界定为公共卫生负担及其在时间和空间上的分布和动态对界定财政要求、制定控制议程和监测是至关重要的。

通过对空间数据和工具的改进,如遥感和地理信息系统(GIS),以及空间显式建模方法[17,24]的改进,支持了传染病研究中空间显式研究的出现。GIS通常用于结合不同来源的空间数据,用于映射疾病和对每个形成空间的分析,以确定观察到的空间模式的因果因素,例如群集检测或景观碎片分析[20,25)。此外,计算、数据收集和流行病学数据的集中的增长,导致了传染病风险的制图和建模的复杂性和复杂性的增加。

在疾病传播过程中,人类宿主在其密度[26]、空间位置、人口特征(例如:年龄风险概况[27 - 30]和行为[31 - 33]决定它们暴露于感染。任何要求使用模拟疾病比率或动力学的方法都需要对居民人口进行合理的信息,以便估计风险。在空间中,疾病的风险和传播是异质性的,在理想情况下,人口分布和数量应该比大型区域估计更能解决空间细节的问题。因此,关于人口规模和分布的准确和详细的信息对于在空间流行病学研究中对人口的风险和感染进行评估具有重要意义。然而,对于世界上许多低收入国家来说,那里的疾病负担最严重,然而,在空间上详细的,当代的人口普查数据并不存在。在非洲的大部分地区,情况尤其如此。目前的人口普查数据通常超过10年,而在国家一级[35-36)的行政边界水平。

为了克服输入人口普查数据所导致的各种不同分辨率的问题,我们开发了人口普查单位空间重新分配的建模技术。全国人口普查数据可以通过使用空间插值算法来表示为连续的网格人口分布(或计数)数据集。在此,我们首先回顾并比较现有大规模人口数据集的构建方法,并在过去的疾病风险和动力学研究中回顾这些数据集的应用。

映射人类

空间统计数据

我们对世界许多地区人类分布的认识仍然令人吃惊。20世纪90年代,人们对全球人类人口地图的兴趣日益浓厚。在此之前,关于人口空间分布的唯一信息来自地图显示城镇的位置、城市和行政区域的边界,以及人口统计数据来自国家人口普查和其他[39]的人口统计数据。赖特(1936年)提供了第一个关于人口和空间数据的结合的例子,以构建美国[40]的科德角地区的人口密度图。人口结构和空间数据可用性的改进以及将它们结合起来的方法的发展导致了全球人口密度数据集的产生。

人口数据来自不同的来源:人口普查、民事登记制度、政府或非政府行政数据或样本调查[37]。公民登记制度提供了最可靠和有用的人口数据,因为他们不断地记录一个国家的人口信息,包括他们的空间分布。然而,最新的注册系统只存在于少数几个国家。相反,人口普查大约每10年由国家统计办公室进行,以提供一致的和地理上参考的人口数据。国家人口普查所提供的数据的准确性和数量差别很大。从时间的角度来看,(在写作的时候)最近的人口普查在一些撒哈拉以南的国家,如安哥拉、厄立特里亚和刚果民主共和国(图1a)已经超过25年了。人口普查数据的空间分辨率也存在较大的差异,因为国家领土划分的方式和人口数据收集和汇总的行政水平因国家而异。图1b显示了人口普查数据在世界第三版(GPW3)[42]和全球农村城市制图项目(GRUMP)[43,44]空间人口数据库的建设中所使用的人口普查数据的空间分辨率。

人口统计学数据与空间参考系统之间的联系对地理分析至关重要。在管理单元级别收集的普查数据必须与精确的边界数据集[37]有关。这在过去常常被忽视,主要是由于缺乏GIS技术、知识、资源和方法,以及计算基础设施[37、39、4)),但是现在全世界都在努力将人口普查数据与数字管理边界联系起来。

人口分布建模方法

自上世纪90年代以来,从不规则的管理单元到常规网格的人口统计数据的各种方法已经发展起来,并导致了不同的全球网格人口数据的出现。人口和空间数据的质量和可及性一直在改善,使人口学家和地理学家之间的合作更加有力[39,42,43]。此外,GIS技术正变得越来越有可用性和可访问性,而且计算机能力也在不断改进,允许处理更大更详细的数据集[37、39、42)

图1的人口普查数据的空间和时间特征。(资料来源:Geo Hive[41])和b)平均空间分辨率(ASR),用于世界第三版(GPW3)和全球农村城市地图项目(GRUMP)的建设。ASR衡量的是在公里范围内的行政单位的有效决议。它被计算为土地面积的平方根除以管理单位[42]的数量。如果一个国家的所有单位都是正方形和大小相等的,就可以把它看成是“细胞大小”。

人口分布建模方法在大的空间尺度上依赖于人口普查单位重新分配人口,以获得持续的人口表面,即网格单元格的网格数据集。不同的插值方法通常用于在管理单元内重新分配人群(图2):

图2人口分布建模方法的图解说明。根据不同的人口分布建模方法(面积加权、pycn乳酸和分区密度),两种管理单位A和B(总人口数为A = 8,总人口数为16)被重新分配。在分区密度方法中,较高的权重被归因于红色的阴影区域。

区域权重假设人口在每个管理单元内均匀分布。分配给网格单元的人口仅仅是管理单元的总数除以管理单元中的单元数。因此,管理单元的每个网格单元都具有相同的人口值[45]。这个方法用于构建世界上的网格人口(GPW)数据库,版本2和3[42,46]

pycn预防性插值从面积加权法开始,但用最近邻的加权平均值使人口值平滑,同时将人口数据的总和保存为每个区域单位[47]的原始人口。pycn乳酸插值被用于生成GPW版本1[48,49]

分区密度建模涉及使用辅助数据,这可能包括卫星获得的土地覆盖数据来重新分配管理单位的人口[45,50]。权重被归因于不同的土地覆盖等级,并相应地重新分配人口。例如,全球农村城市地图项目(GRUMP)采用了类似的方法来进行GPW的研究,但是在人口普查的空间重新分配中纳入了城市农村的范围和相应的人口数量。城市-农村范围的信息是由各种输入数据生成的,这些数据包括人口普查数据、在线网络资源和国家图像和地图机构(NIMA)数据库的人口稠密地区[46]。最近产生的非洲数据集,覆盖非洲大陆的一个精细的空间分辨率,也使用土地覆盖数据来重新分配人口[51,52]。其他类型的辅助数据,如坡度或道路可用于分区密度映射。

附外文文献原文:因外文资料为学生从网上下载,故无封面、封底、目录。

Large-scale spatial population databases ininfectious disease research

Catherine Linard1,2*and Andrew J Tatem3,4,5

Abstract

Modelling studies on the spatial distribution and spread of infectious diseases are becoming increasingly detailedand sophisticated, with global risk mapping and epidemic modelling studies now popular. Yet, in derivingpopulations at risk of disease estimates, these spatial models must rely on existing global and regional datasets onpopulation distribution, which are often based on outdated and coarse resolution data. Moreover, a variety ofdifferent methods have been used to model population distribution at large spatial scales. In this review we describe the main global gridded population datasets that are freely available for health researchers and compare their construction methods, and highlight the uncertainties inherent in these population datasets. We review their application in past studies on disease risk and dynamics, and discuss how the choice of dataset can affect results.Moreover, we highlight how the lack of contemporary, detailed and reliable data on human population distribution in low income countries is proving a barrier to obtaining accurate large-scale estimates of population at risk and constructing reliable models of disease spread, and suggest research directions required to further reduce these barriers.

Keywords: Human population, Global, Infectious diseases, Spatial demography, Health metrics

Introduction

Mapping and modelling methods used to study the spatial distribution and spread of vector-borne and directly transmitted infectious diseases are becoming increasingly widespread and sophisticated as the field of spatial epidemiology grows. Spatial epidemiology is defined as“the study of spatial variation in

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[285233],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。