基于Geotools的Worldpop世界人口tif解析-以中国2020年数据为例

发布于:2025-05-30 ⋅ 阅读:(27) ⋅ 点赞:(0)

目录

前言

一、Worldpop数据简介

1、数据来源

2、QGIS数据展示

3、元数据展示

二、GeoTools人口解析

1、Maven依赖引入

2、Tif人口计算

三、总结


前言

        在当今数字化与信息化飞速发展的时代,地理空间数据的分析与应用已然成为诸多领域研究与决策的关键支撑。人口数据作为地理空间信息中的核心要素之一,对于城市规划、资源分配、公共卫生政策制定以及社会经济发展等众多方面都有着不可替代的重要价值。Worldpop 作为全球高分辨率人口分布数据的权威发布平台,其提供的 tif 格式人口数据具有极高的精度和权威性,为研究人员和相关从业者深入探究人口分布规律及其与环境、社会等要素的相互关系提供了宝贵的数据资源。以中国 2020 年的人口数据为例,这一年的数据不仅反映了我国在特定历史时期的人口分布状况,还蕴含着丰富的人口迁移、城镇化进程以及区域发展差异等重要信息。Geotools 作为一个功能强大的开源地理工具库,在地理空间数据处理与分析方面展现出了卓越的能力。通过运用 Geotools 对 Worldpop 的中国 2020 年 tif 格式人口数据进行解析,我们能够深入挖掘数据背后的深层次信息,实现数据的高效读取、可视化展示以及与其他地理空间数据的融合分析。

        本研究旨在通过详细介绍基于 Geotools 的 Worldpop 中国 2020 年人口 tif 数据解析方法,为相关领域的研究人员和从业人员提供一套可行的技术方案和实践指导,助力他们更好地利用地理空间数据,揭示人口分布的复杂规律,从而为解决实际问题提供有力的数据支持和决策依据。这不仅有助于推动地理空间数据在多领域的广泛应用,也将进一步提升我国在人口地理研究以及相关应用领域的水平和影响力,为国家的可持续发展贡献一份力量。通过本实例,大家可以掌握如何使用Java语言通过Geotools来进行区域内的人口总量。

一、Worldpop数据简介

        本节将对Worldpop数据进行简单介绍,分别从数据来源、在Qgis上进行数据展示和tif数据的元数据展示。

1、数据来源

        “Worldpop”是数据的提供方,Worldpop项目由英国萨塞克斯大学、美国约翰斯·霍普金斯大学以及多个国际合作伙伴共同运行,致力于提供全球人口分布的精细化数据。其数据广泛应用于公共卫生、灾害响应、发展规划等多个领域。 Worldpop数据集包含了2000年至2020年这21年间,中国各区域的人口密度信息。这些数据是以公里为单位的网格形式呈现,便于进行地理空间分析和研究。数据来源于Worldpop,这是一个全球人口分布和流动性的研究项目,提供高质量、高分辨率的全球人口分布数据。 在这个案例中,这些人口密度数据可以通过GIS软件进行加载和分析,以可视化和理解中国各地人口分布的时空变化。 压缩包子文件的文件名称列表中,以“chn_ppp_”开头的文件是与中国的(chn)人口密度(ppp)相关的数据。后缀为“.tif”的文件是地理信息系统常用的栅格数据格式——TIFF(Tagged Image File Format)图像文件,通常用于存储地理空间数据。文件名中的年份(如2012、2013等)代表了相应年份的数据,而“_Aggregated.tif”表示这些数据已经进行了聚合处理,即在一定区域内统计了人口总数,而不是单个个体的数据。".ovr"文件是TIFF图像的元数据或覆盖文件,它包含关于主TIFF文件的额外信息,有助于GIS软件快速访问和显示数据。

        这些数据可以用来进行以下几种分析:

1. **人口增长分析**:通过比较不同年份的数据,可以分析中国各地区人口增长的速度和趋势。 2. **城市化进程研究**:可以揭示城市化区域的人口密度变化,了解城市扩张的模式。 3. **资源分配规划**:政府和决策者可以依据人口密度来优化基础设施建设、公共服务提供以及资源配置。 4. **公共卫生评估**:研究人口密集地区的疾病传播风险,指导防疫措施的实施。 5. **环境影响评估**:分析人口分布对环境压力的影响,为环境保护提供依据。 这个数据集提供了丰富的信息,对于了解和研究中国人口分布的历史变迁以及与之相关的各种议题具有重要价值。

2、QGIS数据展示

        为了比较直观的展示这份人口数据,我们使用QGIS来对人口数据进行展示。将tif数据拖入展示窗口中,对tif数据进行标注,人口数据属于单波段数据。因此这里我们选择单波段伪彩色的模式进行渲染,为了将数值区分有所明显,使用渐变的颜色。具体标绘设置如下:

        为了体现各人口单元数据的差异, 根据千米网格的人口数,这里我们采用分成15类来进行数据展示。

3、元数据展示

        这里我们对这份2020年的中国区人口tif数据的元数据进行展示。在Qgis中打开信息页,可以看到tif数据的元数据信息,如下表所示:

序号 参数
1 名称 chn_ppp_2020_1km_Aggregated
2 空间参考 EPSG:4326 - WGS 84 - 地理的
3 范围 73.5570830472731529,16.0329167867305387 : 134.7737494690731523,53.5662499699305386
4 单位
5 宽度 7346
6 高度 4504
7 数据类型 Float32 - 32位浮点型
8 波段1 STATISTICS_MAXIMUM=286414.71875
STATISTICS_MEAN=105.89345258548
STATISTICS_MINIMUM=0
STATISTICS_STDDEV=738.60967183839
9 起点 73.5571,53.5662

        同时在tif中,定义了没有值的nodata的值为-9999,如下图所示:

二、GeoTools人口解析

        本节将详细介绍在Geotools中如何读取GeoTiff,同时对人口值进行准确计算。

1、Maven依赖引入

        在Geotools中解析GeoTiff的maven依赖添加如下:

<!--  增加epsg支持 -->
<dependency>
    <groupId>org.geotools</groupId>
    <artifactId>gt-epsg-hsql</artifactId>
    <version>${geotools.version}</version>
 </dependency> 
 <!--  增加gt-geotiff支持 -->
 <dependency>
	<groupId>org.geotools</groupId>
	<artifactId>gt-geotiff</artifactId>
	<version>${geotools.version}</version>
 </dependency>
<dependency>
	<groupId>org.geotools</groupId>
	<artifactId>gt-process-raster</artifactId>
	<version>${geotools.version}</version>
</dependency>	
<dependency>
	<groupId>org.geotools</groupId>
	<artifactId>gt-process</artifactId>
	<version>${geotools.version}</version>
</dependency>
<dependency>
	<groupId>org.geotools</groupId>
	<artifactId>gt-coverage</artifactId>
	<version>${geotools.version}</version>
</dependency>

2、Tif人口计算

        使用Geotools解析tif数据的步骤如下:

        第一步、使用Geotools读取tif文件,并设置重采样,关键代码如下:

File file = new File("F:/vector_data/worldPop人口数据/worldpop/chn_ppp_2020_1km_Aggregated.tif");
GeoTiffReader reader = new GeoTiffReader(file, new Hints(Hints.FORCE_LONGITUDE_FIRST_AXIS_ORDER, Boolean.TRUE));   
GridCoverage2D coverage = reader.read(null);
// 设置目标坐标系并重采样
CoordinateReferenceSystem targetCRS = CRS.decode("EPSG:4326");
coverage = (GridCoverage2D) Operations.DEFAULT.resample(coverage, targetCRS);

        第二步、获取栅格数据并批量读取像素值,同时通过循环计算非零像素的坐标 ,关键代码如下:

// 获取栅格数据并批量读取像素值
Raster raster = image.getData();
int width = raster.getWidth();
int height = raster.getHeight();
System.out.println(width + "\t" + height);   
double[] pixels = raster.getSamples(raster.getMinX(), raster.getMinY(), width, height, 0, (double[]) null);
// 收集非零像素的坐标
List<GridCoordinates2D> nonZeroCoords = new ArrayList<>();
for (int j = 0; j < height; j++) {
	  for (int i = 0; i < width; i++) {
	      if (pixels[j * width + i] > 0) {
	          nonZeroCoords.add(new GridCoordinates2D(i, j));
	      }
	  }
}

        第三步、从收集的非零数据集合中读取指定像素人口值,代码如下:

// 获取仿射变换以手动计算坐标
MathTransform2D gridToCRS =  geometry.getGridToCRS2D();
if (!(gridToCRS instanceof AffineTransform2D)) {
	throw new RuntimeException("仅支持仿射变换");
}
AffineTransform2D affine = (AffineTransform2D) gridToCRS;  
BigDecimal total = new BigDecimal("0.0");
double t = 0;
// 处理非零像素
for (GridCoordinates2D coord : nonZeroCoords) {
	int i = coord.x;
	int j = coord.y;
	double[] src = new double[]{i + 0.5, j + 0.5}; // 像素中心坐标
	double[] dest = new double[2];
	affine.transform(src, 0, dest, 0, 1);
	double longitude = dest[0];
	double latitude = dest[1];
	/*System.out.printf("像素点 (%d, %d) 的值:%f 坐标为: %f, %f%n",
	       i, j, pixels[j * width + i], longitude, latitude);*/
	total = total.add(new BigDecimal(pixels[j * width + i]));
	t +=  pixels[j * width + i];
}
System.out.println("总人数===>" + total);
System.out.println("总人数2===>" + t);

         第四步、获取计算结果。经过以上的三步,就可以实现对指定的tif栅格人口数据进行汇总,在控制台中可以看到以下输出:

五月 26, 2025 10:03:54 下午 org.geotools.image.ImageWorker <clinit>
信息: Warp/affine reduction enabled: true
7346	4504
总人数===>1444326122.211248342038743430748581886291503906250
总人数2===>1.4443261222112093E9

        在控制台中输出的7346和4504表示的是tif图像的宽和高。下面两个是分别使用BigDecimal和double两种数据来接收的值,可以很明显的看到,两个计算的结果是一样的,double的计算结果是科学计数法。通过计算结果可以看到,我国2020年的总人口数大约是:14.4亿左右。基本上与我国的人口规模是一致的。

三、总结

        以上就是本文的主要内容,本研究旨在通过详细介绍基于 Geotools 的 Worldpop 中国 2020 年人口 tif 数据解析方法,为相关领域的研究人员和从业人员提供一套可行的技术方案和实践指导,助力他们更好地利用地理空间数据,揭示人口分布的复杂规律,从而为解决实际问题提供有力的数据支持和决策依据。这不仅有助于推动地理空间数据在多领域的广泛应用,也将进一步提升我国在人口地理研究以及相关应用领域的水平和影响力,为国家的可持续发展贡献一份力量。通过本实例,大家可以掌握如何使用Java语言通过Geotools来进行区域内的人口总量。

        本文首先对WorldPop数据进行介绍,然后使用qgis来进行数据的标注展示,通过数据源的介绍让大家对基础数据有了一个更详细的了解。最后通过Java代码,使用geotools组件实现对geotiff文件的读取,通过像素值的计算实现区域范围内的人口总数计算。行文仓促,定有不足之处,欢迎各位朋友在评论区批评指正,不胜感激。篇幅有限,代码不能全部展示,更详尽的参考代码可参考以下链接:Geotools28.2读取WorldPop人口实例


网站公告

今日签到

点亮在社区的每一天
去签到