服务热线:0898-08980898

第四系列

当前位置: 首页 > 产品展示 > 第四系列

【论文】基于高分辨率卫星影像的人群检测数据集和新方法

发布时间:2026-02-04 06:06:50

  首次利用超高分辨率(~0.3m)卫星影像进行人群检测,构建了包含超过12万个标注个体的CrowdSat数据集

  提出CrowdSat-Net网络,包含双上下文渐进注意力网络(DCPAN)模块来增强小目标特征表示

  设计高频引导可变形上采样器(HFGDU)模块,通过频域引导的可变形卷积恢复上采样过程中的高频信息

  随着人口增长和城市化进程加快,公共区域人群活动频繁增加,带来交通拥堵、故、安全隐患和公共卫生风险等问题。人群检测(CD)通过估计特定区域内个体的位置和数量,对缓解这些风险至关重要。传统方法主要依赖地面监控或航空影像,但存在时空覆盖范围有限的问题。

  超高分辨率(VFR)卫星影像(如北京三号、吉林一号高分04A等,空间分辨率约0.3米)的发展为大规模人群活动分析提供了新机遇。相比地面和航空影像,VFR卫星影像具有更广的空间覆盖和更短的重访周期,能够实现持续的大范围监测和历史模式分析。然而,VFR影像中个体信号微弱且模糊(约3×3像素),在特征提取和上采样过程中容易出现信号衰减或丢失,现有方法难以有效应对这些挑战。

  数据来自三个互补的遥感数据源:Google Earth平台(空间分辨率约0.30m)、北京三号卫星(BJ3N,0.30m全色波段)和吉林一号高分04A卫星(JL4A,0.31m全色波段)

  覆盖中国32个省级行政区(贵州省和澳门除外),采集时间为2023年2月20日至2025年1月2日

  将影像裁剪为256×256像素的无重叠图像块,移除无人群的图像块后得到3447个标注图像块

  利用Google Earth平台的多时相VFR影像作为辅助数据,交叉参考不同时间点的影像以区分个体与固定物体(如路面、路灯、石柱等)

  总计标注120,141个个体,平均每个图像块包含34.9个个体,中位数为14.0个

  本文提出CrowdSat-Net,一种基于点的卷积神经网络方法,专门设计用于VFR卫星影像的人群检测。

  使用焦点逆距离变换(FIDT)方法将标注图像转换为FIDT图,通过为更接近中心的像素分配更高的响应值实现密集人群中的无重叠定位

  采用中间监督策略,每个沙漏网络生成位置图并计算焦点损失,总损失为各沙漏网络焦点损失之和

  使用局部最大值检测策略(LMDS)处理最后一个沙漏网络的位置图以获得最终的个体定位

  结合基础空间注意力(SA)编码和两个并行分支:多尺度特征提取(MSFE)分支和局部对比度增强(LCE)分支

  采用膨胀率为2和4的并行膨胀卷积层捕获互补的多尺度上下文信息,解决全局池化操作无法建模对象间位置依赖关系的问题

  通过局部对比度生成器突出具有大异质性的位置,恢复标准池化操作模糊的高频细节

  将MSFE和LCE的输出逐元素相加后通过sigmoid激活生成增强权重图,与原始特征逐像素相乘得到最终特征

  替代传统上采样方法(如双线性插值),恢复上采样过程中丢失的高频信息和精细空间细节

  采用可学习的拉普拉斯类高通滤波器提取上采样特征图的高频分量,通过残差补偿生成器细化高频特征图,并与上采样特征图整合恢复精细高频分量

  引入可变形卷积层预测空间偏移量动态对齐上采样特征和细分辨率特征,通过特征调制门选择性整合对齐特征并抑制冗余信息

  CrowdSat-Net在CrowdSat数据集上超越了八种先进的人群检测方法,实现了最高的F1分数和精度,验证了DCPAN和HFGDU模块的有效性。跨区域评估进一步证明了模型在全球不同地区的空间泛化能力,但在极稀疏和极密集场景中仍存在性能下降的局限。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  惨淡!1月份理想卖了27668辆,智界+尚界+享界+尊界总交付17899辆

  2012年希拉里助手曝出惊天猛料:为报复克林顿出轨,她的私生活竟也乱成一锅粥,这哪是原谅,分明是顶级复仇

  三星Galaxy Buds4/Pro渲染图曝光,预计2月25日与S26系列一同发布

  苹果关闭iOS 26.2版本签名,iOS 26.3正式版将在本月到来!

咨询热线:0898-08980898
LINK 友情链接:
     
ICP备案编号:琼ICP备xxxxxxxx号