UNetFormer: A UNet-like transformer for efficient semantic segmentation of remote sensing urban scene imagery
UNetFormer:一种类 UNet 结构的 Transformer 用于遥感城市场景图像的高效语义分割 论文地址 论文附带源代码 简介 本论文中的模型采用ResNet18作为编码器,并设计了一个全局-局部Transformer模块(GLTB)构建解码器。GLTB开发了一个有效的全局-局部注意力机制,具有一个注意力全局分支和一个卷积局部分支,以捕…
An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale
arXiv论文地址 《将 Transformer 架构应用于图像识别任务》 Submitted on 22 Oct 2020 (v1), last revised 3 Jun 2021 (this version, v2),ICLR 2021 简介 这篇论文主要介绍ICLR 2021上的、一个基于Transformer模型应用于处理图像识别任务的V…
Attention Is All You Need
Attention Is All You Need[1706.03762] Attention Is All You Need 0 摘要 翻译 主流的序列转换模型基于复杂的循环神经网络或卷积神经网络,这类模型包含编码器与解码器结构。性能最佳的模型还通过注意力机制实现编码器与解码器的连接。本文提出一种全新的简单网络架构 ——Transformer,该…
Transformer学习
1、Transformer从零详细解读(可能是你见过最通俗易懂的讲解) 2、李沐_Transformer Transformer是一种用于自然语言处理(NLP)和其他序列到序列(sequence-to-sequence)任务的深度学习模型架构,它在2017年由Vaswani等人首次提出。Transformer架构引入了自注意力机制(self-att…
7.22人工智能组会
读过论文方面,对于论文中使用的数据集,只了解数据集中数据的基本尺寸、规模等是远远不够的,除此之外要知道数据集处理方面的细节,如:输入到神经网络前对数据集的数据做了哪些尺寸调整、处理等;然后是论文的消融实验,体现论文实验的结果:对比多个模型或多个模块的增添进行实验,得到的数据进行对比以此来体现本文模型的优势; 找到论文之后,也要知道这个论文发布日期,…
SCAttNet: Semantic Segmentation Network with Spatial and Channel Attention Mechanism for High-Resolution Remote Sensing Images
SCAttNet:具有空间和通道注意机制的高分辨率遥感图像语义分割网络([Submitted on 19 Dec 2019 (v1), last revised 7 May 2020 (this version, v2)]) 论文地址 1摘要(简介) 高分辨率遥感图像(HRRSIs)包含大量的地物信息,如纹理、形状和空间位置。语义分割是元素提取的重…
阅读《卷积神经网络在农业遥感图像语义分割中的应用综述》
文章网址 --------2024 引言 发展背景 2020 年中国已自主研发成功高时空分辨率、 高光谱分辨率、 高精度观测能力的对地观测系统, 可提供高分辨率多光谱遥感图像数据; 可实现高分辨率影像实时传输的无人机遥感由于其机动灵活和成本低的特点, 作为卫星遥感的有力补充被广泛应用; 同时, 农业智能化管理系统中图像采集设备提供了丰富的农业遥感图…
DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs
DeepLab:基于深度卷积网络、宏卷积和全连接CRF的语义图像分割 论文 提出空洞卷积(解决分辨率损失)和 CRF 后处理(优化边界),大幅提升分割精度,是遥感分割中处理多尺度地物的重要参考 Abstract 本论文使用深度学习来进行语义分割的任务,有三大贡献: 1、使用空洞卷积代替传统的卷积(使用上采样滤波器的卷积或“atrous卷积”,作为密…
FCN开山之作-Fully Convolutional Networks for Semantic Segmentation
本文对Fully Convolutional Networks for Semantic Segmentation论文进行尝试精读 论文 代码 FCN的研究成果 1、将分类网络改编为全卷积神经网络,具体包括全连接层转化为卷积层以及通过反卷积进行上采样。 2、使用迁移学习的方法微调。 3、使用跳跃连接结构使得语义信息可以和表征信息相结合,产生准确而精…
从图像级分类到像素级分类
传统CNN模型(如AlexNet、GoogLeNet、ResNet等)都主要包括两大部分:卷积层、全连接层,前部分卷积层用来提取输入图像的特征,后部分全连接层读取所提取的特征,可以实现对图像一个整体类别的判断,但无法得出所预测类别的具体位置(具体像素区块)(即无法深入判断像素的所属类别)。(输入图像,输出预测值) 为能确定图像中每个像素的类别,FC…