专业术语
端到端训练(End-to-End training) 即输入是一张图片,输出也是一张图片。 在计算机领域中,端到端可以简单地理解为,输入是原始图像,输出是预测图像(是经典分类模型不具备的特点),中间的具体过程依赖于算法本身的学习能力。通过网络内部结构,对原始图像进行降维和特征提取,并在后续过程中将尺寸较小的特征图逐渐恢复成与原图尺寸相同的预测图。(…
论文内容结构
上图论文结构适用于大部分的论文 Abstract 摘要,主要介绍的是论文的背景、核心、观点、方法途径、最终成果,是整篇论文的浓缩、精华部分。 找到论文之后先读摘要,看一下是不是自己想要的、对自己的帮助有多大。 读、写论文,摘要都是一个需要反复推敲的部分。 Introduction 引言,包括语义分割的研究现状、本文的贡献、文章的整体结构。 与Rel…
语义分割(Semantic Segmentation)
【46 语义分割和数据集【动手学深度学习v2】】 【4.1 图像分割的基本概念】 【【论文复现代码数据集见评论区】FCN语义分割的“开山之作”,小姐姐10小时中气十足讲paper,你也能专注学习不犯困】 在图片分类中,主要任务是将图片中的主体识别出来 在目标检测中,主要任务是将图片中的每个主体识别出来 以及所处位置(用一个矩形框出) 对于目标检测中…
使用阿里云DSW产品跑模型
进入阿里云官网->人工智能平台API->交互式建模(DSW) 创建实例,配置中主要在资源规格方面进行选择(主要是cpu、GPU的选择),有三款可以使用免费计算时长进行免费使用的,其他内容默认即可; 启动示例直接,进入示例中,在terminal中输入相关命令进行环境搭建、文件执行等; 在root模式下,不使用sudo关键词; 可以直接使用…
7.8人工智能组会
7.8组会PPT下载 学习方面 专业术语学习 不推荐AI、大数据生成专业术语及解释,部分可能所学方向不会有太对接触,主要还是自己要对相应专业术语有自己的理解 可以通过B站找专业术语的讲解,有利于自己更好的理解 其他方面学习 熟练使用Tensorboard的可视化操作,更有利于对模型训练情况的观察(; 有关机器学习方面的基础,要了解其中的概念,在深度…
经典CNN模型学习(五):ResNet
学习资料:《破解深度学习》 ResNet论文 前言 ResNet本质上是为了解决训练深度神经网络时网络退化问题提的,所谓网络退化,简单来说就是深层网络的效果不如浅层网络。 在ResNet的论文中,作者开篇就展示了两张图,说明了一个56层的网络在训练集和测试集上的错误率明显高于20层的网络。导致这种现象的原因,除了过拟合、梯度消失、和梯度爆炸等,还有…
经典CNN模型学习(四):VGGNet
学习资料:《破解深度学习》 前言 VGGNet的模型结构非常简洁,整个网络使用了小尺寸的卷积核以及相同的池化尺寸(2x2)。 VGGNet的主要思想其实在于解决了平衡问题。在当时的CNN模型中,网络深度越深,表现就越好,但同时也会带来较高的计算复杂度、较大的模型以及过拟合现象。VGGNet通过设计一种更深但同时较小的CNN而解决了这一问题,提高了模…
经典CNN模型学习(三):GoogLeNet
学习资料:《破解深度学习》、模型论文 前言 在GoogLeNet之前,类似AlexNet、VGGNet这样的模型主要是通过增加网络深度来提升训练效果的。然而,这种策略可能会引发一系列问题,如过拟合、梯度消失和梯度爆炸等。GoogLeNet提出了Inception结构,从另一种角度来优化训练结果。它可能更有效地利用计算资源,在保持相同计算量的情况下增…
一些公式
经过卷积层处理之后图像尺寸的计算公式 Win、Hin分别为输入图像的尺寸宽、高,P为Conv2d中的padding参数,D为空洞卷积的参数,默认值是1,K为卷积大小的参数kernel_size参数,S为步长stride参数,Wout、Hout为输出图像的尺寸宽、高,输出图像的尺寸即为channels X Wout X Hout 经过最大池化层处理后…
2025.7.2组会
进团队的第一次组会,老师学长学姐们给我们在各方面都进行了指导,此笔记来大概整理下组会内容 我的进度 至本次组会,我学习的内容:PyTorch基础二刷完成,用MNIST、FashionMNIST、花儿数据集对LeNet-5模进行了训练,通过超参数的调整,MNIST训练、验证准确率都很高,但FashionMNIST训练准确率最高90%,验证准确率很低,…