第八第九天深度学习和机器视觉基础知识

张

张建站

2026/4/20 12:25:28

10分钟阅读

目录一、再议激活函数1、激活函数是什么2、这个东西有什么用3、激活函数的种类特点及应用场景1恒等激活函数2阶跃函数3Sigmoid4tanh5ReLU二、为什么需要反向传播三、卷积神经网络1、为什么用卷机2、卷积层3、激活层4、池化层5、全连接层一、再议激活函数在研究一个问题前首先要自己问自己几个问题是什么为什么这个东西有什么用这几个问题同样可以用在我们的激活函数研究上面。1、激活函数是什么激活函数的本质是将线性输出转换成非线性输出的一个工具。他的常见类型有恒等函数、阶跃函数、sigmoid、tanh、ReLu和softmax等激活函数的种类有很多有时为了针对特殊问题我们可以专门设计激活函数。2、这个东西有什么用激活函数设计出来的目的简单的说就是将现行问题转化为非线形问题为什么我们要将线性问题转化为非线形问题呢这个原因就在于神经网络是被设计出来解决复杂问题的这里说复杂问题是除了线性问题以外还有一些非线形问题神经网络在进行仿射变化时实际进行的是一个线性计算那么没有讲线性计算转化成非线形计算的过程网络的表征能力就有限。所以就需要将线形问题转化为非线形问题。3、激活函数的种类特点及应用场景激活函数的种类我已经在前面激活函数是什么里面介绍过了下面我们一一介绍他们并说明他们的应用场景。1恒等激活函数恒等激活函数说白了就是将仿射变换后的结果乘常数一用数学表示为f ( x ) 1 f(x)1f(x)1这种函数一般用于线形问题的激活层当中因为问题本质属于线形问题计算结果也是线形的所以不需要特殊变换只需要将原来的结果进行输出而不需要激活。2阶跃函数这种函数作者还不太清楚他的具体用途但是一图胜千言本质上还是可以将线形问题转化为非线形问题3Sigmoid这个函数就非常的有名了它常用与隐含层的激活函数而且我们在Logistic回归中也层遇见过他他可以用于二分类问题的输出层激活函数。他的原函数和求导后的结果如下σ ( x ) 1 1 e x p ( − x ) \sigma(x){1\over 1exp(-x)}σ(x)1exp(−x)1优点函数是平滑的曲线整个定义域内可以方便的求导缺点激活函数计算量大反向传播求误差梯度时求导涉及除法反向传播时很容易就会出现梯度消失的情况从而无法完成深层网络的训练4tanh常用于NLP中函数和图像如下优点平滑、易于求导输出均值为0收敛速度要比sigmoid快从而可以减少迭代次数缺点梯度消失5ReLU长用于图像CV优点更加有效率的梯度下降以及反向传播避免了梯度爆炸和梯度消失问题计算过程简单缺点小于等于0的部分梯度为0二、为什么需要反向传播梯度下降应用于有明确求导函数的情况或者可以求出误差的情况(比如线性回归)我们可以把它看做没有隐藏层的网络。但对于多个隐藏层的神经网络输出层可以直接求出误差来更新参数但隐藏层的误差是不存在的因此不能对它直接应用梯度下降而是先将误差反向传播至隐藏层然后再应用梯度下降。三、卷积神经网络“卷积”其实是一个数学概念它描述一个函数和另一个函数在某个维度上的加权“叠加”作用。函数定义如下:1、为什么用卷机未考虑数据的“形状”会破坏数据空间结构。例如输入数据是图像时图像通常是高长通道方向上的3维形状。但是向全连接层输入时需要将3维数据拉平为1维数据。全连接网络层次深度受限一般不超过七层。全连接网络参数量庞大需要降低参数量。卷积神经网络(Convolutional Neural NetworkCNN)针对全连接网络的局限做出了修正加入了卷积层(Convolution层)和池化层(Pooling 层)。2、卷积层它是卷积神经网络的核心所在通过卷积运算达到降维处理和提取特征两个重要目的3、激活层其作用在于将前一层的线性输出通过非线性的激活函数进行处理这样用以模拟任意函数从而增强网络的表征能力。4、池化层也称子采样层或下采样层(Subsampling Layer)目的是缩小高、长方向上的空间的运算以降低计算量提高泛化能力。如下的示例将44的矩阵缩小成22的矩阵输出5、全连接层这个网络层相当于多层感知机(Multi-Layer Perceptron简称MLP) 其在整个卷积神经网络中起到分类器的作用,通过前面多个“卷积-激活-池化”层的反复处理待处理的数据特性已有了显著提高:一方面输入数据的维度已下降到可用传统的前馈全连接网络来处理了;另一方面此时的全连接层输入的数据已不再是“泥沙俱下、鱼龙混杂”而是经过反复提纯过的结果因此输出的分类品质要高得多。

高性能开源PLC编程平台：OpenPLC Editor工业自动化开发完整解决方案

高性能开源PLC编程平台：OpenPLC Editor工业自动化开发完整解决方案【免费下载链接】OpenPLC_Editor 项目地址: https://gitcode.com/gh_mirrors/ope/OpenPLC_Editor OpenPLC Editor作为一款基于PLCopen国际标准的开源工业自动化编程平台，为工业…...

2026/4/20 12:16:14 阅读更多 →

题解：AcWing 6 多重背包问题III

本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法…...

2026/4/20 12:13:24 阅读更多 →

用YOLOv4训练自己的数据集？从标注到模型部署，这份Win10实战指南全了（附VOC格式转换脚本）

YOLOv4实战：从零构建Windows10下的自定义目标检测系统如果你正在寻找一种高效的方法来训练自己的目标检测模型，YOLOv4无疑是一个强大的选择。不同于通用模型，针对特定场景（如工业质检、安防监控）定制化的检测系统往往…...

2026/4/20 12:13:22 阅读更多 →

前端三剑客 vs Vue.js：核心区别解析

好的，这是一个关于前端技术的常见问题。我们来理清 HTML CSS JavaScript（通常称为“前端三剑客”）与 Vue.js（一个流行的 JavaScript 框架）之间的区别：核心概念不同HTML CSS JavaScript： 这是…...

2026/4/19 0:02:26 阅读更多 →

【SAP Basis】从SU01出发：深入解析SAP用户账号管理的核心配置与实战

1. SU01入门：SAP用户管理的核心入口第一次接触SAP Basis管理时，我被满屏的事务码搞得晕头转向。直到导师指着SU01说："这是你未来每天都要打交道的老朋友"，我才意识到用户管理的重要性。SU01就像SAP系统的门禁控制台&am…...

2026/4/20 6:34:12 阅读更多 →

AI代码配额管理实战指南：7大行业真实配额模型+3类超限预警SOP（附2026大会未发布白皮书节选）

第一章：AI代码配额管理的范式跃迁与大会使命 2026奇点智能技术大会(https://ml-summit.org) 传统资源配额模型正面临根本性挑战：当大语言模型驱动的代码生成器每秒产出数百行可执行逻辑，静态CPU/内存阈值已无法表征真实开发意图与语义负载。…...

2026/4/20 13:56:02 阅读更多 →

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式

7-Zip终极指南：免费开源的文件压缩神器如何改变你的文件管理方式【免费下载链接】7z 7-Zip Official Chinese Simplified Repository (Homepage and 7z Extra package) 项目地址: https://gitcode.com/gh_mirrors/7z1/7z 你是否曾为电脑空间不足而烦恼&…...

2026/4/19 0:24:21 阅读更多 →