深度学习好文记录，反复学习

互联网 12 月前 0 1

本文介绍: Batc h Norm aliza ti on 在其操作中包含了均值的减去和方差的除以等操作，这些操作本身具有平移和缩放的效果。如果在 Batc h Norm aliza ti on 层之前加上了偏置，它的作用在某种程度上会被 Batc h Norm aliza ti on 的操作所抵消，从而可能减弱 Batc h Norm aliza t ion 的效果。通常，在batch normalization层之前的层中是没有 bias的，因为这是无用的，也是对参数的浪费，因为任何常数都会被batch normalization抵消掉。

深度学习入门 – 知乎、这本书也很好，作者写的专栏不错。

机器学习，深度学习一些好文_一只菜得不行的鸟的博客-CSDN博客

卷积神经网络学习路线（五）| 卷积神经网络参数设置，提高泛化能力？_”eval_type”:”pr”-CSDN博客

关于BN折叠的问题

使用Batch Normalization折叠来加速模型推理-CSDN博客

BN层和前一层（Conv，Lin e ar）

通常，在batch normalization层之前的层中是没有 bias的，因为这是无用的，也是对参数的浪费，因为任何常数都会被batch normalization抵消掉。

在深度神经网络中，有时在 Batc h Norm alizat ion 层之前的线性层（例如全连接层或卷积层）会被设计为没有偏置（bias）。这样的设计是有一些原因的，尤其是在使用 Batc h Norm alizat ion 时：

Batch No rm alizat ion的效果： Batch No rm alizat ion 在其操作中包含了均值的减去和方差的除以等操作，这些操作本身具有平移和缩放的效果。如果在 Bat ch No rm alizat ion 层之前加上了偏置，它的作用在某种程度上会被 Batch No rm alization 的操作所抵消，从而可能减弱 Batch Normalization 的效果。

BN

标准化与归一化_标准化和归一化_Weber77的博客-CSDN博客

ML领域更常使用标准化，如果数据不为稳定，存在极端的最大最小值，不要用归一化。z值归一化=标准化

BN可以省去drop out，L1, L2等正则化处理方法.

这人写的都不错：

Transformer 相关理解（上）_向量内积相似性-CSDN博客

原文地址:https://blog.csdn.net/IsayIwant/art icle/de tail s/134746182

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若转载，请注明出处：http://www.7code.cn/show_24484.html

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

batch normalization 学习

相关文章

机器学习系列——（十七）聚类

互联网 10 月前 6

深度学习如何入门？

互联网 10 月前 4

springboot微信小程序 uniapp学习资料分享系统v9uy4

springboot微信小程序 uniapp学习资料分享系统v9uy4

uniapp 10 月前 3

ChatGPT学习第一周

chatgpt 10 月前 2

爬虫实战–人民网

爬虫 10 月前 4

ElasticSearch 8.x 使用 High Level Client 以 HTTPS 方式链接，SSL 证书、主机名验证器各是什么，如何忽略

ElasticSearch 8.x 使用 High Level Client 以 HTTPS 方式链接，SSL 证书、主机名验证器各是什么，如何忽略

互联网 10 月前 4

JVM之GC垃圾回收

互联网 10 月前 3

行为型设计模式—中介者模式

互联网 10 月前 4

发表回复取消回复