手写数字识别加法器–深度学习实验

互联网 12 月前 0 2

本文介绍: 手写数字识别加法器–神经网络实验

上次老师布置了一个实验：

手写数字识别–深度学习实验-CSDN博客

这次在上次的基础上又布置了一个实验，也是做了好久才做出，所以把实验报告放到CSDN保存，自己忘了方便查阅，也为其他人提供借鉴。

实验 源码自取：

手写数字识别加法器.zip – 蓝奏云

手写 数字 加法器

实验目标和要求

1.学会 pytorch 框架。

2.学会CNN网络原理。

3.学会迁移学习原理。

近年来，迁移学习受到广泛关注，相关研究呈现出持续的指数式增长，在计算机视觉、自然语言处理、语音识别等领域，已经掀起了新一波的浪潮，有望引领下一代人工智能商业化应用。本实验针对MNIST手写数字识别数据集，首先设计实现一个手写数字识别模型，然后在此基础之上，利用迁移学习，实现一个手写数字加法器，输入两张手写数字图像，输出这两个数字的和。具体要求如下：

1. 在PyCh arm 平台上，基于PyTorch 实现。

2. 使用第一次实验的MNIST数据集。

3. 首先设计实现一个基于PyTorch的CNN模型，训练、测试，保留其最优参数。

4. 基于第三步的模型，通过迁移学习，以“微调”方式实现端到端的手写加法器。模型的输入是手写数字图像，最终输出是对应两个数字的和。

5. 不使用迁移学习，从头开始训练一个CNN模型，实现同样的手写数字加法功能。

6. 在同一张图上画出两种方法的错误率曲线图，横坐标为训练时间或者迭代次数，纵坐标为错误率。

7. 结合曲线图，对两种方法进行分析比对。

实验过程（含错误调试）

1.迁移模型

神经网络结构图：

模型的处理流程：

首先设计实现一个基于PyTo rc h的CNN模型，训练、测试，保留其最优参数，跟上次实验一样。保留的模型命名为cnn.pth，留着进行下一步。

打开并统计数据集，发现训练集有50000个，验证集有10000个，测试集有10000个。根据题目要求，把训练集和验证集分成两部分，测试集单独加载图片进行测试。

对各两部分数据集的图像矩阵转成张量，把图像张量和目标张量一一对应放到 TensorDa t a set()函数转成迭代器对象，然后调用Da t aLoa de r()函数分批打包数据，生成迭代器对象。最终返回两个训练集对象，两个验证集对象。单独加载测试图片，把mnist.p kl里的图片i m write()保存下载来，编号为1到20，加载图片和数字，转成张量放到字典，用于测试。

定义Ad de r类,继承Model类，实现初始化网络、把预训练好的手写数字识别网络模型对象传入加法器模型，再定义全连接层Lin e ar（20,19）和Lin e ar（19,19），对于每次输入的两张图片，先输入到预训练的模型，分别输出张量为10的概率值，把这两个张量拼接在一起，输入到20个神经元的层，由于两个数相加最大值为18，最小值为0，模型经过训练学习，输出19个值，最大值的数对应的下标就是两个数相加的结果。

加法器模型迭代10次，输入训练数据进行前向传播，把结果放进交叉熵损失函数、后向传播计算梯度，更新参数，验证模型，继续迭代，寻找最优参数。

简单版手写数字加法器 – 飞桨AI Studio星河社区 (baidu.com)

2.非迁移模型

神经网络结构图：

模型的处理流程：

定义MNIST_Ad der类,继承Model类，参考上面迁移模型的想法，使用Sequenti al()函数将模型模块化，分成conv 卷积模块和fc全连接模块，对于每次输入的两张图片，conv 卷积模块负责对图片进行卷积和最大池化操作，分别获得维度为2000的特征向量，然后把这两个特征向量拼接在一起输入全连接层，最后输出长度为19的张量，里面最大值的下标索引就是两个数的相加结果。

加法器模型迭代10次，输入训练数据进行前向传播，把结果放进交叉熵损失函数、后向传播计算梯度，更新参数，验证模型，继续迭代，寻找最优参数。

迁移模型：

当批量大小 batch _size=200，迭代次数为10，AdamW优化器的参数lr=0.003,we i g ht _d ecay=0.002,使用交叉熵损失函数时，运行结果如下：

验证精度在到达95%时开始收敛，最高有96%，为了防止偶然性，使用10组图片进行测试，10组图片的数字相加结果都正确。

非迁移模型：

当批量大小batch_size=200，迭代次数为10，AdamW优化器的参数lr=0.002,weight_de cay=0.003,使用交叉熵损失函数时，运行结果如下：

验证精度在到达94%时开始收敛，为了防止偶然性，使用10组图片进行测试，10组图片的数字相加结果中有一组错误。

可见非迁移模型的验证精度和测试结果准确率都不如迁移模型的。

……

总结

学到了许多，对py torch 框架的使用更熟练了。

原文地址:https://blog.csdn.net/qq_64079631/art icle/de tail s/134337384

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若转载，请注明出处：http://www.7code.cn/show_29882.html

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

实验手写识别

相关文章

JavaEE作业-实验三

java 10 月前 3

C#调用WechatOCR.exe实现本地OCR文字识别

C#调用WechatOCR.exe实现本地OCR文字识别

互联网 10 月前 7

【大厂AI课学习笔记】1.5 AI技术领域（2）语音识别

【大厂AI课学习笔记】1.5 AI技术领域（2）语音识别

互联网 10 月前 6

【开源】SpringBoot框架开发大学计算机课程管理平台

【开源】SpringBoot框架开发大学计算机课程管理平台

spring 10 月前 4

计算机网络实验五

互联网 10 月前 4

【机器学习】基于K-近邻的车牌号识别

【机器学习】基于K-近邻的车牌号识别

互联网 10 月前 3

JVM之GC垃圾回收

互联网 10 月前 3

行为型设计模式—中介者模式

互联网 10 月前 4

发表回复取消回复