说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接文章最后获取

1.项目背景

萤火虫算法(Firefly algorithm,FA)由剑桥大学Yang于2009年提出 , 作为最新的群智能优化算法之一,该算法具有更好收敛速度收敛精度,且易于工程实现等优点。

项目通过FA萤火虫优化算法寻找最优参数值来优化CNN回归模型

2.数据获取

本次建模数据来源网络(本项目撰写人整理而成),数据项统计如下

编号 

变量名

描述

1

x1

2

x2

3

x3

4

x4

5

x5

6

x6

7

x7

8

x8

9

x9

10

x10

11

y

变量

数据详情如下(部分展示):

3.数据预处理

3.1 用Pandas工具查看数据

使用Pandas工具head()方法查看前五行数据:

关键代码

3.2 数据缺失查看

使用Pandas工具info()方法查看数据信息

   

从上图可以看到,总共有11个变量,数据中无缺失值,共2000条数据。

关键代码:  

3.3 数据描述性统计

通过Pandas工具的describe()方法来查看数据的平均值标准差、最小值、分位数最大值

关键代码如下:    

4.探索数据分析

4.1 y变量直方图

用Matplotlib工具的hist()方法绘制直方图

从上图可以看到y变量主要集中在-400~400之间

4.2 相关性分析

从上图中可以看到数值越大相关性越强,正值是正相关、负值是负相关

5.特征工程

5.1 建立特征数据和标签数据

关键代码如下

5.2 数据集拆分

通过train_test_split()方法按照80%训练集、20%测试集进行划分关键代码如下

5.3 数据样本增维

数据样本增加维度后的数据形状

6.构建FA萤火虫优化算法优化CNN回归模型

主要使用FA萤火虫优化算法优化CNN回归算法用于目标回归

6.1 FA萤火虫优化算法寻找的最优参数   

最优参数

   

6.2 最优参数构建模型

编号

模型名称

参数

1

CNN回归模型

units=best_units

2

epochs=best_epochs

6.3 最优参数模摘要信息

6.4 最优参数模网络结构

  

6.5 最优参数模训练集测试集损失曲线

  

7.模型评估

7.1 评估指标结果

评估指标主要包括可解释差值平均绝对误差、均方误差、R方值等等。

模型名称

指标名称

指标值

测试集

CNN回归模型

  R方

0.9126

均方误差

3568.1599

解释方差

0.9141

平均绝对误差

45.9236

从上表可以看出,R方0.9126,为模型效果较好。

关键代码如下

7.2 真实值预测值对比图

从上图可以看出真实值和预测值波动基本一致,模型拟合效果良好。   

8.结论与展望

综上所述,本文采用了FA萤火虫优化算法寻找CNN回归算法的最优参数值构建回归模型,最终证明我们提出的模型效果良好。此模型可用日常产品的预测。

# 本次机器学习项目实战所需的资料项目资源如下:
 
# 项目说明链接https://pan.baidu.com/s/18E_dRXuXNgFyDXwWWtb1AA 
提取码:5j8a

更多项目实战,详见机器学习项目实战合集列表

机器学习项目实战合集列表_机器学习实战项目_胖哥真不错的博客-CSDN博客


 

原文地址:https://blog.csdn.net/weixin_42163563/article/details/134816286

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_48540.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注