异常数据检测 | Python实现孤立森林(IsolationForest)异常检测

python 1 年前 0 6

本文介绍: 异常数据检测 | Pyt h on 实现孤立森林(Isola t i onForest)异常检测

孤立森林(Isola t i onForest)异常检测
Isola t i onForest[6]算法它是一种集成算法(类似于随机森林)主要用于挖掘异常(Ano m aly)数据，或者说离群点挖掘，总之是在一大堆数据中，找出与其它数据的规律不太符合的数据。该算法不采样任何基于聚类或距离的方法，因此他和那些基于距离的的异常值检测算法有着根本上的不同，孤立森林认定异常值的原则是异常值是少数的和不同的数据。它通常用于网络安全中的攻击检测和流量异常等分析，金融机构则用于挖掘出欺诈行为。

当我们使用Isola tionForest[7]算法时需要设置一个异常值比例的参数 c on t a min a tion，该参数的作用类似于之前的outlie rs_fr action。
使用 fit 方法对孤立森林模型进行训练
 使用 pr edi c t 方法去发现数据中的异常值。返回1表示正常值，-1表示异常值。

data = df[[‘price_usd’, ‘src h_book in g_window’, ‘src h_s atur day_night_bool’]]
scale r = Stand ar dScale r()
np_scale d = scale r.fit_transform(data)
data = pd.DataFram e(np_scale d)

训练孤立森林模型

model = IsolationForest(contamination=outlie rs_fr action)
model.fit(data)

#返回1表示正常值，-1表示异常值
df[‘ano maly2’] = pd.Se r ies(model.pr edi ct(data))

fig, ax = plt.su b p lo ts(fig size=(10,6))
a = df.loc[df[‘ano maly2’] =

原文地址:https://blog.csdn.net/qq_59771180/art icle/details/134701043

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若转载，请注明出处：http://www.7code.cn/show_15069.html

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

isolationforest 异常检测

相关文章

视觉检测系统：工厂生产零部件的智能检测

视觉检测系统：工厂生产零部件的智能检测

互联网 12 月前 5

SpringBoot中全局异常处理

SpringBoot中全局异常处理

spring 12 月前 6

YOLOv8改进更换轻量级网络结构

YOLOv8改进更换轻量级网络结构

互联网 12 月前 7

计算机视觉实战项目3（图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单目测距与测速+行人车辆计数等）

计算机视觉实战项目3（图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单目测距与测速+行人车辆计数等）

互联网 12 月前 4

基于OpenCV的高压电力检测项目案例

基于OpenCV的高压电力检测项目案例

互联网 12 月前 3

Java 异常处理上篇： Throwable 详解

Java 异常处理上篇： Throwable 详解

java 1 年前 7

python视频播放列表信息库之m3u8使用详解

python视频播放列表信息库之m3u8使用详解

python 12 月前 3

python创建pdf文件

python 12 月前 3

发表回复取消回复