作者:禅与计算机程序设计艺术

1.简介

Apache Airflow一个开源基于DAG(Directed Acyclic Graph,有向无环图)模型轻量级工作系统,用于管理复杂的、可靠的、实时数据处理数据分析任务。Airflow可以轻松实现数据管道构建调度监控功能本文将详细介绍如何在Apache Airflow创建端到端的数据科学工作流,包括数据预处理特征工程机器学习建模模型评估、结果可视化等环节。

作者简介

郭耀昌,现任CTO,前Microsoft Research Intern,曾就职于亚马逊研究院(Amazon AI Lab),主要负责AWS亚马逊服务平台相关研发工作

本文概要

本文首先介绍了Apache Airflow基本概念然后阐述了Apache Airflow如何行数据科学工作流,包括数据准备特征工程、模型训练模型评估、结果展示步骤最后,作者给出了一个开源的数据科学工作流模板,并对其进行了详细的说明。希望通过阅读本文,读者能够更深入地了解Apache Airflow及其用于数据科学工作流的功能

2.基本概念及术语说明

DAG(Directed Acyclic Graph,有向无环图)

Airflow基于DAG(Directed Acyclic Graph,有向无环图)模型定义工作流。DAG由多个任务节点(Task Node)和多个依赖关系(Dependencyÿ

原文地址:https://blog.csdn.net/universsky2015/article/details/133191746

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_30196.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注