流批一体数据交换引擎

产品概述

  1. 我们不仅仅是数据的搬运工,还是数据搬运过程中加工处理工厂
  2. 我们不仅仅适用关系数据库中,还适配当下流行的时序数据库消息中间件、Hadoop生态中,支持多种类型数据库之间融合查询流式计算
  3. etlengine核心思想是为用户快速搭建ETL产品提供解决方案,让用户代码乃至零代码将ETL产品集成到自己项目或产品生态中。
  4. 该产品由etl-engine引擎和etl-designer云端设计器及etl-crontab调度组成。
  5. etl-engine引擎负责解析ETL配置文件执行ETL任务
  6. etl-designer云端设计通过拖拉拽的方式生成etl-engine引擎可识别的ETL任务配置文件
  7. etl-crontab调度设计负责时间周期执行指定的ETL任务,及查询ETL任务执行日志功能架构图
    在这里插入图片描述

应用场景

异构系统数据交换

  1. 传统行业业务系统数据相对独立,随着信息平台一体化数据中台及大数据时代的推进,要求各业务系统数据相互融合,业务资源共享
  2. etl-engine支持关系数据库、时序数据库不同媒体行数据交换。
    传统行业
    在这里插入图片描述

数据分发网关

融合查询

以往数据迁移过程是从一个A数据源到抽取、转换、再装载到另一个B数据源过程然后再做查询分析,即将多个业务系统产生的数据抽取到数据仓库中,然后再对数据仓库中事实表和维表进行统计查询分析,相当于是两阶段操作
融合查询可同时从多个业务系统读取数据,并在内存中对已读取的数据做数据关联查询,最终将关联后的结果输出数据仓库,对比上述场景一个轻量级的一阶段操作,常用在将多个维表数据转换成一个大宽表的场景
在这里插入图片描述在这里插入图片描述### 流式计算
互联网诞生之初虽然数据量暴增,单日事实表条数千万级别,但客户需求场景更多是“t+1”形式,只需对当日、当周、当月数据进行分析,这些诉求仅离线分析就可满足。
随着大数据领域不断发展企业对于业务场景的诉求也从离线的满足转到高实时性的要求,数栈产品也在这一过程中进行着不断的迭代升级,随之数据栈诞生了kafka + flink组合实现动态数据进行流式计算,同时kafka + etl-engine(融合计算的加持组合实现轻量级流式计算引擎。

在这里插入图片描述

产品优势

支持部署模式

  1. 按原有产品功能前后端集成或前后分离部署
  2. 用户个性化需求定制开发部署

支持操作系统

Windows、Linux、Unix、Mac

支持数据源类型

  1. 文件类型
    Excel、CSV
  2. 数据库类型
    MySQL、PostgreSQL、Oracle、Sqlite、Redis
  3. 消息中间件
    Kafka、Rocketmq
  4. 时序数据库
    Influxdb、Clickhouse、Prometheus
  5. Hadoop生态
    Hive

产品试用地址

github地址
https://github.com/hw2499/etl-engine

技术支持

vx : weigeonlyyou

原文地址:https://blog.csdn.net/iteye_1574/article/details/128201334

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_33940.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注