「开源」数据同步ETL工具，支持多数据源间的增、删、改数据同步

一、开源项目简介

Elasticsearch-datatran由 bboss 开源的数据采集同步ETL工具，提供数据采集、数据清洗转换处理和数据入库功能。Elasticsearch-datatran 的独特之处，其数据同步作业采用java语言开发，小巧而精致，可以用采用java提供的所有功能和现有组件框架，随心所欲地处理和加工海量存量数据、实时增量数据；可以根据数据规模及同步性能要求，按需配置和调整数据采集同步作业所需内存、工作线程、线程队列大小；可以将作业独立运行，亦可以将作业嵌入基于java开发的各种应用汇总运行；提供了作业任务控制API、作业监控api，支持作业启动、暂停(pause)、继续（resume）、停止控制机制，可轻松定制一款属于自己的ETL管理工具。

如果您还在苦于logstash、flume、filebeat之类的开源工具无法满足复杂的、海量的数据处理加工场景，那么Elasticsearch-datatran将是一个不错的选择。

二、开源协议

使用Apache-2.0开源协议

三、界面展示

四、功能概述

1）数据导入的方式

支持逐条数据导入
批量数据导入
批量数据多线程并行导入
定时全量（串行/并行）数据导入
定时增量（串行/并行）数据导入
支持记录切割功能

2）支持各种主流数据库、各种es版本以及本地/Ftp日志文件数据采集和同步、加工处理

支持在Elasticsearch、关系数据库、Mongodb、HBase、Hive、Kafka、文本文件、excel文件、SFTP/FTP、http/https多种数据源之间进行海量数据采集同步；支持数据实时增量采集和全量采集；支持根据字段进行数据记录切割；支持多级文件路径(本地和FTP/SFTP)下不同文件数据采集写入不同的数据库表和其他数据源。

支持各种数据库： mysql,maridb，postgress,oracle ,sqlserver,db2,tidb,hive，mongodb、HBase等

支持各种Elasticsearch版本： 1.x,2.x,5.x,6.x,7.x,8.x,+

3）提供自定义处理采集数据功能，可以按照自己的要求将采集的数据处理到目的地，如需定制化将数据保存到特定的地方，可自行实现CustomOutPut接口处理即可。

4）支持从kafka接收数据；经过加工处理的数据亦可以发送到kafka；

5）支持将单条记录切割为多条记录；

6）可以将加工后的数据写入File并上传到ftp/sftp服务器；

7）支持备份采集完毕日志文件功能，可以指定备份文件保存时长，定期清理超过时长文件；

8）支持自动清理下载完毕后ftp服务器上的文件;

9）支持excel、csv文件采集（本地和ftp/sftp）

10）支持导出数据到excel和csv文件,并支持上传到ftp/sftp服务器

11）支持海量PB级数据同步导入功能

12）支持将ip转换为对应的运营商和城市地理坐标位置信息

13）支持设置数据bulk导入任务结果处理回调函数，对每次bulk任务的结果进行成功和失败反馈，然后针对失败的bulk任务通过error和exception方法进行相应处理

14）支持以下三种作业调度机制：

jdk timer （内置）
quartz
xxl-job分布式调度引擎，基于分片调度机制实现海量数据快速同步能力

15) 提供灵活的作业启动、暂停(pause)、继续（resume）、停止控制机制

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

「开源」数据同步ETL工具，支持多数据源间的增、删、改数据同步

一、开源项目简介

二、开源协议

三、界面展示

四、功能概述

评论(0)

提示：请文明发言取消回复

随机推荐

[开源]高度定制化Git工作流工具，上手简单、功能强大、性能优异

[开源]国产的开源项目管理软件，基于国际流行的敏捷项目管理方式

高效、易用、功能强大的API管理平台，提供优雅的接口管理服务

[开源]一站式自动化运维及自动化部署平台,无Agent的方式接入应用

「开源」一个极简的敏捷项目管理系统，一个PMP和ACP的结合的产物

下载排行榜

一款开源会员营销系统，彻底打通收银系统和会员营销系统的壁垒

[开源]轻量级、高性能、前后端分离的电商系统，支持微信小程序+H5+公众号+APP

「开源」新零售电商系统，前后端全部100%开源，无任何加密方便扩展

多语言/货币/国际配送方式，可免费商用的开源跨境电商商城系统

「开源」多端一体、多商户分销商城系统，前后端分离全部100%开源

「开源」APP+H5+小程序预订开源酒店管理系统（多酒店版）

「开源」实时AI智能决策引擎、规则引擎、风控引擎、数据流引擎

智慧校园、智慧园区、企事业单位食堂、门禁等场景开源一卡通系统

开源一款前后端分离具备H5、小程序、APP、PC端的开源考试系统

「开源」基于SpringCloud、Vue3构建的开源全栈微服务商城

「开源」数据同步ETL工具，支持多数据源间的增、删、改数据同步

一、开源项目简介

二、开源协议

三、界面展示

四、功能概述

评论(0)

提示：请文明发言 取消回复

相关文章

随机推荐

下载排行榜

提示：请文明发言取消回复