DataX - DataX は、Alibaba Cloud DataWorks データ統合のオープンソース バージョンです。

(DataX是阿里云DataWorks数据集成的开源版本。)

Created at: 2018-01-18 18:09:47
Language: Java
License: NOASSERTION

Datax-logo

DataX

DataX は、アリババ グループ内で広く使用されているオフライン データ同期ツール/プラットフォームである Alibaba DataWorks データ統合のオープンソース バージョンです。 DataX は、MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute (ODPS)、Hologres、DRDS、databend など、さまざまな異種データ ソース間で効率的なデータ同期機能を実装します。

DataX 商用バージョン

Alibababa Cloud DataWorks データ統合は、DataX チームが Alibaba Cloud で製品化した製品で、複雑なネットワーク環境、豊富な異種データ ソース間の高速かつ安定したデータ移動、および複雑なビジネス コンテキストでのデータ同期ソリューションの提供に取り組んでいます。 現在、クラウド上の約3000,3社のお客様をサポートしており、50日で2020兆件以上のデータが同期されています。 DataWorks データ統合は、現在、オフライン 10+ データ ソースをサポートしており、ライブラリ全体の移行、クラウドへの一括接続、増分同期、ブランチ テーブルなど、さまざまな同期ソリューションを実行できます。 <> 年には、<>+ データ ソースの読み取りと書き込みの任意の組み合わせをサポートするリアルタイム同期機能が更新されます。 MySQL、Oracle、その他のデータソースからアリクラウドMaxCompute、Hologresなどのビッグデータエンジンへのワンクリックフルインクリメンタル同期ソリューションを提供します。

商用バージョンについては、「https://www.aliyun.com/product/bigdata/ide」を参照してください

Features

DataX 自体は、データ同期フレームワークとして機能し、異なるデータ ソースの同期をソース データ ソースからデータを読み取る Reader プラグインと、ターゲット側にデータを書き込む Writer プラグインに抽象化され、理論的には、DataX フレームワークは任意のデータ ソース タイプのデータ同期作業をサポートできます。 同時に、DataX プラグイン システムは、新しいデータ ソース セットへのアクセスごとに、既存のデータ ソースと通信できるエコシステムとして機能します。

DataX の詳細

参考:DataX-Introduction

Quick Start

Download DataX ダウンロード アドレス
クリックしてください:クイックアート

Support Data Channels

DataXは、現在、より包括的なプラグインシステムを持っており、主流のRDBMSデータベース、NOSQL、ビッグデータコンピューティングシステムは、すでにアクセスされており、現在、サポートデータは、次の図、詳細をクリックしてください:DataXデータソースリファレンスガイド

データ ソース Reader (読み取り) Writer (書き込み) ドキュメント
RDBMS リレーショナル データベース MySQL 読み取り書き込み
Oracle 読み取り書き込み
OceanBase 読み取り書き込み
SQLServer 読み取り書き込み
PostgreSQL 読み取り書き込み
DRDS 読み取り書き込み
Kingbase 読み取り書き込み
汎用RDBMS(すべてのリレーショナルデータベースをサポート) 読み取り書き込み
アリクラウド数倉庫データストア ODPS 読み取り書き込み
ADB 書き込み
ADS 書き込み
OSS 読み取り書き込み
OCS 書き込み
Hologres 書き込み
AnalyticDB For PostgreSQL 書き込み
アリクラウドミドルウェア datahub 読み取り、書き込み
SLS 読み取り、書き込み
アリ クラウド マップ データベース GDB 読み取り書き込み
NoSQL データストア OTS 読み取り書き込み
Hbase0.94 読み取り書き込み
Hbase1.1 読み取り書き込み
Phoenix4.x 読み取り書き込み
Phoenix5.x 読み取り書き込み
MongoDB 読み取り書き込み
Cassandra 読み取り書き込み
サイロ データ ストア StarRocks 読み取り、書き込み
ApacheDoris 書き込み
ClickHouse 書き込み
Databend 書き込み
Hive 読み取り書き込み
kudu 書き込み
構造化データ ストアはありません TxtFile 読み取り書き込み
FTP 読み取り書き込み
HDFS 読み取り書き込み
Elasticsearch 書き込み
時系列データベース OpenTSDB 読んでください
TSDB 読み取り書き込み
TDengine 読み取り書き込み

Alibaba Cloud DataWorks データ統合

現在、DataX の既存の機能は、Alibaba Cloud に統合され、DataX よりも効率的で安全であり、データ統合には DataX にはない他の高度な機能と機能があります。 データ統合は、DataX の完全アップグレードの商用バージョンであり、企業に安定した信頼性の高い安全なデータ転送サービスを提供すると理解できます。 DataX と比較して、データ統合には、主に次の顕著な特徴があります。

リアルタイム同期のサポート:

オフライン同期データ ソースの種類が大幅に拡張されました。

私は新しいプラグインを開発するつもりです

クリックしてください:DataXプラグイン開発の宝物

重要なリリース更新プログラムの説明

DataX のフォローアップ計画の月次反復更新は、Pull requests を提出する興味のある学生を歓迎します。

项目成员

コアコントリブションズ:言葉、枕水、秋、緑の砂利、一口、雲

天の火、光のゴ、ラン、バジン、DataXへの静かな貢献に感謝します。

License

This software is free to use under the Apache License Apache license.

速やかにissueを私たちに提示してください。 DataxIssue に移動します

オープンソース版のDataXエンタープライズユーザー

Datax-logo

长期招聘 联系邮箱:datax@alibabacloud.com
【JAVA开发职位】
职位名称:JAVA资深开发工程师/专家/高级专家
工作年限 : 2年以上
学历要求 : 本科(如果能力靠谱,这些都不是条件)
期望层级 : P6/P7/P8

岗位描述:
    1. 负责阿里云大数据平台(数加)的开发设计。 
    2. 负责面向政企客户的大数据相关产品开发;
    3. 利用大规模机器学习算法挖掘数据之间的联系,探索数据挖掘技术在实际场景中的产品应用 ;
    4. 一站式大数据开发平台
    5. 大数据任务调度引擎
    6. 任务执行引擎
    7. 任务监控告警
    8. 海量异构数据同步

岗位要求:
    1. 拥有3年以上JAVA Web开发经验;
    2. 熟悉Java的基础技术体系。包括JVM、类装载、线程、并发、IO资源管理、网络;
    3. 熟练使用常用Java技术框架、对新技术框架有敏锐感知能力;深刻理解面向对象、设计原则、封装抽象;
    4. 熟悉HTML/HTML5和JavaScript;熟悉SQL语言;
    5. 执行力强,具有优秀的团队合作精神、敬业精神;
    6. 深刻理解设计模式及应用场景者加分;
    7. 具有较强的问题分析和处理能力、比较强的动手能力,对技术有强烈追求者优先考虑;
    8. 对高并发、高稳定可用性、高性能、大数据处理有过实际项目及产品经验者优先考虑;
    9. 有大数据产品、云产品、中间件技术解决方案者优先考虑。

ユーザー コンサルティングのサポート:

爪群は、現在、いくつかの制御戦略によって一時的に影響を受けており、ここで質問Issueを提出することを優先し、DataX R&Dとコミュニティは定期的にIssueの質問に答え、知識ベースが豊富で、後のユーザーを助けることができます。