Luigi

Luigi

Luigiの目的は、長時間実行されるバッチプロセスに通常関連するすべての配管に対処することです。多くのタスクを連鎖させ、それらを自動化すると、障害が発生します。これらのタスクは何でも構いませんが、通常はHadoopジョブ、データベースとのデータのダンプ、機械学習アルゴリズムの実行など、長時間実行されます。Hive、Pig、Cascadingなど、データ処理の低レベルの側面に焦点を当てた他のソフトウェアパッケージがあります。Luigiはこれらを置き換えるフレームワークではありません。代わりに、各タスクがHiveクエリ、JavaのHadoopジョブ、ScalaまたはPythonのSparkジョブ、Pythonスニペット、データベースからのテーブルのダンプなど、多くのタスクをつなぎ合わせるのに役立ちます。数千のタスクで構成され、完了するまでに数日または数週間かかる長期実行パイプラインを簡単に構築できます。Luigiは多くのワークフロー管理を行っているため、タスク自体とその依存関係に集中できます。...ほぼすべてのタスクを作成できますが、Luigiには、いくつかの一般的なタスクテンプレートのツールボックスも付属しています使用する。これには、HadoopでPython mapreduceジョブ、Hive、Pigのジョブを実行するためのサポートが含まれています。また、HDFS用のファイルシステム抽象化、およびすべてのファイルシステム操作がアトミックであることを保証するローカルファイルも付属しています。これは、データパイプラインが部分的なデータを含む状態でクラッシュしないことを意味するため、重要です。
luigi

ウェブサイト:

カテゴリー

ライセンスのあるすべてのプラットフォームでのLuigiの代替

Zenaton

Zenaton

開発者向けのワークフロービルダー。数か月ではなく数日でイベント駆動型プロセスを構築します。
StackStorm

StackStorm

StackStormは、すべてのアプリ、サービス、ワークフローを結び付ける強力なオープンソース自動化プラットフォームです。拡張可能で柔軟性があり、DevOpsとChatOpsへの愛情を込めて構築されています。
ProActive Workflows & Scheduling

ProActive Workflows & Scheduling

ProActive Workflows&Schedulingを使用すると、会社のすべてのジョブとビジネスアプリケーションを簡単に実行し、アクティビティを監視して、ジョブの結果にすばやくアクセスできます。
Apache Airflow

Apache Airflow

Airflowは、データパイプラインをプログラムで作成、スケジュール、および監視するためのプラットフォームです。