Flinkのコアは、データストリームを介した分散計算のためのデータ配信、通信、およびフォールトトレランスを提供するストリーミングデータフローエンジンです。Flinkには、Flinkエンジンを使用するアプリケーションを作成するためのいくつかのAPIが含まれます。Java、Scala、Pythonに埋め込まれた静的データ用のDataSet API、JavaおよびScalaに埋め込まれた無制限ストリーム用のDataStream API、JavaおよびScala。Flinkは、ドメイン固有のユースケース用のライブラリもバンドルしています。MachineLearningライブラリと、グラフ処理APIおよびライブラリであるGellyです。Flinkは、データの入出力と展開の両方で、他の有名なオープンソースシステムと簡単に統合できます。(以前の成層圏)
ウェブサイト:
http://flink.apache.orgカテゴリー
LinuxのApache Flinkの代替
18
Apache Hadoop
Apache Hadoopは、Apache v2ライセンスでライセンスされたデータ集約型分散アプリケーションをサポートするオープンソースソフトウェアフレームワークです。
9
Apache Spark
Apache Spark™は、大規模なデータ処理用の高速で汎用的なエンジンです。SpeedRunプログラムは、メモリ内のHadoop MapReduceよりも最大100倍、ディスク上では10倍高速です。
1
Disco MapReduce
Discoは、MapReduceパラダイムに基づいてPythonで作成された、分散コンピューティング向けの軽量のオープンソースフレームワークです。