Apache Spark

Apache Spark

Apache Spark™は、大規模なデータ処理用の高速で汎用的なエンジンです。SpeedRunプログラムは、メモリ内のHadoop MapReduceよりも最大100倍、ディスク上では10倍高速です。
Apache Spark™は、大規模データ処理用の高速で汎用的なエンジンです。速度メモリでHadoop MapReduceよりも最大100倍、ディスクで10倍高速でプログラムを実行します。Sparkには、循環データフローとインメモリコンピューティングをサポートする高度なDAG実行エンジンがあります。
apache-spark

ウェブサイト:

MacのApache Sparkの代替

Apache Hadoop

Apache Hadoop

Apache Hadoopは、Apache v2ライセンスでライセンスされたデータ集約型分散アプリケーションをサポートするオープンソースソフトウェアフレームワークです。
Disco MapReduce

Disco MapReduce

Discoは、MapReduceパラダイムに基づいてPythonで作成された、分散コンピューティング向けの軽量のオープンソースフレームワークです。