Автор оригинала: FreeCodeCapm Team.
Тиртртхайоти Саркаром
Apache Spark является одной из самых горячих каркасов в науке данных. Это осознает потенциал объединения как больших данных, так и обучение машине. Это потому что:
- Spark быстро (до 100 раз быстрее, чем традиционные Hadoop MapReduce ) из-за операции в памяти.
- Он предлагает надежные, распределенные, неисправночные объекты данных (называется RDDS )