Рубрики
Без рубрики

Как настроить Pyspark для вашего ноутбука Jupyter

Автор оригинала: FreeCodeCapm Team.

Тиртртхайоти Саркаром

Apache Spark является одной из самых горячих каркасов в науке данных. Это осознает потенциал объединения как больших данных, так и обучение машине. Это потому что:

  • Spark быстро (до 100 раз быстрее, чем традиционные Hadoop MapReduce ) из-за операции в памяти.
  • Он предлагает надежные, распределенные, неисправночные объекты данных (называется RDDS )