Если у вас уже есть положительный опыт использования Spark для решения небольших задач, но вы по-прежнему ломаете голову — где та самая непревзойденная производительность Spark, позволяющая перемалывать колоссальные объемы данных, — то эта книга для вас. Она расскажет, как эффективно использовать Spark для укрощения больших данных и вырасти из новичка в специалиста. Идеально подходит для программистов, инженеров по работе с данными, системных администраторов, обслуживающих крупномасштабные приложения.
Предисловие.
Мы написали эту книгу для дата-инженеров (data engineers) и ученых по данным (data scientists), которым хотелось бы извлечь максимальную пользу из фреймворка Spark. Если вы работаете со Spark и вложили в его освоение немало усилий, но погрязли в ошибках памяти и загадочных, перемежающихся сбоях, наша книга для вас. Если вы применяли Spark в какой-либо исследовательской деятельности или экспериментировали с ним, не используя для конкретных производственных задач, и запустить фреймворк в работу мешает недостаточная уверенность в уровне его освоения, то это издание может помочь. Если вы энтузиаст Spark, но не сумели добиться от него ожидаемого повышения производительности, то мы надеемся, что вы найдете здесь ответы на свои вопросы. Книга предназначена для тех, кто уже пользовался Spark, и может оказаться не вполне понятной тем, кто до сих пор мало работал с этим фреймворком или с распределенными вычислениями либо вообще не имел с ними дела. В разделе «Вспомогательная литература и материалы» чуть ниже можно найти рекомендации по книгам для начинающих.
Краткое содержание.
Предисловие.
Глава 1. Введение в эффективный Spark.
Глава 2. Как работает Spark.
Глава 3. Наборы DataFrame/Dataset и Spark SQL.
Глава 4. Соединения (SQL и Core).
Глава 5. Эффективные преобразования.
Глава 6. Работа с данными типа «ключ — значение».
Глава 7. Выходим за рамки Scala.
Глава 8. Тестирование и валидация.
Глава 9. Spark MLlib и ML.
Глава 10. Компоненты и пакеты фреймворка Spark.
Приложение. Тонкая настройка, отладка и другие аспекты,обычно игнорируемые разработчиками.
Купить .
По кнопкам выше и ниже «Купить бумажную книгу» и по ссылке «Купить» можно купить эту книгу с доставкой по всей России и похожие книги по самой лучшей цене в бумажном виде на сайтах официальных интернет магазинов Лабиринт, Озон, Буквоед, Читай-город, Литрес, My-shop, Book24, Books.ru.
По кнопке «Купить и скачать электронную книгу» можно купить эту книгу в электронном виде в официальном интернет магазине «Литрес», и потом ее скачать на сайте Литреса.
По кнопке «Найти похожие материалы на других сайтах» можно найти похожие материалы на других сайтах.
On the buttons above and below you can buy the book in official online stores Labirint, Ozon and others. Also you can search related and similar materials on other sites.
Хештеги: #Карау :: #Уоррен :: #2018 :: #Spark :: #программирование
Смотрите также учебники, книги и учебные материалы:
- Алгоритмы и структуры данных, Извлечение информации на языке Java, Доуни А.Б., 2018
- Математическое программирование, Теория и методы, Гредасова Н.В., Сесекин А.Н., Шориков А.Ф., Плескунов М.А., 2020
- Теория автоматического управления в примерах и задачах с решениями в MATLAB, Гайдук А.Р., Беляев В.Е., Пьявченко Т.А., 2016
- Цифровая обработка сигналов на системном уровне с использованием LabVIEW, Кехтарнаваз Н., Ким Н., 2007
- Эволюционная архитектура, поддержка непрерывных изменений, Нил Ф., Ребекка П., Патрик К., 2019
- Чистый код, создание, анализ и рефакторинг, библиотека программиста, Мартин Р., 2013
- Чистый код, создание, анализ и рефакторинг, библиотека программиста, Мартин Р., 2010
- Паттерны проектирования, Фримен Э., Фримен Э., Сьерра К., Бейтс Б., 2011