В этой практичной книге четверо специалистов Cloudera по анализу данных описывают самодостаточные паттерны для выполнения крупномасштабного анализа данных при помощи Spark. Авторы комплексно рассматривают Spark, статистические методы и множества данных, собранные в реальных условиях, и на этих примерах демонстрируют решения распространенных аналитических проблем.
Что вы найдете в этой книге.
Глава 1 покажет место Spark в более широком контексте науки о данных и аналитики больших данных. В дальнейшем каждая глава будет содержать самодостаточный пример анализа с помощью Spark. Глава 2 познакомит вас с основами обработки данных на Spark и Scala на примере очистки данных. Следующие несколько глав охватывают важнейшие темы машинного обучения с помощью Spark, включая некоторые из наиболее распространенных алгоритмов в приложениях, независимых от конечной реализации. Оставшиеся главы больше напоминают сборную солянку и демонстрируют применение Spark в несколько более экзотических приложениях, которые, например, выполняют запросы к «Википедии» через латентные семантические связи в тексте или анализируют геномные данные.
Краткое содержание.
Предисловие.
Введение.
Глава 1. Анализ больших данных.
Глава 2. Введение в анализ данных с помощью Scala и Spark.
Глава 3. Рекомендация музыки и набор данных сервиса AudioScrobbler.
Глава 4. Прогнозирование лесного покрова с использованием деревьев принятия решений.
Глава 5. Обнаружение аномалий сетевого трафика с помощью кластеризации методом k-средних.
Глава 6. Описание «Википедии» с помощью латентно-семантического анализа.
Глава 7. Анализ сетей совместной встречаемости с помощью GraphX.
Глава 8. Анализ геопространственных и временных данных на примере поездок нью-йоркских такси.
Глава 9. Оценка финансовых рисков с помощью моделирования по методу Монте-Карло.
Глава 10. Анализ геномных данных и проект BDG.
Глава 11. Анализ нейровизуальных данных с помощью PySpark и Thunder.
Приложение A. Spark: копнем поглубже.
Приложение Б. Новый API конвейеров библиотеки MLlib.
Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Spark для профессионалов, современные паттерны обработки больших данных, Риза С., Лезерсон У., Оуэн Ш., Уилле Д., 2017 - fileskachat.com, быстрое и бесплатное скачивание.
Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.Купить эту книгу
Скачать - pdf - Яндекс.Диск.
Дата публикации:
Хештеги: #Риза :: #Лезерсон :: #Оуэн :: #Уилле :: #2017 :: #Spark :: #обработка :: #данные
Смотрите также учебники, книги и учебные материалы:
Следующие учебники и книги:
- Децентрализованные приложения, технология Blockchain в действии, Равал С., 2017
- Администрирование Microsoft Windows Server 2012, Линн С., 2014
- Unity для разработчика, мобильные мультиплатформенные игры, Мэннинг Д., Батфилд-Эддисон П., 2018
- Регрессионный анализ данных в пакете Mathcad, Воскобойников Ю.Е., 2011
Предыдущие статьи:
- Oracle PL/SQL, для профессионалов, Фейерштейн С., Прибыл Б., 2015
- MySQL по максимуму, Шварц Б., Зайцев П., Ткаченко В., 2018
- Hadoop, подробное руководство, Уайт Т., 2013
- GraphQL, язык запросов для современных веб-приложений, Бэнкс А., Порселло Е., 2019