Data Science — это совокупность понятий и методов, позволяющих придать смысл и понятный вид огромным объемам данных.
Каждая из глав этой книги посвящена одному из самых интересных аспектов анализа и обработки данных. Вы начнете с теоретических основ, затем перейдете к алгоритмам машинного обучения, работе с огромными массивами данных, NoSQL, потоковым данным, глубокому анализу текстов и визуализации информации. В многочисленных практических примерах использованы сценарии Python.
Обработка и анализ данных — одна из самых горячих областей ГГ, где постоянно требуются разработчики, которым по плечу проекты любого уровня, от социальных сетей до обучаемых систем. Надеемся, книг а станет отправной точкой для вашего путешествия в увлекательный мир Data Science.
Data science в мире больших данных.
Нод обобщающим термином «большие данные» принято понимать любые наборы данных, достаточно большие и сложные для того, чтобы их можно было обработать традиционными средствами работы с данными (например, РСУБД — реляционными системами управления базами данных). Широко распространенные РСУБД давно считаются универсальным инструментом, но спрос на обработку больших данных показывает иное. В концепцию data science входит использование методов анализа огромных объемов данных и извлечения содержащейся в них информации. Связь между большими данными и data science такая же, как между сырой нефтью и нефтеперерабатывающим заводом. Data science и большие данные развивались на базе статистики и традиционного управления данными, но сейчас считаются разными дисциплинами.
Data science — это расширение статистики, способное справляться с огромными объемами данных, производимыми в наши дни. Data science добавляет методы из computer science в репертуар статистики. В аналитической заметке Лейни и Карта «Emerging Role of the Data Scientist and the Art of Data Science» были проработаны сотни описаний рабочих обязанностей специалистов data science, статистиков и аналитиков бизнес-данных, чтобы выявить различия между этими должностями. Главное, что отличает специалиста data science от статистика, — это умение работать с большими данными и подготовка в области машинного обучения, организации вычислений и построения алгоритмов. Их инструментарии обычно тоже различаются; в описаниях работы специалистов data science чаще упоминается умение использовать Hadoop, Pig, Spark, R, Python и Java (среди прочего). He огорчайтесь, если вас устрашило это перечисление; многие пункты будут постепенно раскрыты в этой книге, хотя основное внимание будет уделено Python. Python — замечательный язык для data science, потому что для него написано много библиотек data science и он широко поддерживается специализированными программами. Например, почти в каждой популярной базе данных NoSL существует программный интерфейс (API) для Python. Из-за этих особенностей, а также из-за возможности быстро строить прототипы на языке Python с сохранением приемлемой производительности его популярность в мире data science быстро растет.
СОДЕРЖАНИЕ.
Предисловие.
Благодарности.
О книге.
Структура книги.
Для кого написана эта книга.
Условные обозначения и загружаемые файлы.
Об авторах.
От издательства.
Глава 1. Data science в мире больших данных.
Глава 2. Процесс data science.
Глава 3. Машинное обучение.
Глава 4. Работа с большими данными на одном компьютере.
Глава 5. Первые шаги в области больших данных.
Глава б. Присоединяйтесь к движению NoSQL.
Глава 7. Графовые базы данных.
Глава 8. Глубокий анализ текста.
Глава 9. Визуализация данных для конечного пользователя.
Приложение А. Настройка Elasticsearch.
А.1. Установка в Linux.
A.2. Установка в Windows.
Приложение Б. Установка Neo4j.
Б.1. Установка в Linux.
Б.2. Установка в Windows.
Приложение В. Установка сервера MySQL.
B.1. Установка в Windows.
В.2. Установка в Linux.
Приложение Г. Установка Anaconda в виртуальной среде.
Г.1. Установка в Linux.
Г.2. Установка в Windows.
Г.3. Настройка среды.
Купить .
По кнопкам выше и ниже «Купить бумажную книгу» и по ссылке «Купить» можно купить эту книгу с доставкой по всей России и похожие книги по самой лучшей цене в бумажном виде на сайтах официальных интернет магазинов Лабиринт, Озон, Буквоед, Читай-город, Литрес, My-shop, Book24, Books.ru.
По кнопке «Купить и скачать электронную книгу» можно купить эту книгу в электронном виде в официальном интернет магазине «ЛитРес», и потом ее скачать на сайте Литреса.
По кнопке «Найти похожие материалы на других сайтах» можно найти похожие материалы на других сайтах.
On the buttons above and below you can buy the book in official online stores Labirint, Ozon and others. Also you can search related and similar materials on other sites.
Хештеги: #учебник по программированию :: #программирование :: #Силен :: #Мейсман :: #Али
Смотрите также учебники, книги и учебные материалы:
- Реактивные веб-сайты, Клиентская оптимизация в алгоритмах и примерах, Мациевский Н.С., Степанишев Е.В., Кондратенко Г.И., 2017
- Программируем Arduino, Профессиональная работа со скетчами, Монк С., 2017
- Программируем Arduino, Основы работы со скетчами, Монк С., 2017
- Отъявленный программист, Лайфхакинг из первых рук, Савчук И., 2016
- Быстрый старт с IDLE Python, Костерин В.В., 2019
- Я иду на урок информатики, Задачи по программированию, 7-11 классы, книга для учителя, Златопольский Д.М., 2001
- Московские олимпиады по программированию, Наумов Б.Н., Брудно А.Л., Каплан Л.И., 1990
- Основы алгоритмизации и программирования в средней школе, Батан Л.В., 2012