Эта книга — практическое руководство для тех, кто превращает данные в решения. Шаг за шагом вы разберетесь, как современные методы искусственного интеллекта помогают не просто интерпретировать массивы информации, но и находить скрытые закономерности, прогнозировать будущее и создавать конкурентные преимущества для бизнеса. Вы получите системное понимание инструментов анализа, узнаете о лучших практиках применения машинного обучения и научитесь интегрировать ChatGPT в ежедневные рабочие процессы.
Четкие инструкции научат правильно извлекать, интерпретировать и представлять данные, в результате вы сможете поднять навыки на совершенно новый уровень.
Это не сухая теория — это рабочая методика, которая помогает аналитикам принимать решения быстрее, точнее и смелее.
Вы получите проверенные стратегии анализа больших данных с помощью ИИ, практические инструменты для повышения точности прогнозов, кейсы из бизнеса и индустрии, которые можно адаптировать под свои задачи, понимание, как превратить аналитическую работу в драйвер роста компании.

Ненадежный доступ в Интернет.
Некоторые модели, такие как Gemini от Google, изначально работают с подключением к Интернету — это часть их архитектуры. У других все не так просто. Автономные модели, вроде Llama 2, которые можно запускать локально, по умолчанию не имеют доступа к поисковым системам и требуют дополнительной настройки. В таких случаях используется подход с многоэтапным рассуждением: сначала модель определяет, какие данные ей нужны, затем внешний компонент выполняет поиск, и только потом LLM формирует финальный ответ. Такая схема поддерживается, например, в веб-интерфейсе ChatGPT-4, где предусмотрен доступ к сети.
Да, звучит непросто — и так оно и есть. Надежная работа в этом режиме требует либо интеграции с внешними API, либо сложной архитектуры, либо — нередко — быстро устаревающих библиотек. Более того, даже у ChatGPT время от времени возникает «забывчивость» — модель может не использовать Интернет просто потому, что в процессе обучения она не имела к нему доступа и этот «след» отпечатывается в ее «сознании». Если для анализа вам нужны самые свежие данные, новости или тренды, вам стоит внимательнее подбирать инструменты.
ОГЛАВЛЕНИЕ.
Предисловие.
Вступление.
Благодарности.
О книге.
Целевая аудитория.
Как читать эту книгу.
Данные, использованные при работе над книгой.
О коде.
Об авторах.
Иллюстрация на обложке.
От издательства.
О научном редакторе русскоязычного издания.
Глава 1. Использование генеративного ИИ в сфере анализа данных.
1.1. Внутренние ограничения генеративных моделей ИИ.
1.2. Роль генеративного ИИ в аналитике данных.
1.2.1. Как генеративный ИИ можно использовать в аналитике данных.
1.2.2. Взаимодополняемость языковых моделей и других инструментов анализа данных.
1.2.3. Ограничения генеративного ИИ в автоматизации и оптимизации аналитических процессов.
1.3. Первые шаги с генеративным ИИ в аналитике данных.
1.3.1. Работа через веб-интерфейс.
1.3.2. Остерегайтесь токенов.
1.3.3. Подключение к API и работа с ним.
1.3.4. Интеграция сторонних моделей генеративного ИИ.
1.3.5. Запуск языковых моделей локально.
1.3.6. Практические советы по успешному внедрению генеративного ИИ.
Резюме.
Глава 2. Как генеративный ИИ помогает улучшать качество данных.
2.1. Прихоти судьбы.
2.2. Несколько слов о передовых практиках.
2.3. Начало работы.
2.4. Структура оценки качества данных.
2.4.1. Этапы очистки данных.
2.4.2. Ключевые этапы исследовательского анализа данных.
2.5. Очистка данных.
2.5.1. Удаление дубликатов.
2.5.2. Обработка пропущенных значений.
2.5.3. Исправление явных ошибок ввода.
2.5.4. Проверка формата и корректности данных.
2.6. Исследовательский анализ данных.
2.6.1. Анализ распределения оценок.
2.6.2. Исследование временных рядов.
2.6.3. Исследование неизвестных переменных.
2.6.4. Приведение данных к единому виду.
Резюме.
Глава 3. Описательный анализ и статистические выводы с помощью генеративного ИИ.
3.1. Вопросы исследования.
3.2. Проектирование аналитического процесса.
3.3. Описательный анализ данных.
3.3.1. Популярность категорий товаров.
3.3.2. Эффективность продаж по категориям и регионам.
3.3.3. Распределение пользовательских оценок.
3.3.4. Статусы заказов.
3.4. Статистический вывод.
3.4.1. Прежде чем начать.
3.4.2. Связь между характеристиками товара и стоимостью доставки.
3.4.3. Связь между товаром, транзакциями, параметрами доставки и оценкой в отзыве.
3.4.4. Различия в показателях продаж и удовлетворенности клиентов между продавцами.
Резюме.
Глава 4. Интерпретация результатов с помощью генеративного ИИ.
4.1. Постановка задачи.
4.2. Популярность категорий товаров.
4.3. Эффективность продаж по категориям и регионам.
4.4. Анализ распределения оценок отзыва.
4.5. Статус заказа.
4.6. Связь между характеристиками товара и стоимостью доставки.
4.7. Связь между товаром, транзакцией, параметрами доставки и оценкой в отзыве.
4.8. Различия в показателях продаж и удовлетворенности клиентов между продавцами.
Резюме.
Глава 5. Основы анализа текста с помощью генеративного ИИ.
5.1. Анализ текста в эпоху генеративного ИИ.
5.1.1. Генеративный ИИ меняет правила игры.
5.1.2. Остерегайтесь запугивания со стороны ИИ.
5.1.3. Ограничения и их влияние на анализ.
5.2. Подготовка к анализу.
5.2.1. Оценка качества текстовых данных.
5.2.2. Пример подготовки отзыва клиента.
5.3. Частотный анализ.
5.3.1. Что можно узнать из частотного анализа отзывов.
5.3.2. Выполнение частотного анализа с помощью генеративного ИИ.
5.3.3. Загрузка данных в ChatGPT для частотного анализа.
5.3.4. Извлечение наиболее часто встречающихся слов.
5.3.5. Извлечение наиболее часто встречающихся фраз.
5.3.6. Интерпретация результатов частотного анализа.
5.4. Анализ сопутствующих событий.
5.4.1. Какие выводы можно сделать из анализа сопутствующих событий.
5.4.2. Анализ сопутствующих событий на практике.
5.4.3. Интерпретация результатов анализа.
5.5. Поиск по ключевым словам.
5.5.1. Где и как помогает поиск по ключевым словам.
5.5.2. Генерация ключевых слов с помощью ИИ.
5.5.3. Практическая реализация генерации ключевых слов.
5.5.4. Поиск по ключевым словам.
5.5.5. Улучшение результатов поиска по ключевым словам.
5.5.6. Сравнение моделей ИИ: программный поиск положительных отзывов.
5.5.7. Где искать вдохновение для анализа.
5.6. Методы, основанные на словарях.
5.6.1. Что можно узнать с помощью методов, основанных на словарях.
5.6.2. Поиск подходящих словарей и ресурсов.
5.6.3. Интерпретация ресурсов.
5.6.4. Адаптация кода под выбранные словари.
5.6.5. Повышение качества поиска по словарю.
Резюме.
Глава 6. Продвинутый анализ текста с помощью генеративного ИИ.
6.1. Анализ отзывов.
6.2. Анализ тональности.
6.2.1. Что можно узнать из анализа тональности.
6.2.2. Прямой анализ тональности с помощью генеративного ИИ.
6.2.3. Анализ тональности с помощью API генеративного ИИ.
6.2.4. Анализ тональности с помощью машинного обучения.
6.2.5. Анализ тональности с использованием неоптимальной модели.
6.2.6. Анализ тональности на основе переведенных данных.
6.2.7. Анализ тональности с помощью многоязычных моделей.
6.2.8. Анализ тональности с помощью моделей zero-shot.
6.2.9. Сравнение подходов к расширенному анализу тональности.
6.3. Резюмирование текста.
6.3.1. Зачем нужно резюмирование текста.
6.3.2. Как генеративный ИИ может помочь в резюмировании текста.
6.3.3. Резюмирование текста с помощью ChatGPT.
6.3.4. Резюмирование текста с помощью специализированных библиотек.
6.3.5. Тематическое моделирование.
Резюме.
Глава 7. Масштабирование и оптимизация производительности.
7.1. Измерение производительности.
7.1.1. Время выполнения.
7.1.2. Пропускная способность.
7.1.3. Использование ресурсов.
7.2. Улучшение производительности кода.
7.2.1. Оптимизация кода.
7.2.2. Масштабирование кода.
7.3. Развертывание в облаке.
7.3.1. Что такое облачные вычисления.
7.3.2. Перенос кода в облако.
7.4. Преобразование кода.
Резюме.
Глава 8. Риски, способы их снижения и компромиссы.
8.1. Риски работы с генеративным ИИ.
8.2. Общие рекомендации.
8.2.1. Политика использования ИИ.
8.2.2. Поощрение прозрачности и подотчетность.
8.2.3. Обучение заинтересованных сторон.
8.2.4. Экспертная проверка результатов модели.
8.3. Риски искажения информации и галлюцинаций в генеративных моделях.
8.4. Снижение рисков неправильного толкования и интерпретации.
8.4.1. Обеспечение понимания контекста.
8.4.2. Адаптация и итеративное уточнение запросов.
8.4.3. Методики постобработки.
8.4.4. Представление результатов ИИ: лучшие практики прозрачной и понятной коммуникации.
8.4.5. Организация обратной связи.
8.5. Риски предвзятости и нарушения принципов справедливости модели.
8.5.1. Распознавание и выявление предвзятости в результатах модели.
8.5.2. Применение методов распознавания и смягчения предвзятости.
8.5.3. Поощрение разнообразия и обеспечение этичного использования генеративного ИИ.
8.5.4. Постоянный мониторинг и актуализация моделей.
8.6. Риски конфиденциальности и безопасности.
8.6.1. Выявление конфиденциальных данных.
8.6.2. Анонимизация и псевдонимизация данных.
8.6.3. Социальная инженерия и фишинг.
8.6.4. Соблюдение правил защиты данных.
8.6.5. Регулярные аудиты и оценки безопасности.
8.6.6. Обучение и повышение осведомленности сотрудников.
8.7. Правовые и нормативно-правовые риски.
8.7.1. Понимание действующих норм.
8.7.2. Интеллектуальная собственность и лицензирование.
8.7.3. Прозрачность и интерпретируемость.
8.7.4. Создание структуры соответствия.
8.7.5. Поддержание актуальности практик соответствия.
8.8. Непредвиденные риски.
8.8.1. Модели-мошенники.
8.8.2. Уязвимые «королевские драгоценности».
8.8.3. Неизвестные неизвестности.
Резюме.
Приложение A. Передача нескольких DataFrame в ChatGPT v4.
А1. Чат от 1 апреля 2023 г.
Приложение Б. Об отладке кода ChatGPT.
Б1. Чат от 3 апреля 2023 г.
Приложение В. О лени и человеческих ошибках.
В1. Чат от 7 апреля 2023 г.
Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Анализ данных с помощью GenAI и Python, Гуджа А., Сивяк М., 2026 - fileskachat.com, быстрое и бесплатное скачивание.
Скачать pdf
Ниже можно купить эту книгу, если она есть в продаже, и похожие книги по лучшей цене со скидкой с доставкой по всей России.Купить книги
Скачать - pdf - Яндекс.Диск.
Дата публикации:
Хештеги: #учебник по программированию :: #программирование :: #Гуджа :: #Сивяк :: #искусственный интеллект
Смотрите также учебники, книги и учебные материалы:
Предыдущие статьи:








