Обучение с подкреплением является одной из наиболее активно развивающихся областей, связанных с созданием искусственных интеллектуальных систем. Оно основано на том, что агент пытается максимизировать получаемый выигрыш, действуя в сложной среде с высоким уровнем неопределенности. Дается исчерпывающее и ясное изложение идей, методов и алгоритмов обучения с подкреплением, при этом диапазон излагаемого материала — от истоков возникновения рассматриваемых концепций до современных результатов в данной области. Для специалистов в области искусственного интеллекта, нейросетевого моделирования и управления, а также студентов и аспирантов соответствующих специальностей.
Предисловие.
К тому, что сейчас принято называть обучением с подкреплением, мы впервые пришли в 1979 г. Мы оба работали тогда в Массачусетсом университете над одним из наиболее ранних проектов, связанных с возвратом к сетям нейроноподобных адаптивных элементов как многообещающему подходу к решению задачи адаптивного искусственного интеллекта. В этом проекте изучалась «гетеростатическая теория адаптивных систем», созданная А.Харри Клопфом. Работа Харри была богатым источником идей, и перед нами стояла задача критически изучить их, а также сопоставить с тем, что было наработано за долгую предшествующую историю исследований в области адаптивных систем. Нам надо было выявить составные элементы этих идей, понять соотношение между ними и их относительную важность. Эта работа продолжается и сейчас, но в 1979 г. мы поняли, что, несмотря на свою простоту, одна из идей, на которых основывается рассматриваемый подход, привлекала удивительно мало внимания с точки зрения вычислительной перспективы. Это была просто-напросто идея обучающейся системы, которая хочет чего-то, которая подстраивает свое поведение, чтобы максимизировать значение некоторого особого сигнала из окружающей среды. Это была идея «гедонистической» обучающейся системы, или, как сказали бы мы сейчас, идея обучения с подкреплением.
Оглавление.
Предисловие редактора серии «Adaptive computation and machine learning».
Предисловие.
Часть I. Постановка задачи и подходы к ее решению.
Часть II. Фундаментальные методы решения.
Часть III. Единый подход.
Список обозначений.
Список литературы.
Предметный указатель.
Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Обучение с подкреплением, Саттон Р.С., Барто Э.Г., 2014 - fileskachat.com, быстрое и бесплатное скачивание.
Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.Купить эту книгу
Скачать - pdf - Яндекс.Диск.
Дата публикации:
Хештеги: #Саттон :: #Барто :: #2014 :: #обучение
Смотрите также учебники, книги и учебные материалы:
Следующие учебники и книги:
- Дисциплина без стресса, наказаний и наград, как развить в детях ответственность и желание учиться, Маршалл М., 2020
- Основы интеллектуального труда, Мандель Б.Р., 2020
- Допуски, посадки и технические измерения, теоретические основы профессиональной деятельности, Таратина Е.П., 2005
- Самоорганизующиеся карты, Кохонен Т., 2014
Предыдущие статьи:
- Нечеткое моделирование и управление, Пегат А., 2015
- Нечеткое моделирование и управление, Пегат А., 2013
- Эволюция Вселенной и происхождение жизни, Пекка Т., 2010
- Столетия тьюторства, Гордон Э., Гордон Э., Сироткин С.Ф., Гребенкин Д.Ю., 2008