Обучение с подкреплением, Саттон Р.С., Барто Э.Г., 2014

Обучение с подкреплением, Саттон Р.С., Барто Э.Г., 2014.

Обучение с подкреплением является одной из наиболее активно развивающихся областей, связанных с созданием искусственных интеллектуальных систем. Оно основано на том, что агент пытается максимизировать получаемый выигрыш, действуя в сложной среде с высоким уровнем неопределенности. Дается исчерпывающее и ясное изложение идей, методов и алгоритмов обучения с подкреплением, при этом диапазон излагаемого материала — от истоков возникновения рассматриваемых концепций до современных результатов в данной области. Для специалистов в области искусственного интеллекта, нейросетевого моделирования и управления, а также студентов и аспирантов соответствующих специальностей.

Обучение с подкреплением, Саттон Р.С., Барто Э.Г., 2014



Предисловие.

К тому, что сейчас принято называть обучением с подкреплением, мы впервые пришли в 1979 г. Мы оба работали тогда в Массачусетсом университете над одним из наиболее ранних проектов, связанных с возвратом к сетям нейроноподобных адаптивных элементов как многообещающему подходу к решению задачи адаптивного искусственного интеллекта. В этом проекте изучалась «гетеростатическая теория адаптивных систем», созданная А.Харри Клопфом. Работа Харри была богатым источником идей, и перед нами стояла задача критически изучить их, а также сопоставить с тем, что было наработано за долгую предшествующую историю исследований в области адаптивных систем. Нам надо было выявить составные элементы этих идей, понять соотношение между ними и их относительную важность. Эта работа продолжается и сейчас, но в 1979 г. мы поняли, что, несмотря на свою простоту, одна из идей, на которых основывается рассматриваемый подход, привлекала удивительно мало внимания с точки зрения вычислительной перспективы. Это была просто-напросто идея обучающейся системы, которая хочет чего-то, которая подстраивает свое поведение, чтобы максимизировать значение некоторого особого сигнала из окружающей среды. Это была идея «гедонистической» обучающейся системы, или, как сказали бы мы сейчас, идея обучения с подкреплением.

Оглавление.

Предисловие редактора серии «Adaptive computation and machine learning».
Предисловие.
Часть I. Постановка задачи и подходы к ее решению.
Часть II. Фундаментальные методы решения.
Часть III. Единый подход.
Список обозначений.
Список литературы.
Предметный указатель.



Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Обучение с подкреплением, Саттон Р.С., Барто Э.Г., 2014 - fileskachat.com, быстрое и бесплатное скачивание.

Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.Купить эту книгу



Скачать - pdf - Яндекс.Диск.
Дата публикации:





Хештеги: :: :: ::


Следующие учебники и книги:
Предыдущие статьи: