Фил Уиндер - Обучение с подкреплением для реальных задач

	Название:	Обучение с подкреплением для реальных задач
	Автор:	Фил Уиндер
	Жанр:	Искусственный интеллект
	Изадано в серии:	Бестселлеры o’reilly
	Издательство:	БХВ-Петербург
	Год издания:	2023
	ISBN:	978-5-9775-6885-2
	Отзывы:	Комментировать
	Рейтинг:
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера

Краткое содержание книги "Обучение с подкреплением для реальных задач"

Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок— без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга — первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отраслевом ключе.
Для аналитиков данных и специалистов по искусственному интеллекту

Читаем онлайн "Обучение с подкреплением для реальных задач". Главная страница.

Reinforcement Learning
Industrial Applications of Intelligent Agents

Phil Winder, Ph.D.

Beijing • Boston • Farnham • Sebastopol • Tokyo

O’REILLY

Фил Уиндер

Обучение
с подкреплением
для реальных задач
Инженерный подход

Санкт-Петербург

«БХВ-Петербург»
2023

УДК 004.43
ББК 32.973.26-018.1
У37

У37

Уиндер Ф.
Обучение с подкреплением для реальных задач: Пер. с англ. — СПб.:
БХВ-Петербург, 2023. — 400 с.: ил.

ISBN 978-5-9775-6885-2
Книга посвящена промышленно-ориентированному применению обучения
с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промыш
ленные и научные системы решению любых пошаговых задач методом проб и
ошибок— без подготовки узкоспециализированных учебных множеств данных
и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские
процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисле
ние, методы устранения энтропии и многое другое. Данная книга — первая на рус
ском языке, где теоретический базис RL и алгоритмы даны в прикладном, отрасле
вом ключе.
Для аналитиков данных
и специалистов по искусственному интеллекту
УДК 004.43
ББК 32.973.26-018.1
Группа подготовки издания:
Руководитель проекта
Зав редакцией
Перевод с английского
Редактор
Компьютерная верстка
Оформление обложки

Олег Сивченко
Людмила Гаулъ
Екатерины Черских
Анна Кузьмина
Ольги Сергиенко
Зои Канторович

© 2022 BHV
Authorized Russian translation of the English edition of Reinforcement Learning ISBN 9781098114831
© 2021 Winder Research and Development Ltd
This translation is published and sold by permission of O’Reilly Media, Inc , which owns or controls all rights to publish
and sell the same

Авторизованный перевод с английского языка на русский издания Reinforcement Learning ISBN 9781098114831
© 2021 Winder Research and Development Ltd
Перевод опубликован и продается с разрешения компании-правообладателя O’Reilly Media, Inc

Подписано в печать 29.07 22
Формат 70x1001Лб Печать офсетная. Усл печ л 32,25
Тираж 1300 экз Заказ № 5077
"БХВ-Петербург", 191036, Санкт-Петербург, Гончарная ул , 20

Отпечатано с готового оригинал-макета
ООО "Принт-М", 142300, М О , г Чехов, ул Полиграфистов, д 1

ISBN 978-1-098-11483-1 (англ.)
ISBN 978-5-9775-6885-2 (рус.)

© Winder Research and Development Ltd , 2021
© Перевод на русский язык, оформление
ООО "БХВ-Петербург", ООО "БХВ", 2023

Оглавление

Отзывы.................................................................................................................................................. 15
Об авторе.............................................................................................................................................. 19

Предисловие....................................................................................................................................... 21
Цель.......................................................................................................................................................... 21
Кому следует прочитать эту книгу?................................................................................................... 22
Руководящие принципы и стиль.........................................................................................................22
Предварительная подготовка............................................................................................................... 24
Объем и план...........................................................................................................................................24
Дополнительные материалы................................................................................................................ 25
Условные обозначения, используемые в этой книге...................................................................... 26
Аббревиатуры................................................................................................................................... 26
Математические обозначения........................................................................................................27
Глава 1. Для чего нужно обучение с подкреплением?.................................................... 29
Почему сейчас?.......................................................................................................................................30
Машинное обучение.............................................................................................................................. 31
Обучение с подкреплением................................................................................................................. 32
Когда следует использовать обучение с подкреплением?...................................................... 33
Варианты применения обучения с подкреплением.................................................................. 35
Таксономия подходов обучения с подкреплением..........................................................................37
Без модели или на основе модели................................................................................................ 37
Как агенты используют и обновляют свою стратегию............................................................. 38
Дискретные или непрерывные действия.................................................................................... 39
Методы оптимизации..................................................................................................................... 39
Оценка и улучшение политики..................................................................................................... 40
Фундаментальные --">

Оставить комментарий:

Книги схожие с «Обучение с подкреплением для реальных задач» по жанру, серии, автору или названию:

Фреймы для представления знаний. Марвин Минский

Марвин Минский - Фреймы для представления знаний

Жанр: Современные российские издания

Исследование бессознательного для построения систем искусственного интеллекта. Д. Н. Бойко

Д. Н. Бойко - Исследование бессознательного для построения систем искусственного интеллекта

Жанр: Искусственный интеллект

Год издания: 2002

Оптимизация программ на С++. Проверенные методы для повышения производительности. Курт Гантерот

Курт Гантерот - Оптимизация программ на С++. Проверенные методы для повышения производительности

Жанр: C, C++, C#

Год издания: 2017

Серия: Бестселлеры o’reilly

Unity для разработчика. Мобильные мультиплатформенные игры. Джон Мэннинг

Джон Мэннинг, Пэрис Батфилд-Эддисон - Unity для разработчика. Мобильные мультиплатформенные игры

Жанр: Программирование: прочее

Год издания: 2018

Серия: Бестселлеры o’reilly

Другие книги из серии «Бестселлеры o’reilly»:

Делай как в Google. Разработка программного обеспечения. Титус Винтерс

Титус Винтерс, Том Маншрек, Хайрам Райт - Делай как в Google. Разработка программного обеспечения

Жанр: Программирование: прочее

Год издания: 2021

Серия: Бестселлеры o’reilly

Джон Яблонски - Законы UX-дизайна

Жанр: Программирование: прочее

Год издания: 2022

Серия: Бестселлеры o’reilly

SQL и реляционная теория. Как грамотно писать код на SQL. К. Дж. Дейт

К. Дж. Дейт - SQL и реляционная теория. Как грамотно писать код на SQL

Жанр: Базы данных

Год издания: 2010

Серия: Бестселлеры o’reilly

Кайл Симпсон - ES6 и не только

Жанр: Java, Java Script

Год издания: 2017

Серия: Бестселлеры o’reilly

Фантастика и фэнтези	Детективы и триллеры	Любовные романы	Информация о сайте
Научная	Боевик	Современные	Для правообладателей
Фэнтези	Исторические	Фантастические	Правила & Политика конф.
Боевая	Криминальные	Короткие	Обмен ссылками
Ужасы и мистика	Полицейские	Детективные	Все жанры библиотеки
Космическая	Триллеры	О любви	Отзывы о книгах
Альтернативная история	Шпионские	Исторические	Книги с оценками
Попаданцы	Детские	Эротические 18+
Социальная фантастика	Иронические
Юмористическая	Крутые
Постапокалипсис	Политические
Детективная	Маньяки

Почта сайта:	2019 - 2024 © "КнигаГо" - электронная библиотека. Книги читать онлайн без регистрации полностью или ознакомительные фрагменты с возможностью покупки книги.
Большинство книг на сайте опубликовано легально на правах партнёрской программы ЛитРес. Если Ваша книга была опубликована с нарушениями авторских прав, пожалуйста, направьте Вашу жалобу на или заполните форму обратной связи.
Интересная статья: Кофе в зернах: райское наслаждение на земле