Ришал Харбанс - Грокаем алгоритмы искусcтвенного интеллекта

	Название:	Грокаем алгоритмы искусcтвенного интеллекта
	Автор:	Ришал Харбанс
	Жанр:	Алгоритмы и структуры данных, Искусственный интеллект
	Изадано в серии:	неизвестно
	Издательство:	Питер
	Год издания:	2023
	ISBN:	978-5-4461-2924-9
	Отзывы:	Комментировать
	Рейтинг:
Поделись книгой с друзьями! Помощь сайту: донат на оплату сервера

Краткое содержание книги "Грокаем алгоритмы искусcтвенного интеллекта"

Искусственный интеллект — часть нашей повседневной жизни. Мы встречаемся с его проявлениями, когда занимаемся шопингом в интернет-магазинах, получаем рекомендации «вам может понравиться этот фильм», узнаем медицинские диагнозы… Чтобы уверенно ориентироваться в новом мире, необходимо понимать алгоритмы, лежащие в основе ИИ. «Грокаем алгоритмы искусственного интеллекта» объясняет фундаментальные концепции ИИ с помощью иллюстраций и примеров из жизни. Все, что вам понадобится, — это знание алгебры на уровне старших классов школы, и вы с легкостью будете решать задачи, позволяющие обнаружить банковских мошенников, создавать шедевры живописи и управлять движением беспилотных автомобилей.

Читаем онлайн "Грокаем алгоритмы искусcтвенного интеллекта". [Страница - 116]

совершаемое действие, мы стремимся избежать плохих вариантов независимо от того,
ведут они к достижению цели или нет. Этот показатель можно вычислить,
разделив суммарную награду на общее количество действий.

Обучение с моделью и без
Для понимания обучения с подкреплением вам следует знать два его подхода:
с использованием модели и без использования модели. Речь идет не о тех моделях
машинного обучения, о которых говорилось ранее в книге. В данном случае
модель можно рассматривать как абстрактное представление агентом среды,
в которой он оперирует.
К примеру, мы можем иметь представление о модели окружающей местности, включающей расположение основных объектов, понимание направлений
и общую схему дорог. Эта модель сформировалась после изучения определенных маршрутов, но мы можем симулировать в своем сознании разные сценарии
и не обязательно пробовать каждый возможный вариант. На основе этой модели
можно, например, определить, как лучше добраться до работы. Такой подход
считается основанным на модели. Обучение же без модели аналогично подходу
Q-обучения. В нем изучение множества вариантов взаимодействия со средой
происходит методом проб и ошибок, что позволяет определить оптимальные
действия в различных сценариях.

360 Грокаем алгоритмы искусственного интеллекта
Рисунок 10.19 иллюстрирует эти два подхода на примере навигации по
дорогам. Для реализации обучения с подкреплением на основе модели можно
использовать разные алгоритмы.
На основе модели

Без модели

Быстрое решение, принятое на
основе возможной выгоды

Представление о среде,
когда решения симулируются, а не принимаются
опытным путем

Рис. 10.19. Примеры обучения с подкреплением
на основе модели и без нее

Глубокое обучение в обучении с подкреплением
Q-обучение — это один из подходов в обучении с подкреплением. Понимая,
как оно работает, можно применять похожую логику и к другим алгоритмам
обучения с подкреплением. В зависимости от решаемой задачи можно выбирать подходящую технику. Довольно популярно глубокое обучение, эффективно
применяемое в роботостроении, компьютерных играх, а также для обработки
изображений и видео.
В глубоком обучении с подкреплением для обработки состояний среды и совершения действий могут применяться искусственные нейронные сети (ANN).
Действия изучаются путем корректировки весов в ANN на основе получаемой
награды и изменений в среде. В обучении с подкреплением для решения различных прикладных задач также могут использоваться возможности сверточных
нейронных сетей (CNN) и других специфичных архитектур ANN.
На рис. 10.20 отражено высокоуровневое представление того, как можно
использовать ANN для решения задачи с парковкой. Входами в нейронную
сеть служат состояния. Выходами — вероятности выбора лучшего действия для
агента. Награда же и оказываемый на среду эффект могут с помощью обратного
распространения возвращаться в сеть для подстройки весов.

Глава 10. Обучение с подкреплением с помощью Q-Learning 361

Действие

Состояние

Награда

Рис. 10.20. Пример использования ANN для задачи с парковкой
В следующем разделе рассматриваются некоторые варианты реального применения обучения с подкреплением.

Применение обучения с подкреплением
Обучение с подкреплением применяется во многих ситуациях, когда данные
для обучения отсутствуют либо их недостаточно. Обучение происходит через
взаимодействие со средой, в которой присутствует эвристика для оценки высокой эффективности. Эту технику можно применять практически во всех сферах.
Разберем некоторые из них.

Роботостроение
Роботостроение подразумевает создание машин, которые взаимодействуют с реальными средами, выполняя поставленные задачи. Некоторые роботы используются для сложной навигации по пересеченной местности с разнообразными
типами покрытия дорог, препятствиями и уклонами. Другие применяются в качестве лабораторных помощников, получая от ученых инструкции, передавая
нужные инструменты или управляя оборудованием. Когда смоделировать каждый возможный результат каждого действия в огромной динамической среде
невозможно, на выручку приходит обучение с подкреплением. Устанавливая
в среде основную задачу и вводя награды и штрафы в качестве эвристик, можно

362 Грокаем алгоритмы искусственного --">

Оставить комментарий:

Книги схожие с «Грокаем алгоритмы искусcтвенного интеллекта» по жанру, серии, автору или названию:

Алгоритмы + структуры данных = программы. Никлаус Вирт

Никлаус Вирт - Алгоритмы + структуры данных = программы

Жанр: Литература ХX века (эпоха Социальных революций)

Год издания: 1985

Серия: Математическое обеспечение ЭВМ

Алгоритмы и машинное решение задач. 2-е изд.. Борис Авраамович Трахтенброт

Борис Авраамович Трахтенброт - Алгоритмы и машинное решение задач. 2-е изд.

Жанр: Учебники и пособия: прочее

Год издания: 1960

Структуры и алгоритмы обработки многомерных данных: монография. Василий Константинович Гулаков

Василий Константинович Гулаков, Андрей Олегович Трубаков, Евгений Олегович Трубаков - Структуры и алгоритмы обработки многомерных данных: монография

Жанр: Алгоритмы и структуры данных

Год издания: 2021

Классика программирования: алгоритмы, языки, автоматы, компиляторы. Практический подход. Максим В. Мозговой

Максим В. Мозговой - Классика программирования: алгоритмы, языки, автоматы, компиляторы. Практический подход

Жанр: Алгоритмы и структуры данных

Год издания: 2006

Фантастика и фэнтези	Детективы и триллеры	Любовные романы	Информация о сайте
Научная	Боевик	Современные	Для правообладателей
Фэнтези	Исторические	Фантастические	Правила & Политика конф.
Боевая	Криминальные	Короткие	Обмен ссылками
Ужасы и мистика	Полицейские	Детективные	Все жанры библиотеки
Космическая	Триллеры	О любви	Отзывы о книгах
Альтернативная история	Шпионские	Исторические	Книги с оценками
Попаданцы	Детские	Эротические 18+
Социальная фантастика	Иронические
Юмористическая	Крутые
Постапокалипсис	Политические
Детективная	Маньяки

Почта сайта:	2019 - 2024 © "КнигаГо" - электронная библиотека. Книги читать онлайн без регистрации полностью или ознакомительные фрагменты с возможностью покупки книги.
Большинство книг на сайте опубликовано легально на правах партнёрской программы ЛитРес. Если Ваша книга была опубликована с нарушениями авторских прав, пожалуйста, направьте Вашу жалобу на или заполните форму обратной связи.
Интересная статья: Как сделать свой офис желанным для посещения, поднять работоспособность сотрудников