Нехудожественная литература/Информационные технологии/Машинное обучение. Анализ данных

Глубокое обучение с подкреплением. AlphaGo и другие технологии: Максим Лапань

DEEP REINFORCEMENT LEARNING HANDS-ON

16+

4.2(3 оценки)

3 рецензии

Полная аннотация

Автор

Лапань Максим

Издательство

Питер, 2020

Серия

Для профессионалов

Жанр

Программирование

Все характеристики

Аннотация

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.
Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.
В этой книге
- Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.
- Изучите основу RL: марковские процессы принятия решений.
- Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.
- Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.
- Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.
- Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.
- Реализуете метод AlphaGo Zero для игры в Connect4.
- Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Свернуть

Характеристики

Автор

Лапань Максим

Редактор

Гринчик Н.

Переводчик

Белов С., Синица К.

Издательство

Питер, 2020

Серия

Для профессионалов

Жанр

Программирование

ID товара

751510

ISBN

978-5-4461-1079-7

Страниц

496 (Офсет)

Вес

640 г

Размеры

232x165x22 мм

Тип обложки

обл - мягкий переплет (крепление скрепкой или клеем)

Иллюстрации

Черно-белые

Все характеристики

Нет в продаже

Рецензии на книгу

Читали книгу? Как она вам?

Мы всегда рады честным, конструктивным рецензиям.

Написать рецензию

Покупатели 3

Товар куплен

Андрей Лабинцев

8 февраля 2024 в 18:32

Рецензий 1

•

Оценок 0

•

Рейтинг 0

Замечательная книга, автор провел большую работу по систематизации научных статей и реализации кода.

Понравилась рецензия?

Да

Товар куплен

Эдуард Рейдер

30 сентября 2020 в 11:13

Рецензий 1

•

Оценок +2

•

Рейтинг +2

Познакомился с кодом к главе 8. Заметное число критических ошибок. Код с листа не проходит, нужны исправления. Подключение некоторых, необходимых для выполнения кода пакетов опущено. Приходится восстанавливать по факту ошибок и с поиском в сети. Запуск кода из командной строки приведен только для одного скрипта. Все о...

Понравилась рецензия?

Да

Товар куплен

Диана Еськина

21 сентября 2020 в 11:33

Рецензий 102

•

Оценок +206

•

Рейтинг +6

Книга "Глубокое обучение с подкреплением. AlphaGo и другие технологии" из серии "Для профессионалов" позволяет окинуть взглядом современную область машинного обучения, связанную с технологией глубокого обучения без учителя. Вместе с автором Вы изучите ландшафт этой области человеческого знания, ост...

Понравилась рецензия?

Да