Добавлена: 17.10.2023 Версия: 1.018. PDF Версия: 1.6 ISBN: 978-5-9775-6885-2 ББК: 32.973.26-018.1 УДК: 004.43 Издательство: БХВ-Петербург Город: Санкт-Петербург (ссылка для форума) (ссылка для блога) (QR-код книги) Аннотация Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок— без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга — первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отраслевом ключе. |
Последние комментарии
1 день 1 час назад
1 день 6 часов назад
1 день 8 часов назад
1 день 10 часов назад
1 день 15 часов назад
1 день 16 часов назад