Обучение с подкреплением для реальных задач 269791

Паперова книга
269791
Обучение с подкреплением для реальных задач - фото 1
  • ISBN
    2000988816653
  • Видавництво
  • Автор
  • Рік
    2023
  • Мова
    Російська
  • Ілюстрації
    Чорно-білі
780
1 людина
Купити

Все про “Обучение с подкреплением для реальных задач”

Від видавця

Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок – без  подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная  книга – первая на русском языке, где теоретический базис RL и  алгоритмы даны  в  прикладном, отраслевом ключе.
Из предисловия
Обучение с подкреплением (reinforcement learning, RL) — это парадигма машинного обучения (machine learning, ML), которая способна оптимизировать последовательные решения. RL интересно тем, что имитирует то, как мы, люди, учимся. Мы инстинктивно способны изучать стратегии, которые помогают нам справляться со сложными задачами, такими как езда на велосипеде или сдача экзамена по математике. RL пытается скопировать этот процесс, взаимодействуя с окружающей средой для изучения стратегий.
В последнее время компании применяют алгоритмы машинного обучения для принятия единоразовых решений. Они обучаются на данных, чтобы принять лучшее на текущий момент решение. Однако часто правильное в настоящий момент решение может оказаться не лучшим решением в долгосрочной перспективе. Да, полная ванна мороженого осчастливит вас в краткосрочной перспективе, но на следующей неделе вам придется пропадать в тренажерном зале. Точно так же кликбейтные рекомендации могут давать самую высокую кликабельность, но в долгосрочной перспективе такие статьи воспринимаются как мошенничество и наносят ущерб долгосрочному вовлечению или удержанию читателя.
RL интересно тем, что позволяет изучить долгосрочные стратегии и применить их к сложным промышленным задачам. Как компании, так и специалисты-практики могут преследовать цели, которые напрямую связаны с бизнесом, такие как извлечение прибыли, наращивание количества пользователей и их удержание, а не технические показатели оценки, такие как точность или F-мера. Проще говоря, решение многих проблем зависит от последовательного принятия решений. ML не предназначено для решения этих проблем, RL — предназначено.
Кому следует прочитать эту книгу?
Цель этой книги — продвигать использование RL в производственных системах.
Если вы (сейчас или в будущем) создаете продукты в области RL, будь то исследования, разработки или прикладные вещи, то эта книга для вас. Это также означает, что я написал книгу, скорее, для практиков, чем для людей из академических кругов.
Для аналитиков данных и специалистов по искусственному интеллекту
Об авторе
Фил Уиндер — междисциплинарный инженер, эксперт и автор онлайн-курсов на платформе O’Reilly. Возглавляет компанию Winder Research, оказывающую консультации в области науки о данных (data science) для облачно-ориентированных приложений. Компания помогает оптимизировать процессы, связанные с обработкой данных, а также обслуживает платформы и продукты, работающие в этой нише. Автор имеет степени PhD и MEng в электротехнике, полученные в Университете Халла.

Рецензії

0

Всі характеристики

  • Видавництво
  • Автор
  • Категорія
  • Рік
    2023
  • Сторінок
    400
  • Формат
    165х235 мм
  • Обкладинка
    М'яка
  • Тип паперу
    Офсетний
  • Мова
    Російська
  • Ілюстрації
    Чорно-білі

Товар входить до категорії

  • Самовивіз з відділень поштових операторів від 45 ₴ - 80 ₴
  • Безкоштовна доставка від 3000 грн
Схожі товари
Искусственный интеллект
99672
Роман Душкин
700 ₴
Машинное обучение с участием человека
202326
Роберт (Манро) Монарх
703 ₴740 ₴
Изучаем Ray
255159
Макс ПумперлаЭдвард ОуксРичард Ляо
750 ₴
PyTorch. Освещая глубокое обучение
257135
Эли СтивенсЛука АнтигаТомас Виман
728 ₴750 ₴
Искусственный интеллект и компьютерное зрение. Реальные проекты на Python, Keras и TensorFlow
255160
Анирад КоулСиддха ГанджуМехер Казам
735 ₴790 ₴
Разработка приложений на базе GPT-4 и ChatGPT
275721
Оливье КеленМари-Алис Блете
790 ₴
Машинное обучение и безопасность
99747
Кларенс ЧиоДэвид Фримэн
820 ₴
Машинное обучение в Elastic Stack
183971
Кольер Р.Монтонен К.Б. Азарами
850 ₴
Машинное обучение. Паттерны проектирования
186879
Валиаппа ЛакшмананМайкл МуннСара Робинсон
850 ₴