q-обучение

  1. NewsMaker

    Новости От азартных игр к ИИ: алгоритм "Бандита" на стыке с фотонной революцией

    Токийские ученые показали, как свет может изменить правила игры. Как азартный игрок максимизирует выигрыши от ряда игровых автоматов? Этот вопрос лег в основу "проблемы многорукого бандита", распространенной задачи в обучении с подкреплением, где "агенты" принимают решения для получения...