ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ
Войти
Логин:
Пароль:
Забыли пароль?
научная деятельность
структура институтаобразовательные проектыпериодические изданиясотрудники институтапресс-центрконтакты
русский | english

Семинар PreMoLab МФТИ

29 октября (среда), 1700, ауд.615, ИППИ РАН 

Александр Колногоров

Управление в случайной среде: задача о двуруком бандите 

Рассматривается управление обработкой больших объемов данных, если для обработки имеются два альтернативных метода с различными априори неизвестными эффективностями. Требуется определить более эффективный метод и обеспечить его преимущественное применение. С использованием параллельной обработки это может быть выполнено за сравнительно небольшое число этапов, причем практически без потери качества управления, т.е. без увеличения минимаксного риска. 
Решение задачи ищется с помощью основной теоремы теории игр, согласно которой минимаксные стратегия и риск могут быть найдены как байесовские, соответствующие наихудшему априорному распределению. Для вычисления байесовских стратегии и риска относительно наихудшего априорного распределения получено инвариантное интегро-разностное уравнение. Если горизонт управления неограниченно растет, интегро-разностное уравнение превращается в дифференциальное уравнение в частных производных второго порядка. Численные эксперименты показывают близость решений инвариантного интегро-разностного и дифференциального уравнений. 

страница семинара

27.10.2014 |
 

 

© Федеральное государственное бюджетное учреждение науки
Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, 2024
Об институте  |  Контакты  |  Противодействие коррупции