А ДАПТИВНАЯ ОПТИМИЗАЦИЯ СЕРВЕРА, ОБРАБАТЫВАЮЩЕГО ОЧЕРЕДЬ ЗАДАНИЙ Дипломная работа студента 545 группы Ле Чунг Хьеу Научный руководитель : О. Н. Граничин.

Презентация:



Advertisements
Похожие презентации
Приращение функции. Физический смысл производной. Вычисление производной по определению Производная и ее приложения.
Advertisements

Генерация вероятностных автоматов методами Reinforcement Learning Выполнил: Иринёв А. В. Руководитель: Шалыто А. А.
Выполнил ученик 9-го класса Белоусов Георгий Научный руководитель А.В. Горец Санкт-Петербург 2012.
Лекция 7: Метод потенциальных функций Предположим, что требуется разделить два непересекающихся образа V1 и V2. Это значит, что в пространстве изображений.
Сервис описания дискретных динамических систем на основе рекуррентных алгоритмов стохастической аппроксимации и подобных им Александр Вахитов научный руководитель.
Класс NP и NP-полные задачи. NP-полнота задачи выполнимости Задача выполнимости булевой функции: Вход: булева функция, заданная формулой Требуется определить,
«А НАЛИЗ ЗАДАЧИ ЛИНЕЙНОЙ РЕГРЕССИИ НАХОЖДЕНИЯ ОПТИМАЛЬНОГО РЕШЕНИЯ » РОССИЙСКИЙ УНИВЕРСИТЕТ ДРУЖБЫ НАРОДОВ КАФЕДРА НЕЛИНЕЙНОГО АНАЛИЗА И ОПТИМИЗАЦИИ ДИПЛОМНАЯ.
С ИСТЕМЫ МАССОВОГО ОБСЛУЖИВАНИЯ понятие и структура СМО классификация СМО основные характеристики работы СМО имитационное моделирование в исследовании.
1 Исследование алгоритмов решения задачи k коммивояжеров Научный руководитель, проф., д.т.н. Исполнитель, аспирант Ю.Л. Костюк М.С. Пожидаев Томский государственный.
Количественные характеристики случайных переменных Математическое ожидание (среднее значение) Математическое ожидание (среднее значение) Дисперсия и среднее.
Лекция 7 Уравнение множественной регрессии Теорема Гаусса-Маркова Автор: Костюнин Владимир Ильич, доцент кафедры: «Математическое моделирование экономических.
Вычислите: Решите уравнение: 1. Решите уравнение:
Задачи поддержки принятия решений (ЗПР) Задачи принятия решений – НПС 1. Детерминированные ЗПР2. ЗПР при неконтролируемых параметрах 2.1. Совпадающая информированность.
Матрица Гильберта при размерности n много большей 1 метод Гаусса не эффективен.
Построение графиков показательной функции 25 Января 2007.
Математические методы и модели организации операций Задачи линейного программирования.
Симплекс-метод Лекции 6, 7. Симплекс-метод с естественным базисом Симплекс –метод основан на переходе от одного опорного плана к другому, при котором.
Александров А.Г ИТО Методы теории планирования экспериментов 2. Стратегическое планирование машинных экспериментов с моделями систем 3. Тактическое.
РАЗРАБОТКА И РЕАЛИЗАЦИЯ МОДУЛЯ ПРОГНОЗИРОВАНИЯ ВОЛАТИЛЬНОСТИ С ИСПОЛЬЗОВАНИЕМ РАНДОМИЗИРОВАННЫХ АЛГОРИТМОВ Федяшов Виктор Алексеевич,545 группа Научный.
Санкт-Петербургский государственный университет информационных технологий, механики и оптики Санкт-Петербург 2009 Санкт-Петербургский государственный университет.
Транксрипт:

А ДАПТИВНАЯ ОПТИМИЗАЦИЯ СЕРВЕРА, ОБРАБАТЫВАЮЩЕГО ОЧЕРЕДЬ ЗАДАНИЙ Дипломная работа студента 545 группы Ле Чунг Хьеу Научный руководитель : О. Н. Граничин Рецедент : А. С. Лопатин Санкт – Петербург 2007

В ВЕДЕНИЕ Проблема эффективного обслуживания сервером очереди заданий. Рандомизированный алгоритм стохастической аппроксимации. Обучение с подкреплением.

П ОСТАНОВКА ЗАДАЧИ Рассмотрим задачу повышения эффктивности сервера: L(x) – среднее время ожидания клиентами. q(x) – стоимость исползования параметра x. y(x) – время, которое задание ожидало в сервере до момента своего завершения. Требуется найти параметра θ : f(x) min по x ( Θ )

П ОСТАНОВКА ЗАДАЧИ Эту задачу оптимизации не решить традиционными средствами. F(x,ω) – эмпирическая функция. f(x) = E{F(x,ω)}. F t (x,ω) – случайная функция дескретного времени t = 1, 2,... f t (x) = E ω {F t (x,ω)}. θ t = argmin x f t (x). Требуется по наблюдениям F t (x,ω) {θ n } |θ n - θ t | min.

О БУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ o Обучение с подкреплением, представляет класс задач, в которых агент, действуя в определенной среде, должен найти оптимальную стратегию взаимодействия с ней. Цель агента – максимизировать суммарную награду.

О БУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ Оценочная Функция : RL алгоритмы основано на оценке оценочной функцией. Оценка Стратегии. Усовершенствование Стратегии. Повторение Стратегии.

Р АНДОМИЗИРОВАННЫЕ АЛГОРИТМЫ СТОХАСТИЧЕСКОЙ АППРОКСИМАЦИИ Пусть - дифференцируемая по второму аргументу. Наблюдении. Требуется по наблюдениям : y 1, y 2,... построить последовательность оценок {θ n } вектора θ :

SPSA ДЛЯ РЕШЕНИЯ ЗАДАЧИ О СЕРВЕРЕ 1. Положим k = 0 и выберем некоторое начальное значение оценки θ В начале каждого k-го такта вычисляем 3. Запускаем сервер с значением параметра x = θ k. 4. После завершения k-го такта подсчитаем новую оценку по правилу 5. Увеличиваем номер такта k = k Переход к п.2 (повтор действий заново).

М ОДЕЛИРОВАНИЕ Интерфейс программы :

Р ЕЗУЛЬТАТЫ Результаты программы с фиксированным значением

Р ЕЗУЛЬТАТЫ Минимум функции = 51 достигается при значении θ = 0.84.

Р ЕЗУЛЬТАТЫ ПРОГРАММЫ С АЛГОРИТМОМ SPSA θ = θ = 1.

Р ЕЗУЛЬТАТЫ ПРОГРАММЫ С АЛГОРИТМОМ М ОНТЕ К АРЛО

З АКЛЮЧЕНИЕ Работа с алгоритмом SPSA. Работа с методом Монте Карло.