Имитационное моделирование в исследовании и разработке информационных систем Лекция 5 Примеры систем моделирования (продолжение) Статистическая обработка результатов эксперимента
Откуда случайность? Натурные эксперименты и измерения – влияние внешних факторов Имитационные модели: случайность потоков запросов случайность действий (время, результат) На выходе: последовательность результатов отдельных экспериментов; случайный процесс 2
Оценка случайной величины 3 оценка мат. ожидания Оценка дисперсии Оценка дисперсии оценки мат. ожидания
Сколько нужно экспериментов для оценки м.о.? 4 Ц.П.Т.: Нормированная оценка м.о. для n выборок сходится к Доверительный интервал длиной 2ε, в который μ укладывается с вероятностью γ задано γ, ε, найти n
Оценка числа выборок (2) Для нормированного распределения находим u(\gamma) по таблице Далее, \eps = u(\gamma)*sqrt(\sigma/n) Определяем n исходя из требований к eps См. подробнее [1], с
Если число выборок невелико Если Xi – нормально распределённые, то вместо таблицы нормального распределения используем таблицу t- распределения с n-1 степенями свободы [3, с. 306] 6
Проверка статистических гипотез По материалам диссертации П.Е. Шестова «Совместное планирование вычислений и обменов в информационно-управляющих системах реального времени», пункт «Методика статистической обработки результатов экспериментов» По учебнику [1] 7
Результаты эксперимента 100 прогонов, замеряем x 1 … раз Как это обработать? Какой вывод сделать из полученных данных?
Возможные выводы В среднем x=1.99 –ни в одном прогоне x не равнялся 1.99 –почти 100% отклонение от 1 В 99% случаях x=1 –а если при дальнейших прогонах всегда x=100? Как сделать обобщённые выводы?
Статистическая гипотеза – случайная величина Замеры – выборка случайной величины Гипотеза: С вероятностью p 0 значение принадлежит отрезку (xmin и xmax уточняются по выборке)
Гипотеза и альтернативная гипотеза – вероятность, что x принадлежит отрезку
Уровень значимости – уровень значимости или вероятность ошибки первого рода, т.е вероятность, что гипотеза H 0, будучи верной, будет отвергнута в пользу H 1 Обычно =0.05 Ошибка второго рода: принята H1, а на самом деле верна H0
Если по-простому Статистически обосновывается, что с уровнем значимости 0.05 верна гипотеза, что с вероятностью не меньше 0.9 значение лежит на заданном отрезке
Статистический Критерий Зависит от выборки X Определяет «степень соответствия» выборки гипотезе Функция с известным распределением 14
Критическая область 15 φ – критерий, ω – критическая область Минимизация ошибки второго рода
Примеры типовых стат. гипотез (по [1] значение МО нормального распределения при неизвестной дисперсии; равенство МО двух норм. распред. вид закона распределения случайной величины; 16
Статистический критерий m – число экспериментов, в которых – «эмпирическая вероятность»
Критическая область Если критерий m принадлежит критической области, то H 0 отвергается p = p0
Критическая область и границы отрезка Гипотеза H 0 принимается, если не менее значений Теперь известно, какими свойствами должны обладать границы отрезка
Подбор границ отрезка Упорядочить элементы выборки x по возрастанию: Выбрать любые Обычно
Примеры nm кр
Ошибка второго рода – вероятность ошибки второго рода, т.е. принять гипотезу H 0 тогда как верна
Пример n=100n=1000
Литература Калинина В.Н., Панкин В.Ф. Математическая статистика. М.: Дрофа, 2002 год. 340 с. Гмурман В. Е. Теория вероятностей и математическая статистика. М.: Высшая школа, с. Аверилл М.Лоу, В. Дэвид Кельтон. Имитационное моделирование. 3-е издание. // СПб:Питер, – 847 с.
25 Спасибо за внимание!
Применение стат. методов в иметь. моделировании Проверка датчиков случайных чисел 26