Cистема анализа данных по иерархической системе критериев Стыскин Андрей Игоревич, К руководитель: Елтаренко Евгений Алексеевич, к.т.н. Кафедра 28
Иерархическая система критериев
Единичные критерии - реальные измерения в своих единицах измерения, переведенные на шкалу [0; 1] Комплексные критерии Аддитивные Квази-коньюктивные/дизьюктивные
Постановка задачи Мы имеем Xi = {xij} входы и соответсвующие им выходы Y={yj} Иерархическую систеу критериев y^ = f(x1..n, p1..n), где p1..m - параметры модели - веса и коэффициенты жесткости операторов агрегирования Поставим задачу идентификации: Подобрать такие параметры p1..m, чтобы минимизировать оценку МНК: g = sqrt( sum i (y^i - yi)^2/n)
Алгоритм определения параметров Основан на идее метода Хука-Дживса Борьба с неунимодальностю: Запуск из нескольких начальных точек Генерация точек методом кроссенговера
Обход вершин дерева с отимизацией
Метод Хука-Дживса
Генерация новых исходных точек
Исследование Подготовка данных: выбросы (мы ожидаем не протеворечивый по Паретто набор объектов) Анализ устойчивости к неполноте модели Адекватность: зависимость прогноза от реальных данных
Задача определения цены машины на рынке автообъявлений Данные по объявлениям с Взяты машины в идеальном состоянии Выкинуты неадекватые предложения: дешевые, старые с маленьким пробегом В модели использовались только объективные факторы
Модель определения цены n Страна производитель (0.05) (были опыты с марками, но там не удается сделать полнофакторный эксперимент) n Технические характеристики (0.65) n Тип кузова n Тип бензина n Привод n Коробка передачь n Руль n Объем двигателя n Износ: пробег и год выпуска (0.3)
Результат
Сравнение оценки с неиросетью и регрессией
Выходы модели Веса для интерпретации влияния факторов Прогрнозиврование Заполнение пропусков в таблицах Значения зависимых переменных - полезны в классификации или кластеризации
Сравнения с другими алгоритмами DM
Спасибо за внимание!