Дисциплина: Интеллектуальный анализ данных Лабораторная работа 1-2 Выполнил студент группы ПИбд-41 ЛипинскийМ.А.

Презентация:



Advertisements
Похожие презентации
ПОДГОТОВИЛА УЧЕНИЦА 9-В КЛАССА МБОУ-СОШ 4 ФАТЕЕВА МАРИЯ Моделирование как метод познания мира.
Advertisements

Этапы компьютерного моделирования. 1. Описание задачи Задача формулируется на обычном языке; Определяется объект моделирования; Представляется конечный.
Моделирование и исследование мехатронных систем Курс лекций.
Онтологии: понятие, методы, применение. Онтологии предметных областей. Лекция 5.
Этапы моделирования. Постановка задачи: Описание задачи; Цель моделирования; Анализ объекта Разработка информационной модели Разработка компьютерной модели.
Кластерный анализ. Цель работы ознакомление с проблемой кластерного анализа при интеллектуальной обработке данных в информационных системах; изучение.
Лекция 11. Методы и алгоритмы анализа структуры многомерных данных. Кластерный анализ. Кластерный анализ предназначен для разбиения множества объектов.
С ТАТИСТИЧЕСКИЕ МЕТОДЫ ОБУЧЕНИЯ РАСПОЗНАВАНИЮ ОБРАЗОВ Студент гр Хиндикайнен А.С.
В общем виде вероятностный ( стохастический ) автомат ( англ. probabilistic automat) можно определить как дискретный потактный преобразователь информации.
И Моделирование – это построение моделей реально существующих объектов; построение моделей реально существующих объектов; замена реального объекта его.
Особенности Data Mining проектов. BaseGroup Labs Отличие от стандартного проекта В большинстве случаев Data Mining проекты не оправдывают ожидания клиентов.
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
3.1. Алгоритм модель деятельности исполнителя алгоритмов Информатика 7 класс.
Графические способы представления информации Кластеры Автор презентации: Лебедева М. Б.
Основные этапы моделирования. Моделирование – исследование объектов путем построения и изучения их моделей. Моделирование – творческий процесс, и поэтому.
Выполнили: Мартышкин А. И. Кутузов В. В., Трояшкин П. В., Руководитель проекта – Мартышкин А. И., аспирант, ассистент кафедры ВМиС ПГТА.
Компьютерное математическое моделирование в среде Excel.
1 Искусство построения моделей или Этапы решения задач с помощью ЭВМ.
РАДИОМЕТРИЧЕСКИЕ СВОЙСТВА СНИМКОВ И ИХ КОМПЬЮТЕРНАЯ ОБРАБОТКА.
Кодирование информации. Кодирование и декодирование Для обмена информацией с другими людьми человек использует естественные языки. Наряду с естественными.
Транксрипт:

Дисциплина: Интеллектуальный анализ данных Лабораторная работа 1-2 Выполнил студент группы ПИбд-41 ЛипинскийМ.А.

Область Автомобилестроение

Рассматриваемая проблема Зависимость расхода топлива от компоновки и конструкции автомобиля

Интенсионал понятий Тип привода – конструкция трансмиссии автомобиля. Коробка передач – агрегат, предназначенный для изменения частоты и крутящего момента на ведущих колесах в широких пределах. Масса автомобиля - (от греч. μάζα «кусок теста») скалярная физическая величина, одна из важнейших величин в физике. Тип кузова – форма кузова автомобиля

Экстенсионал понятий Тип привода – передний, задний, полный Коробка передач – МКПП, АКПП, вариатор Масса автомобиля - вещественное число Тип кузова –хетчбэк, седан, универсал, минивэн, пикап и т.д.

Исходные данные Модель автомобиля РасходПривод КППМассаТип кузова Toyota Camry V2011,60ПереднийМКПП1080Седан Toyota Celica ST18210,40ПереднийМКПП1460Купе Toyota Celica ST18211,10ПереднийАКПП1460Купе Toyota Carina ST18210,50ПолныйМКПП1060Седан Toyota Carina ST18211,20ПолныйАКПП1060Седан Toyota RAV4 E-SXA15G10,50ПереднийМКПП1180Внедорожник Toyota RAV4 E-SXA10G12,60ПолныйАКПП1350Внедорожник Toyota Caldina E-ST195G11,30ПолныйМКПП1350Универсал Toyota Caldina E-ST195G12,50ПолныйАКПП1350Универсал Toyota Caldina E-ST191G11,80ПереднийАКПП1350Универсал Toyota Ipsum E-SXM10G12,10ПереднийАКПП1500Минивэн Toyota Ipsum GF-SXM15G12,80ПолныйАКПП1500Минивэн

Выбранные Задачи ИАД Кластеризация Обнаружение аномалий Резюмирование

Кластеризация Кластерный анализ это разделение множества входных векторов на группы (кластеры) по степени схожести. Кластеризация в Data Mining приобретает ценность тогда, когда она выступает одним из этапов анализа данных, построения законченного аналитического решения. Аналитику часто легче выделить группы схожих объектов, изучить их особенности и построить для каждой группы отдельную модель, чем создавать одну общую модель для всех данных.

Кластеризация Решение задачи кластеризации принципиально неоднозначно. Во-первых, не существует однозначно наилучшего критерия качества кластеризации. Во-вторых, число кластеров, как правило, неизвестно заранее и устанавливается в соответствии с некоторым субъективным критерием. В-третьих, результат кластеризации существенно зависит от метрики, выбор которой, как правило, также субъективен и определяется экспертом.

Кластеризация массы автомобиля Для получения кластеризации используем реализацию метода k-means в SciPy. SciPy это открытая библиотека высококачественных научных инструментов для языка программирования Python.

Кластеризация mass = [1080, 1460, 1460, 1060, 1060, 1180, 1350, 1350, 1350, 1350, 1500, 1500] # let scipy do its magic res, idx = kmeans2(numpy.array(mass),3) print(res, idx) Вывод: [ ] [ ]

Обнаружение аномалий Одним из ключевых направлений применения технологий Data Mining является автоматизация поиска аномалий. Поиск аномалий – это поиск шаблонов данных, не соответствующих ожидаемому поведению. Поиск аномалий широко применяется в задачах мониторинга состояния технических систем.

Обнаружение аномалий Вначале эксперты задают модель поведения системы, представляющую собой набор правил, характеризующих поведение системы. В процессе работы системы, поступающие телеметрические данные проверяются на соответствие модели. Если поведение данных начинает отклоняться от модели, то оператору, контролирующему работу системы, поступает тревожных сигнал о возможной неисправности.

Обнаружение аномалий Одним из наиболее перспективных data-driven методов является технология IMS, разработанная в NASA. IMS использует технологию кластеризации данных и вводит понятие расстояния между векторами данных. В процессе обучения IMS анализирует данные, полученные в процессе нормальной работы системы, и строит модель поведения системы – набор кластеров. Каждый кластер определяет ограничения на значения каждого параметра в каждом конкретном входящем векторе данных. Если в базе знаний нет кластера, содержащего близкие по значению данные, это означает, что система ведет себя неожиданным способом, т.е. возникла аномалия.

Обнаружение аномалий В нашей задаче: Выявление повышенного расхода на опытных образцах

Задача резюмирования Резюмирование – это описание полученных групп объектов из анализируемого набора данных. Резюмирование представляет собой получение оценки на естественном языке. Важным свойством лингвистических оценок является широкое применение на практике для выражения знаний о степени соответствия наблюдаемого объекта или его характеристики некоторому критерию

Список использованной литературы /tutorial_html/kmeans.htmlhttp://home.deib.polimi.it/matteucc/Clustering /tutorial_html/kmeans.html means.html 393/