Исследование CBR (Case Based Reasoning) метода при автоматизированном проектировании информационных систем.

Презентация:



Advertisements
Похожие презентации
Исследование CBR (Case Based Reasoning) метода при автоматизированном проектировании информационных систем.
Advertisements

Теория вычислительных процессов 4 курс, 8 семестр Преподаватель: Веретельникова Евгения Леонидовна 1.
Рассмотрим неравенство 2 х 2 - у < 6. При х = 2, у = 5 это неравенство обращается в верное числовое неравенство < 6. Говорят, что пара (2;
Лекция 8 Лекция 8 Инфологическое (концептуальное) моделирование предметной области (ПрО). Анализ предметной области. Синтез концептуальной модели предметной.
Теория экономических информационных систем Семантические модели данных.
3.1. Назначение онтологий. Информационный поиск..
Этапы компьютерного моделирования. 1. Описание задачи Задача формулируется на обычном языке; Определяется объект моделирования; Представляется конечный.
Основные этапы моделирования. Моделирование – исследование объектов путем построения и изучения их моделей. Моделирование – творческий процесс, и поэтому.
Основные этапы моделирования. Моделирование – исследование объектов путем построения и изучения их моделей.
Информационный маркетинг Лекция 5 Основы формирования спроса и предложения на рынке ИПУ. Оценка конкурентоспособности ИПУ.
Моделирование – исследование объектов путем построения и изучения их моделей. Моделирование – творческий процесс, и поэтому заключить его в формальные.
Этапы моделирования. Постановка задачи: Описание задачи; Цель моделирования; Анализ объекта Разработка информационной модели Разработка компьютерной модели.
Плоскость и прямая в пространстве Лекция 10. Определение. Уравнением поверхности в пространстве называется такое уравнение между переменными которому.
Тема 2. Концептуальное проектирование. Лекция 1. Уровни моделей и этапы проектирования.
База данных – это совокупность структурированных данных определенного назначения. Структурирование данных – это объединение данных по определенным параметрам.
{ изоморфизм графов - подграф - планарный и плоский графы - укладка плоских графов - маршруты, связность и компоненты - метрические характеристики - Эйлеровы.
Плоскость и прямая в пространстве Лекции 10, 11. Определение. Уравнением поверхности в пространстве называется такое уравнение между переменными которому.
Теория вычислительных процессов Сети Петри для моделирования Преподаватель: Веретельникова Евгения Леонидовна 1.
ЭТАПЫ МОДЕЛИРОВАНИЯ. Цель урока: рассмотреть основные этапы моделирования. Задачи: 1. Повторить понятия «модель», «моделирование». 2. Определить место.
Нечеткие множества Основные понятия, функция принадлежности.
Транксрипт:

Исследование CBR (Case Based Reasoning) метода при автоматизированном проектировании информационных систем

Модифицированная спиральная модель ЖЦ программного продукта

Структура процессов управления проектом

9 групп процессов управления проектом БД интеграции БД управления БД управления БД управления управления проектом содержанием проекта сроками проекта рисками проекта Концептуальная структура интегрированной CBR машины СУ Знаниями Текстовые документыЭлектронные таблицы Методы представления знаний Продукционные правила Фреймы Семантические сети Исчисление предикатов ФормализацияЛПР Формирование базы прецедентов Прецедент 1Прецедент 2Прецедент N Извлечение прецедентов из БП с помощью метода ближайшего соседа БП Система принятия решений Подсистема извлечения знаний ЛПР Подсистема представления знаний

Основные определения для формализации задачи СУ Знаниями(СУЗ) Определение тезауруса: тезаурусом называется конечное непустое множество Т слов t, отвечающих условиям: 1.имеется непустое подмножество, называемое множеством дескрипторов; 2.имеется симметричное, транзитивное рефлексивное отношение, такое, что: а) б) при этом отношение R называется синонимическим отношением, а слова, отвечающие этому отношению, называются синонимическими дескрипторами; 3. имеется транзитивное и несимметричное отношение, называемое обобщающим отношением. В случае если два дескриптора удовлетворяют отношению, то полагается, что дескриптор более общий, чем дескриптор. Определение подсистемы СУЗ: подсистемой СУЗ с тезаурусом называется четверка, где Т - тезаурус с дескрипторным множеством ; D - коллекция документов, соответствующая методу представления знаний; М - множество вопросов; - отображение, сопоставляющее каждому вопросу множество документов. Описание любого документа может быть представлено в виде и удовлетворяет условию: никакие два дескриптора не встречаются в одном t(d), если они удовлетворяют отношению К. Каждый вопрос представляется в форме, аналогичной описанию документов. Множество описаний вопросов и документов, частично упорядочено отношением включения следующим образом: т.е. каждый дескриптор из представляет собой обобщение дескриптора из или идентичен дескриптору из Отношение позволяет сформулировать ответ на вопрос в виде: Пусть - локальные системы извлечения знаний, где. Соединяя системы в одну систему S, которая будет называться CBR машиной, базирующейся на глобальном тезаурусе.

Структура БП

Метод "ближайшего соседа". Особенности: Простота использования полученных результатов. Решения не уникальны для конкретной ситуации, возможно их использование для других случаев. Целью поиска является не гарантированно верное решение, а лучшее из возможных. Позволяет провести более глубокий анализ данных, чем дерево решений. Данный метод не создает каких-либо моделей или правил, обобщающих предыдущий опыт.

Используется простое покоординатное сопоставление текущей ситуации с прецедентом (каждый параметр для описания прецедентов рассматривается как одна из координат). Таким образом, определяется расстояние D между текущей ситуацией и прецедентом, а также вычисляется максимальное расстояние D MAX с использованием границ диапазонов параметров для описания прецедентов. Затем вычисляется значение степени сходства: SIM = 1 – D/D MAX или в процентах SIM = (1 – D/D MAX ) 100%. Пусть прецеденты и текущая ситуация описываются только двумя параметрами: 1.пар 1 (диапазон изменения от 10 до 50); 2.пар 2 (диапазон изменения от 1000 до 5000). В БП имеются два прецедента: 1.П 1 : пар 1 = 30, пар 2 = 3500; 2.П 2 : пар 1 = 40, пар 2 = Для текущей ситуации (Цель) пар 1 = 20, а пар 2 = Рассмотрим координатную плоскость, выбрав в качестве одной оси координат пар 1, а в качестве другой оси координат пар 2. Цель имеет координаты (20, 3000), а прецеденты: 1.П 1 (30, 3500); 2.П 2 (40, 1500). Теперь рассчитаем расстояние от Цели до П 1 (D 1 ) и до П 2 (D 2 ): D 1 = ((20 – 30) 2 + (3000 – 3500) 2 ) 1/2 = 500,10; D 2 = ((20 – 40) 2 + (3000 – 1500) 2 ) 1/2 = 1500,13. Аналогичным образом вычисляется максимальное расстояние D MAX между точками с координатами (10, 1000) и (50, 5000) = 4000,20. Затем вычисляются значения степени сходства SIM текущей ситуации с двумя прецедентами из БП: 1.для П 1 : SIM 1 =(1 – D 1 /D MAX )=(1 – 500,10/4000,20)=0,8750 (87,50%); 2.для П 2 : SIM 2 =(1 – D 2 /D MAX )=(1 – 1500,13/4000,20)=0,6250 (62,50%).

Метод "ближайшего соседа". Примеры использования и реализации. Использование - программное обеспечение центра технической поддержки компании Dell, разработанное компанией Inference. Реализация - CBR Express и Case Point (Inference Corp.), Apriori (Answer Systems), DP Umbrella (VYCOR Corp.), KATE tools (Acknosoft, Франция), Pattern Recognition Workbench (Unica, США), а также некоторые статистические пакеты, например, Statistica.

Выводы. Исследованы методы представления знаний. Разработана модифицированная спиральная модель ЖЦ программного продукта. Выполнена формализация постановки задачи синтеза интегрированной CBR машины. Разработана концептуальная структура интегрированной CBR машины. Разработаны требования к структкрной организации БП.