III. СЕМАНТИЧЕСКИЕ МОДЕЛИ ДАННЫХ 3.1. Принципы семантического моделирования.

Презентация:



Advertisements
Похожие презентации
Модуль 1. Математические основы баз данных и знаний.
Advertisements

Тема 2. Концептуальное проектирование. Лекция 1. Уровни моделей и этапы проектирования.
Реляционная модель – это особый метод рассмотрения данных, содержащий данные в виде таблиц, способов работы и манипуляции с ними в виде связей. структура,
Даталогическое проектирование. 1. Представление концептуальной модели средствами модели данных СУБД Общие представления о моделях данных СУБД С одной.
Реляционная алгебра Презентация подготовлена зав. кафедрой ИБ, д.п.н., профессором З.В. Семеновой.
Виды моделей данных. Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности.
Инфологическое проектирование. Инфологическое проектирование прежде всего связано с попыткой представле­ния семантики предметной области в модели БД.
Теория экономических информационных систем Семантические модели данных.
V. СЕМАНТИЧЕСКАЯ МЕТОДИКА ПРОЕКТИРОВАНИЯ РЕЛЯЦИОННЫХ СХЕМ БД.
Базы данных Реляционная база данных MS Access. Повторение База данных организованная совокупность данных из какой-либо предметной области, предназначенная.
Базы данных Лекция 4 Базисные средства манипулирования реляционными данными: реляционная алгебра Кодда.
ВИДЫ МОДЕЛЕЙ ДАННЫХ. Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности.
ТЕМА 3 Взаимосвязи в модели данных. При проектировании БД нам потребуется различать взаимосвязи: между объектами между атрибутами одного объекта и между.
Определения Банк данных (БнД) это система специальным образом организованных дан­ных - баз данных, программных, технических, языковых, организационно-
Моделирование данных Модель «сущность-связь». Рассматриваемые вопросы: Элементы модели «сущность-связь» Диаграммы «сущность-связь» Слабые сущности Подтипы.
Методология IDEF1X (IDEF1 Extended) – язык для семантического моделирования данных, основанных на концепции « сущность - связь ». Является расширением.
2. Общая характеристика моделей данных. Архитектура ANSI/SPARC (1) CODASYL – Conference on Data System Languages ANSI – American National Standard Institute.
Учебная дисциплина «Базы данных» для студентов специальности Бизнес-информатика (бакалавриат) ЛЕКЦИЯ 3 ВВЕДЕНИЕ В РЕЛЯЦИОННУЮ МОДЕЛЬ ДАННЫХ Вопрос.
МЕТОДЫ ОРГАНИЗАЦИИ ИНФОРМАЦИОННЫХ ОБЪЕКТОВ С ПОДОБНЫМИ СТРУКТУРАМИ КАК ЕДИНЫЙ ИФОРМАЦИОННЫЙ РЕСУРС ХРАНИЛИЩА МНОГОМЕРНЫХ ДАННЫХ. Волков Антон Андреевич.
Элементы модели «сущность-связь» Сущность - Класс сущностей - Экземпляр сущности Атрибуты - Композитные атрибуты - Многозначные атрибуты Идентификаторы.
Транксрипт:

III. СЕМАНТИЧЕСКИЕ МОДЕЛИ ДАННЫХ 3.1. Принципы семантического моделирования

Общий подход к проблеме семантического моделирования 1. Прежде всего, попытаемся выявить некоторое множество семантических концепций (понятий), которые могут быть полезны при неформальном обсуждении реального мира. 2. Далее попытаемся определить набор соответствующих символических (т.е. формальных) объектов, которые могут использоваться для представления определенных ранее семантических концепций. 3. Кроме того, следует определить набор формальных общих правил целостности, предназначенных для работы с такими формальными объектами. 4. Наконец, необходимо определить набор формальных операторов, предназначенных для манипулирования этими формальными объектами.

3.2. Модель данных «Сущность- Связь» (ER-модель) Структуры

Множество сущностей (МСу) – E СЛУЖАЩИЙ Множество связей (МСв) – R Роль - r Множество значений (МЗн) – V ЦПЧ или Строки Атрибут - f Фамилия: ПАЦИЕНТ -> Строки Номер койки: РАЗМЕЩЕНИЕ -> ЦПЧ Адрес: ПАЦИЕНТ -> Строки x ЦПЧ Серия_Номер_Свидетельства: БРАК -> ЦПЧ x ЦПЧ Структурные понятия ER-модели Чена

ERмодельCHENаERмодельCHENа ER-диаграмма медицинской ПрО (структурный аспект)

Выбирая форму данных, помните о возможном триализме явлений моделируемого мира. Так, брак между людьми можно представлять себе как атрибут, множество связей или множество сущностей. Проектируя схему БД, необходимо сделать выбор в пользу одного из этих представлений. При этом можно использовать следующие соображения. Если вам достаточно информации о том, состоит человек в браке или нет, можно рассмотреть это явление как атрибут множества сущностей ЧЕЛОВЕК. Если вас к тому же интересует, с кем конкретно заключен брак, необходимо трактовать БРАК как множество связей между сущностями множества ЧЕЛОВЕК. И, наконец, если вам потребуется формулировать высказывания по поводу этого явления (о наличии у него определенных характеристик или связей), нужно использовать самостоятельное множество сущностей БРАК. Проблема триализма в ER-модели

Атрибут ЧЕЛОВЕК (…,Замужем/Женат?,…) – множество сущностей Связь ЧЕЛОВЕК – множество сущностей БРАК (Муж, Жена) – множество связей Проблема триализма в ER-модели Сущность ЧЕЛОВЕК – множество сущностей БРАК – множество сущностей РОЖДЕНИЕ_В_БРАКЕ – множество связей МУЖ - множество связей ЖЕНА - множество связей

ERмодельCHENаERмодельCHENа Разновидности множеств связей

ERмодельCHENаERмодельCHENа Разновидности атрибутов

Экстенсионал БД в форме графа

Экстенсионал БД в форме таблиц

Ограничения целостности

Множество допустимых значений атрибутов можно задавать: 1) указанием соответствующего множества значений Фамилия: ПАЦИЕНТ -> Строки Номер койки: РАЗМЕЩЕНИЕ -> ЦПЧ 2) сравнением с константой или значением атрибута (возможны более сложные выражения) Назначенное время (a) = 0 AND Назначенное время (a) < 24, где a АНАЛИЗ 1) Ограничения целостности на значения атрибутов

2А) Ограничения целостности на отображения между атрибутами одного множества сущностей или связей Ключ сущности

Уникальная идентификация связи по всем сущностям, в ней участвующим по одной сущности типа АНАЛИЗ по одной сущности типа ПАЦИЕНТ или по сущности типа ПАЛАТА и значению атрибута связей Номер койки по одной сущности типа ЧЕЛОВЕК в роли Муж или Жена и значению атрибута связей Дата регистрации брака или по значению атрибута связей Серия и Номер Свидетельства

2Б) Ограничения целостности на отображения между множествами сущностей в контексте множества связей

ERмодельCHENаERмодельCHENа Полная ER-диаграмма медицинской предметной области

Операции

1) Создание сущностей (с возможностью задания экземпляров атрибутных отображений) 2) Изменение сущностей (изменение экземпляров атрибутных отображений) 3) Удаление сущностей 4) Создание связей (с указанием сущностей для всех ролей и экземпляров атрибутных отображений) 5) Изменение связей (изменение экземпляров атрибутных отображений) 6) Удаление связей 7) Селекция сущности по указателю текущей 8) Селекция связи по указателю текущей 9) Селекция сущности по указателю текущей и по данным 10) Селекция связи по указателю текущей и по данным 11) Селекция сущности по указателю текущей и по связи 12) Селекция связи по указателю текущей и по связи 13) Селекция сущности по указателю текущей, по данным и по связи 14) Селекция связи по указателю текущей, по данным и по связи 15) Выборка значений атрибутов для текущей сущности или связи Операции навигационного языка

[.] [ ] 1. Получить фамилии врачей-окулистов OUTPUT ВРАЧ.Фамилия SELECT ВРАЧ.Специальность = окулист 2. Получить фамилии пациентов, лежащих в больнице Святой Елены. OUTPUT ПАЦИЕНТ.Фамилия SELECT БОЛЬНИЦА.Название = Святая Елена / ПАЛАТА 3. Получить фамилии и специальности врачей, у которых есть пациенты больницы Святой Елены, выполнявшие анализы в лаборатории «Друг желудка». OUTPUT ВРАЧ.Фамилия, Специальность (SELECT БОЛЬНИЦА.Название = Святая Елена / ПАЛАТА / ПАЦИЕНТ) (SELECT ЛАБОРАТОРИЯ.Название = Друг желудка / АНАЛИЗ / ПАЦИЕНТ) Спецификационный язык CABLE (ChAin Based LanguagE)

Назначение ER-модели

1. Модель должна обладать достаточной общностью и ясностью для того, чтобы в ней можно было легко представить любые явления и законы моделируемого мира. 2. Разрыв между этой моделью и моделями, реализуемыми в СУБД, не должен быть большим, желательно, чтобы можно было воспользоваться максимально формальными правилами преобразования структур и ограничений целостности из одной модели в другую. Критерии качества семантической модели

Модификации ER-модели Чена

Общая схема модификаций ER-модели Чена ER-модель Чена + Специализации и категоризации = Enhanced ER-модель (EER-модель) - Множества связей степени больше 2 Атрибуты множеств связей Многозначные атрибуты Атрибутивные отображения в декартово произведение множеств значений = ER-модель Баркера (Oracle Designer) - Бинарные множества связей типа M:N Представление связей с помощью внутрисистемных указателей (необходимо дублировать атрибуты множеств сущностей) = ER-модель IDEF1X (ERWin)

Специализации и категоризации 1. Специализации и категоризации являются традиционной естественной формой представления информации для человека. 2. Специализация предполагает перенос определений некоторых атрибутов и множеств связей на уровень суперкласса, благодаря этому фиксируется важная информация о том, что данные атрибуты и типы связей имеют смысл не только для экземпляров конкретного подкласса, но и для суперкласса в целом, а, значит, и для всех остальных его подклассов. 3. Специализации и категоризации позволяют исключить дублирующие определения атрибутов и множеств связей для «родственных» множеств сущностей, в результате чего удается избежать некоторых ошибок и сократить время, затрачиваемое на проектирование. 4. Процесс семантического моделирования зачастую ведется в терминах различных абстракций одного и того же объекта (например, конкретный человек может быть представлен и сущностью типа ВРАЧ, и сущностью типа ПАЦИЕНТ одновременно), а специализации и категоризации позволяют в таких случаях восстановить целостность объекта реального мира. 5. Выделение подкласса в процессе специализации является своего рода гарантией применимости связей и значений атрибутов только к тем сущностям, для которых они актуальны. 6. Специализация призвана упростить процесс моделирования, позволяя постепенно увеличивать сложность схемы, в то время как генерализация предоставляет проектировщику возможность работать с большими схемами, выбирая различные уровни абстракции.

Ограничения целостности на специализации и категоризации На специализации могут быть наложены ограничения. Первое ограничение называется ограничением непересечения. Оно гласит, что если подклассы некоторой специализации не пересекаются, то каждый объект может быть представлен сущностью только одного из подклассов данной специализации. Если подклассы специализации пересекаются, один объект может быть представлен сущностями сразу нескольких подклассов специализации. Второе ограничение специализации называется ограничением участия, оно может быть полным или частичным. Специализация с полным участием означает, что каждый объект, представленный сущностью суперкласса, должен быть представлен сущностью хотя бы одного подкласса этой специализации. Специализация с частичным участием означает, что объект, представленный сущностью суперкласса, не обязательно должен быть представлен сущностью какого-либо подкласса этой специализации. Категоризация может быть дополнительно детализирована с учетом полного или частичного участия объектов суперклассов в категории. При полном участии каждый объект всех суперклассов должен быть представлен сущностью данной категории. При частичном участии это ограничение устраняется, и всем объектам всех суперклассов иметь сущности данной категории не обязательно.

EERмодельEERмодель

EERмодельEERмодель

ER-диаграмма медицинской предметной области в нотации Баркера (Oracle Designer)

Сгенерированная реляционная схема медицинской предметной области (Oracle Designer)

ER-диаграмма медицинской предметной области в нотации IDEF1X (Design/IDEF)