1 СУБД UMS-FAD тм Компания «Х-Технология» www.x-tex.ru Москва 2011.

Презентация:



Advertisements
Похожие презентации
1 СУБД UMS-FAD тм Компания «Х-Технология» Москва 2011.
Advertisements

1 Многомерная СУБД UMS-FAD Компания «Х-Технология» Москва 2010.
1 СУБД UMS Компания «Х-Технология» Москва Системотехническое решение СУБД UMS Административный клиент GAI Сервер UMS: веб-сервер UNET шлюз UGW.
Базы данных Лекция 01 Информационные технологии баз данных.
Организация данных в виде отдельных файлов Файл с данными по договорам договора Дата Организация Директор Адрес Телефон Файл с данными по письмам исх/вх.
Информационные системы. Базы данных. Информационная система – любая система обработки информации (шир)
Классификация БД. СУБД и ее компоненты. Логическое и физическое описание данных.
База данных (БД) – основа информационных систем(ИС)
Виды моделей данных. Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности.
ВИДЫ МОДЕЛЕЙ ДАННЫХ. Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности.
Администрирование информационных систем Лекция 4. Система управления базами данных.
Реляционная модель – это особый метод рассмотрения данных, содержащий данные в виде таблиц, способов работы и манипуляции с ними в виде связей. структура,
Базы данных Михайлова Елена Георгиевна, мат.-мех. ф-т, кафедра информатики, доцент.
Хранение, поиск и сортировка информации Базы данных и системы управления базами данных(СУБД)
OLAP и OLTP системы OLTP – оперативная транзакционная обработка данных OLAP – оперативная аналитическая обработка данных.
База данных – совокупность сведений о конкретных объектах реального мира в какой-либо предметной области. Банк данных – устаревшее название баз данных.
Операционные системы. Проверка д / з В чем состоит магистрально - модульный принцип построения компьютера ? Изобразите схему архитектуры компьютера. В.
Базы данных Лекция 04 Общая характеристика понятий БД.
МОДЕЛИ И ТИПЫ ДАННЫХ Выполнил : Студент 311 группы Жарова Мария.
Системы управления базами данных БД – это информационная модель, позволяющая в упорядоченном виде хранить данные о группе объектов, обладающих одинаковым.
Транксрипт:

1 СУБД UMS-FAD тм Компания «Х-Технология» Москва 2011

2 Системотехническое решение СУБД UMS-FAD тм Административный клиент GAI Фреймворк UMS: веб-сервер UNET виртуальная машина UVM компилятор байт-кода UBC сетевой шлюз UGW Двигатель FAD тм Драйвер LCD База данных repoDB

3 Особенности СУБД UMS-FAD тм Расширенная реляционная модель данных ERM Денормализованные отношения Ассоциативные массивы данных Служебные домены первичных ключей данных Мультиверсионная архитектура Отсутствие блокировок объектов базы данных Отсутствие журналов транзакций и сегментов отката Сериализуемый уровень изоляции транзакций Механизм поиска в виде матричных деревьев

4 Ассоциативный массив 111ХХХХ212ХХХХХХХ313ХХХХХХХХХХХХХХХ 414ХХХХ515ХХХХХ516ХХХХХХХ617ХХХХХХХХХ 111ХХХХ212ХХХХХХХ313ХХХХХХХХХХХХХХХ Реляционное отношение ДоменВерсияУровень иерархии Начало первого кортежа Начало второго кортежа Значение атрибута Атрибут кортежа

5 Расширенная реляционная модель данных ERM Денормализованные отношения – максимально полные информационные образы типов объектов предметной области В типах объектов поддерживаются логические связи между составляющими доменами (в виде иерархий) Первичные ключи – функционально независимые атрибуты служебного домена уникальных идентификационных номеров Вторичные ключи – соответствуют вторичным ключам базовой реляционной модели данных RM Манипуляционный и целостный аспекты модели ERM соответствуют подобным аспектам модели RM Доменный состав отношений модели ERM соответствует атрибутному составу классов объектно-ориентированной модели данных прикладных решений

6 Кортеж данного - мультимножество Фамилия - Кузнецов Имя - Иван Телефон - Рабочий Номер Телефон - Мобильный Номер Телефон - Неизвестно Номер УИН

7 Структура кортежей данных Атрибуты каждого кортежа связаны в иерархическую структуру Арность кортежей в общем случае не равна арности отношений Кортежи могут содержать повторяющиеся атрибуты или группы атрибутов Каждое отношение содержит головной кортеж, содержащий стандартный набор атрибутов, имеющих неопределенные значения, и соответствующий одному из типов объектов предметной области Максимальный размер одного кортежа ограничен возможностями файловой системы Кортеж может содержать ссылки на фрагменты неструктурированной информации, хранимые в файле базы данных или в отдельных файлах

8 Мультиверсионная архитектура СУБД UMS-FAD тм Значение УИН данного Новое значение атрибута ID атрибута ID Значение УИН данного Старое значение атрибута ID атрибута Адрес УИН данного Узлы М-дерева Старая версия данного Новая версия данного Адрес атрибута

9 Структура версий данных Каждое данное состоит из первичной версии и набора дельта- версий, логически связанных совпадающим уникальным идентификационным номером (УИН) Версии содержат номера транзакций записи Модифицированные атрибуты в составе версий данных логически связаны служебным идентификатором экземпляра атрибута (ID) Запись новых версий данных осуществляется без чтения и блокировки старых версий, на основании УИН данных и ID атрибутов Все версии данных хранятся в одном отношении Очистка базы данных от устаревших версий данных производится в фоновом режиме путем консолидации версий

10 Двоичное сбалансированное матричное дерево поиска Корневой указатель Значение ключа четного поддерева = 2 L x Y, где L – уровень дерева, Y - сомножитель Позиция узла дерева на уровне = (Y + 1) / 2 Значение ключа нечетного поддерева = (2 L x Y) - 1 Значение ключа общей вершины = (K 1 + K 2 ) / 2, где K1,2 – значение ключей нижних узлов

11 Особенности матричных деревьев поиска Матричные деревья поиска относятся к самобалансирующимся двоичным деревьям Включению элемента в матричное дерево предшествует присвоение номера элементу в порядке записи в базу данных Отдельное матричное дерево состоит из четного и нечетного поддеревьев (поиск во вдвое меньшем числе элементов) В процессе балансировки участвуют не более 4 элементов (в отличие от половины элементов любой другой разновидности самобалансирующихся деревьев) В случае монотонно возрастающего порядка записи элементов матричные деревья не требуют балансировки Механизм поиска состоит из нескольких ярусов матричных деревьев – типы данных, домены, дескрипторы атрибутов

12 Сравнение эффективности реализации RM и ERM моделей данных Узлы B+деревьев Узлы M- деревьев Список данных, узлов M- деревьев, кодов и значений атрибутов Список листьев B+деревьев Словарь кодов и значений атрибутов Таблицы данных ER модель A – индексируемые атрибуты, N – нормальная форма, F – сканирование файлов ERM модель A = max, N = 1, F = 0 Обращения к диску Запись ~ L/2 Чтение ~ 0 Запись ~ 0 Чтение ~ 0 Запись ~ 2 Чтение ~ 1 Запись ~ N Чтение ~ 1 (+ F) Запись ~ 1 Чтение ~ 1 Запись = A x (L/2 + 2) + 2N Чтение = A x 3 + 2F x N Запись = 1 Чтение = 1 Обращения к диску Итого: Сегменты отката Запись ~ N Чтение ~ 1 (+ F) Оперативная память Энергонезависимая память

13 Основные инновации СУБД UMS-FAD тм Многомерная база данных, полностью размещенная на внешнем носителе Физическая структура данных, включающая только значимую информацию Схема базы данных, изменяемая в фоновом режиме

14 Компоновочные решения UMS-FAD тм Клиентское приложение Фреймворк UMS LCD FAD База данных Веб-браузер Триггеры, хранимые процедуры, пользовательские функции, представления, серверные приложения Клиентское приложение FAD База данных Библиотека функций Способы реализации: 1 - клиент-серверная архитектура 2 - распределенные базы данных 3 - библиотеки расширения 4 - серверные приложения 5 и 6 - встраивание двигателя FAD 6 UNET UVM UGW СУБД 5 4

15 работает на платформе 64-разрядных операционных систем UNIX/Linux работает на платформе 32/64-разрядных операционных систем Unix/Linux и Microsoft Windows обеспечивает обмен информацией с реляционными базами данных, аналитическими системами и табличными процессорами Клиентская часть Серверная часть СУБД UMS-FAD тм реализована в клиент-серверной архитектуре

16 Масштабирование СУБД UMS-FAD тм Слейв-сервер Реплика БД Запись Репликация Чтение Мастер-серверСлейв-сервер Мастер БДРеплика БД Запись Репликация Запись Чтение Клиент

17 Индустриальный тест ТРС-С по оперативной обработке транзакций OLTP Пиковая производительность СУБД UMS-FAD тм составила 1 миллион транзакций в минуту в расчете на одно ядро процессора Цена одной транзакции в минуту СУБД UMS- FAD тм составила единицы центов США

18 Зависимость времени чтения от объема реляционной и многомерной баз данных: 5, и 20 млн. данных ,01 0,02 0,03 0,04 Время, секунды Данные, млн. единиц СУБД UMS-FAD тм Реляционная СУБД

19 Контакты ООО «Х-Технология» , Москва, Малый Сухаревский пер., дом 9, строение 1, офис 36 тел. +7 (495) http: ///