Разработка модели родительской селективности для оптимизации запросов в XML базах данных Чернышев Г.А. 545 гр. Научный руководитель Барашев Д. В.

Презентация:



Advertisements
Похожие презентации
К созданию архитектуры поисковой системы в наборах документов. Горелов С.С. МГУ им. М.В. Ломоносова механико-математический факультет.
Advertisements

Поиск максимальной длины рекуррентности в графе зависимостей Научный руководитель: Гимпельсон В.Д. Работу выполнила Филиппова В.Н. Московский физико-технический.
Выполнил: Горелов С.С. Под руководством: с.н.с. Афонин С.А., проф. Васенин В.А. Усечение пространства поиска в полуструктурированных данных при помощи.
Об одном алгоритме вычисления функции распределения выплат в модели коллективных страховых рисков Бацын М.В. Калягин В.А., д.ф-м.н., профессор, декан факультета.
Динамическое программирование. Основные концепции Федор Царев, Андрей Лушников Спецкурс «Олимпиадное программирование» Лекция Санкт-Петербург,
Выполнила: Ученица 10 Б класса МБОУСОШ 22 Хрушкова Елена Учитель: Буткевич И. В. «Алгоритмы»«Алгоритмы»
Применение генетического программирования для реализации систем со сложным поведением Санкт-Петербургский Государственный Университет Информационных Технологий,
Алгоритмические конструкции Формы представления алгоритма.
Этапы решения вычислительных задач. Технологическая цепочка решения задачи на ЭВМ 1.Постановка задачи. 2.Математическая формализация. 3.Построение алгоритма.
База данных – организованная совокупность данных, предназначенная для длительного хранения во внешней памяти компьютера и постоянного применения. По характеру.
Технология хранения, поиска и сортировки информации в базах данных
Построение таблиц истинности, логических схем и булевых выражений Построение таблиц истинности, логических схем и булевых выражений.
2012 год Кафедра прикладной математики Руководитель работы: д.т.н., проф. Фальк В.Н. Национальный исследовательский университет «МЭИ» Выпускная работа.
Куб и его элементы Презентация для стола Базуева Н.В. Гайнская СОШ2 Грани куба A D B C A1A1 D1D1 B1B1 C1C1 Найдите и покажите эти элементы.
Средства представления и записи алгоритмов. Блок – схемы. Виды алгоритмических структур. Линейный алгоритм.
ТУЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МЕДИЦИНСКИЙ ИНСТИТУТ ИСПОЛЬЗОВАНИЕ АЛГЕБРАИЧЕСКОЙ МОДЕЛИ КОНСТРУКТИВНОЙ ЛОГИКИ ПРИ ПОСТРОЕНИИ ЭКСПЕРТНЫХ СИСТЕМ Хромушин.
Задача построения расписания конфигураций с ограниченной глубиной узлов для беспроводных сенсорных сетей Евгений Наградов.
Задачи связности и реберной двусвязности на динамически меняющихся графах Автор: Сергей Копелиович, студент 545 группы Научный руководитель: старший преподаватель.
Построение таблиц истинности логических выражений.
Построение наукометрического индекса, устойчивого к спаму Докладчик : Александр Пироженко.
Транксрипт:

Разработка модели родительской селективности для оптимизации запросов в XML базах данных Чернышев Г.А. 545 гр. Научный руководитель Барашев Д. В.

Селективность Количественная величина. Показывает распространенность объектов, удовлетворяющих заданным свойствам

Виды селективности Селективность узла n и набора предикатов s - количество узлов с тегом n, которые удовлетворяют набору предикатов s. Родительской селективностью узла n будет называться та часть узлов p, которая будет найдена при вычислении запроса (такого, что узел n – входит в запрос) выходящего из p.

XML алгебра Механизм оптимизации Правильный порядок вычислений может дать преимущество в скорости в десятки раз

Схема использования модели селективности

Вычисление родительской селективности Родительская селективность для дочернего узла n и родительского p показывает распространенность этой связки вершин. может быть вычислена по формуле:

Построение оптимального плана Опр: суммарная стоимость вычисления двух путей, исходящих из одной вершины, будет сумма стоимостей вычисления первого снизу вверх и второго сверху вниз В общем случае: 1)Сортируем детей по родительской селективности 2)Вычисляем путь с наименьшей селективностью снизу вверх 3)Сверху вниз, в порядке возрастания, считаем остальные пути.

Как считать Fan-out(n,p)? (стандартная модель) Быстрое вычисление, могут пользоваться уже хранящимися данные Не точна, основана на наивных предположениях Дополнительной памяти не требует

Как считать Fan-out(n,p)? (предложенное решение)

Свойства полученной модели Сжатие статистики. Если в графе много похожих кустов, можно хранить данные о n самых частых, остальные вычислять старым методом Масштабируемость системы: выделяя больше памяти – получаем лучший результат Возможности для паралеллизации (хранение структуры, исполнение алгоритма)

Измерения Измерение количества проверок предикатов на истинность Количество требуемой памяти (максимальное) для хранения промежуточных результатов

Тесты

Заключение Придумана модель селективности: структура данных Написана тестовая система Произведены тесты. Показано улучшение измеряемых характеристик