Базы и хранилища данных. Построение единого информационного пространства в административно-технических системах Подъем и агрегирование информации... Органы.

Презентация:



Advertisements
Похожие презентации
СППР OLAP и OLTP системы OLTP – оперативная транзакционная обработка данных OLAP – оперативная аналитическая обработка данных.
Advertisements

Многомерная модель данных. OLAP, определение OLAP (On-Line Analytical Processing) - технология оперативной аналитической обработки данных, использующая.
OLAP и OLTP системы OLTP – оперативная транзакционная обработка данных OLAP – оперативная аналитическая обработка данных.
OLAP и OLTP системы OLTP – оперативная транзакционная обработка данных OLAP – оперативная аналитическая обработка данных.
Лекция 2. Поддержка принятия управленческих решений А. Ф. Оськин Кафедра технологий программирования Методы и алгоритмы принятия решений1.
Базы данных Лекция 02 Технологии информационных хранилищ.
Администрирование информационных систем Лекция 4. Система управления базами данных.
Динамическая система многомерного анализа ПО ДСМА ЗАО «ОВИОНТ» Москва, 2008 г.
Deductor 5 – эволюция платформы. BaseGroup Labs Причины изменений Deductor изменялся под влиянием требований, возникающих при его применения в реальных.
Основные элементы системы управления базами данных Access.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ.
Технология хранения, поиска и сортировки информации в базах данных
MS Access Основные элементы
Информационные системы Тема: «Классификация информационных систем» Е.Г. Лаврушина.
База данных (БД) – Совокупность определённым образом организованной информации на определённую тему (в рамках определённой предметной деятельности); Организованная.
Базы данных Лекция 01 Информационные технологии баз данных.
1. Краткая характеристика MS Access1. Краткая характеристика MS Access 2. Достоинства и недостатки 3. Типы БД 4. Базы данных и системы управления базами.
Презентация на тему: «OLAP- технология». Что такое технология OLAP? OLAP-технология – это класс приложений и технологий, предназначенных для оперативной.
Распределенная обработка информации Разработано: Е.Г. Лаврушиной.
Банк данных (БнД) это система специальным образом организованных данных баз данных, программных, технических, языковых, организационно-методических средств,
Транксрипт:

Базы и хранилища данных

Построение единого информационного пространства в административно-технических системах Подъем и агрегирование информации... Органы управления (второй уровень) Контур распределенных процедур формирования решений Органы управления (N-ый уровень)... Хранилище данных_2i Витрины данных База данных_Ni OLTP Внешние ИД OLTP БД_2i Внешние ИД Центр ситуационного моделирования (на OLAP-технологиях) Контур сосредоточенных процедур формирования решений Высший орган управления (первый уровень) Подсистема документирования и визуализации Ср. кол. пользования Подсистема информационного обеспечения ВД ХД_1 OLTP БД_1 Внешние ИД

Информационная поддержка в системах автоматизированных исследований Подсистема анализа. Данная подсистема может быть построена на основе: - подсистемы информационно-поискового анализа на базе реляционных СУБД и статических запросов с использованием языка SQL (Structure Query Language); - подсистемы оперативного анализа. Для реализации таких подсистем применяется технология оперативной аналитической обработки данных OLAP (On-line analytical processing), использующая концепцию многомерного представления данных; -подсистемы интеллектуального анализа. Данная подсистема реализует методы и алгоритмы Data Mining ("добыча данных"). Подсистема ввода данных. В таких подсистемах, называемых OLTP (On­line transaction processing), реализуется операционная (транзакционная) обработка данных. Для их реализации используют обычные системы управления базами данных (СУБД).

Реляционные базы данных _1 Реляционный подход известен благодаря работам Е. Кодда, опубликованных в 1970 году, в которых он 12 сформулировал следующие 12 правил для реляционной БД: Данные представляются в виде таблиц Данные представляются в виде таблиц БД представляет собой набор таблиц. Таблицы хранят данные, сгруппированные в виде рядов и колонок. Ряд представляет собой набор значений, относящихся только к одному объекту, хранящемуся в таблице, и называется записью. Колонка представляет собой одну характеристику для всех объектов, хранящихся в таблице, и называется полем. Данные доступны логически Данные доступны логически реляционная модель не позволяет обращаться к данным физически, адресуя ячейки по номерам колонки и ряда нет возможности получить значение в ячейке колонка 2, ряд 3). Доступ к данным возможен только через идентификаторы таблицы, колонки и ряда. NULL трактуется как неизвестное значение NULL трактуется как неизвестное значение если в ячейку таблицы значение не введено, то записывается NULL. БД должна включать в себя метаданные БД должна включать в себя метаданные БД хранит два вида таблиц: пользовательские таблицы и системные таблицы. В пользовательских таблицах хранятся данные, введенные пользователем. В системных таблицах хранятся метаданные: описание таблиц (название, типы и размеры колонок), индексы, хранимые процедуры и др. Должен использоваться единый язык для взаимодействия с СУБД Должен использоваться единый язык для взаимодействия с СУБД для управления реляционной БД должен использоваться единый язык. В настоящее время таким инструментом стал язык структурных запросов SQL. СУБД должна обеспечивать альтернативный вид отображения данных СУБД должна обеспечивать альтернативный вид отображения данных СУБД не должна ограничивать пользователя только отображением таблиц, которые существуют. Пользователь должен иметь возможность строить виртуальные таблицы представления (View). Должны поддерживаться операции реляционной алгебры Должны поддерживаться операции реляционной алгебры записи реляционной БД трактуются как элементы множества, на котором определены операции реляционной алгебры. СУБД должна обеспечивать выполнение этих операций. В настоящее время выполнение этого правила обеспечивает язык SQL.

Реляционные базы данных_2 Реляционный подход известен благодаря работам Е. Кодда, опубликованных в 1970 году, в которых он 12 сформулировал следующие 12 правил для реляционной БД: Должна обеспечиваться независимость от физической организации данных Должна обеспечиваться независимость от физической организации данных приложения, оперирующие с данными реляционных БД, не должны зависеть от физического хранения данных (от способа хранения, формата хранения и др.). Должна обеспечиваться независимость от логической организации данных Должна обеспечиваться независимость от логической организации данных приложения, оперирующие с данными реляционных БД, не должны зависеть от организации связей между таблицами (логической организации). При изменении связей между таблицами не должны меняться ни сами таблицы, ни запросы к ним. За целостность данных отвечает СУБД За целостность данных отвечает СУБД под целостностью данных в общем случае понимается готовность БД к работе. Различают следующие типы целостности: физическая целостность сохранность информации на носителях и корректность форматов хранения данных; логическая целостность непротиворечивость и актуальность данных, хранящихся в БД. Различают два способа обеспечения целостности: декларативный и процедурный. Целостность данных не может быть нарушена Целостность данных не может быть нарушена СУБД должна обеспечивать целостность данных при любых манипуляциях, производимых с ними Должны поддерживать распределенные операции Должны поддерживать распределенные операции реляционная БД может размещаться как на одном компьютере, так и на нескольких распределенно. Пользователь должен иметь возможность связывать данные, находящиеся в разных таблицах и на разных узлах компьютерной сети. БД имеет 1-ю НФ БД имеет 1-ю НФ, если каждое значение, хранящееся в ней, неразделимо на более примитивные (неразложимость значений); БД имеет 2-ю НФ БД имеет 2-ю НФ, если она имеет 1-ю НФ, и при этом каждое значение целиком и полностью зависит от ключа (функционально независимые значения); БД имеет 3-ю НФ БД имеет 3-ю НФ, если она имеет 2-ю НФ, и при этом ни одно из значений не предоставляет никаких сведений о другом значении (взаимно независимые значения)и т. д. Теория нормализации данных (исключение избыточности):

Основные понятия ER-диаграмм Определение 1. Сущность - это класс однотипных объектов, информация о которых должна быть учтена в модели. Каждая сущность должна иметь наименование, выраженное существитель- ным в единственном числе. Определение 2. Экземпляр сущности - это конкретный представитель данной сущности. Определение 3. Атрибут сущности - это именованная характеристика, являющаяся некоторым свойством сущности. Наименование атрибута должно быть выражено существительным в единственном числе (возможно, с характеризующими прилагательными) Определение 4. Ключ сущности - это неизбыточный набор атрибутов, значения которых в совокупности являются уникальными для каждого экземпляра сущности. Неизбыточность заключается в том, что удаление любого атрибута из ключа нарушается его уникальность. Сущность может иметь несколько различных ключей. Определение 5. Связь - это некоторая ассоциация между двумя сущностями. Одна сущность может быть связана с другой сущностью или сама с собою

Нормализация данных Первая нормальная форма. Сущность находится в 1НФ, если все ее атрибуты являются простыми (имеют единственное значение). Вторая нормальная форма. Сущность находится в 2НФ, если она находится в 1НФ и каждый неключевой атрибут функционально полно зависит от первичного ключа (составного) Третья нормальная форма. Определение 1. Сущность находится в ЗНФ, если она находится в 2НФ и каждый неключевой атрибут нетранзитивно зависит от первичного ключа. Существует и альтернативное определение. Определение 2. Сущность находится в ЗНФ в том и только в том случае, если все неключевые атрибуты сущности взаимно независимы и полностью зависят от первичного ключа

Нормализация данных

Определение OLAP-системы_1 OLAP (On-Line Analytical Processing) OLAP (On-Line Analytical Processing) технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процессов принятия решений. Основное назначение OLAP-систем Основное назначение OLAP-систем поддержка аналитической деятельности, произвольных (часто используется термин ad-hoc) запросов пользователей-аналитиков. Цель OLAP-анализа Цель OLAP-анализа проверка возникающих гипотез. "OLAP для пользователей- аналитиков: каким он должен быть, 12 требований продукты, оперативную аналитическую обработку: В 1993 г. Э. Кодд опубликовал статью под названием "OLAP для пользователей- аналитиков: каким он должен быть, в которой изложил основы концепции оперативной аналитической обработки и определил 12 требований, которым должны удовлетворять продукты, позволяющие выполнять оперативную аналитическую обработку: 1. Многомерность 1. Многомерность OLAP-система на концептуальном уровне должна представлять данные в виде многомерной модели, что упрощает процессы анализа и восприятия информации. 2. Прозрачность 2. Прозрачность OLAP-система должна скрывать от пользователя реальную реализацию многомерной модели, способ организации, источники, средства обработки и хранения. 3. Доступность 3. Доступность OLAP-система должна предоставлять пользователю единую, согласованную и целостную модель данных, обеспечивая доступ к данным независимо от того, как и где они хранятся. 4. Постоянная производительность при разработке отчетов 4. Постоянная производительность при разработке отчетов производительность OLAP-систем не должна значительно уменьшаться при увеличении количества измерений, по которым выполняется анализ.

Определение OLAP-системы_2 "OLAP для пользователей- аналитиков: каким он должен быть, 12 требований продукты, оперативную аналитическую обработку: В 1993 г. Э. Кодд опубликовал статью под названием "OLAP для пользователей- аналитиков: каким он должен быть, в которой изложил основы концепции оперативной аналитической обработки и определил 12 требований, которым должны удовлетворять продукты, позволяющие выполнять оперативную аналитическую обработку: 5. Клиент-серверная архитектура 5. Клиент-серверная архитектура OLAP-система должна быть способна работать в среде "клиент-сервер", т. к. большинство данных, которые сегодня требуется подвергать оперативной аналитической обработке, хранятся распределенно. 6. Равноправие измерений 6. Равноправие измерений OLAP-система должна поддерживать многомерную модель, в которой все измерения равноправны. 7. Динамическое управление разреженными матрицами 7. Динамическое управление разреженными матрицами OLAP-система должна обеспечивать оптимальную обработку разреженных матриц. Скорость доступа должна сохраняться вне зависимости от расположения ячеек данных и быть постоянной величиной для моделей, имеющих разное число измерений и различную степень разреженности данных. 8. Поддержка многопользовательского режима 8. Поддержка многопользовательского режима OLAP-система должна предоставлять возможность работать нескольким пользователям совместно с одной аналитической моделью или создавать для них различные модели из единых данных. При этом возможны как чтение, так и запись данных, поэтому система должна обеспечивать их целостность и безопасность. 9. Неограниченные перекрестные операции 9. Неограниченные перекрестные операции OLAP-система должна обеспечивать сохранение функциональных отношений, описанных с помощью определенного формального языка между ячейками гиперкуба при выполнении любых операций среза, вращения, консолидации или детализации. Система должна самостоятельно (автоматически) выполнять преобразование установленных отношений, не требуя от пользователя их переопределения.

Определение OLAP-системы_3 "OLAP для пользователей- аналитиков: каким он должен быть, 12 требований продукты, оперативную аналитическую обработку: В 1993 г. Э. Кодд опубликовал статью под названием "OLAP для пользователей- аналитиков: каким он должен быть, в которой изложил основы концепции оперативной аналитической обработки и определил 12 требований, которым должны удовлетворять продукты, позволяющие выполнять оперативную аналитическую обработку: 10. Интуитивная манипуляция данными 10. Интуитивная манипуляция данными OLAP-система должна предоставлять способ выполнения операций среза, вращения, консолидации, детализации над гиперкубом без необходимости пользователю совершать множество действий с интерфейсом. Измерения, определенные в аналитической модели, должны содержать всю необходимую информацию для выполнения вышеуказанных операций. 11. Гибкие возможности получения отчетов 11. Гибкие возможности получения отчетов OLAP-система должна поддерживать различные способы визуализации данных, т. е. отчеты должны представляться в любой возможной ориентации. Средства формирования отчетов должны представлять синтезируемые данные или информацию, следующую из модели данных в ее любой возможной ориентации. 12. Неограниченная размерность и число уровней агрегации 12. Неограниченная размерность и число уровней агрегации исследование о возможном числе необходимых измерений, требующихся в аналитической модели, показало, что одновременно может использоваться до 19 измерений. Отсюда вытекает настоятельная рекомендация, чтобы аналитический инструмент мог одновременно предоставить хотя бы 15, а предпочтительно 20 измерений. Более того, каждое из общих измерений не должно быть ограничено по числу определяемых пользователем-аналитиком уровней агрегации и путей консолидации.

Определение OLAP-системы_ В 1995 г. Э. Кодд 12 требованиям, которым должны удовлетворять продукты, позволяющие выполнять оперативную аналитическую обработку, добавил следующие 6 : 13. Пакетное извлечение против интерпретации 13. Пакетное извлечение против интерпретации OLAP-система должна в равной степени эффективно обеспечивать доступ как к собственным, так и к внешним данным. 14.Поддержка всех моделей OLAP-анализа 14. Поддержка всех моделей OLAP-анализа OLAP-система должна поддерживать все четыре модели анализа данных, определенные Коддом: категориальную, толковательную, умозрительную и стереотипную. 15.Обработка ненормализованных данных 15. Обработка ненормализованных данных OLAP-система должна быть интегрирована с ненормализованными источниками данных. Модификации данных, выполненные в среде OLAP, не должны приводить к изменениям данных, хранимых в исходных внешних системах. 16.Сохранение результатов OLAP 16. Сохранение результатов OLAP: хранение их отдельно от исходных данных OLAP-система, работающая в режиме чтения-записи, после модификации исходных данных должна результаты сохранять отдельно. Иными словами, обеспечивается безопасность исходных данных. 17.Исключение отсутствующих значений 17. Исключение отсутствующих значений OLAP-система, представляя данные пользователю, должна отбрасывать все отсутствующие значения. Другими словами, отсутствующие значения должны отличаться от нулевых значений. 18.Обработка отсутствующих значений 18. Обработка отсутствующих значений OLAP-система должна игнорировать все отсутствующие значения без учета их источника. Эта особенность связана с 17-м правилом.

Определение OLAP-системы_5 В, S, RD Кодд все 18 требований сгруппировал в четыре группы В, S, R и D, назвав их особенностями OLAP систем: Основные особенности (В) Основные особенности (В) включают следующие правила: - - многомерное концептуальное представление данных (правило 1); - - интуитивное манипулирование данными (правило 10); - - доступность (правило 3); - - пакетное извлечение против интерпретации (правило 13); - - поддержка всех моделей OLAP-анализа (правило 14); - - архитектура "клиент-сервер" (правило 5); - - прозрачность (правило 2); - - многопользовательская поддержка (правило 8). Специальные особенности (S): - - обработка ненормализованных данных (правило 15); - - сохранение результатов OLAP: хранение их отдельно от исходных данных (правило 16); - - исключение отсутствующих значений (правило 17); - Особенности представления отчетов (R): - обработка отсутствующих значений (правило 18). Особенности представления отчетов (R): - - гибкость формирования отчетов (правило 11); - - стандартная производительность отчетов (правило 4): - - автоматическая настройка физического уровня (измененное правило 7). Управление измерениями (D): - - универсальность измерений (правило 6); - - неограниченное число измерений и уровней агрегации (правило 12); - - неограниченные операции между размерностями (правило 9).

Определение OLAP-системы_6 тест FASMI (Fast of Shared Multidimensional Information), На основе анализа правил Кодда, Найджелом Пендсом (Nigel Pendse) и Ричардом Критом (Richard Creeth) в 1995 г. были сформулирован тест FASMI (Fast of Shared Multidimensional Information), который определил OLAP-системы следующими пятью ключевыми признаками: Fast (Быстрый), Analysis (Анализ), Shared (Разделяемой), Multidimensional (Многомерной), Information (Информации): FAST FAST (Быстрый) OLAP-система должна обеспечивать выдачу большинства ответов пользователям в пределах приблизительно 5 с. При этом самые простые запросы обрабатываются в течение 1 с, и очень немногие более 20 с. ANALYSIS ANALYSIS (Анализ) OLAP-система должна справляться с любым логическим и статистическим анализом, характерным для данного приложения, и обеспечивать его сохранение в виде, доступном для конечного пользователя. SHARED SHARED (Разделяемой) OLAP-система должна выполнять все требования защиты конфиденциальности (возможно, до уровня ячейки хранения данных). Если множественный доступ для записи необходим, обеспечивается блокировка модификаций на соответствующем уровне. MULTIDIMENSIONAL MULTIDIMENSIONAL ( Многомерной) OLAP-система должна обеспечить многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий, обеспечивающих наиболее логичный способ анализа. INFORMATION INFORMATION (Информации) OLAP-система должна обеспечивать получение необходимой информации в условиях реального приложения. Мощность различных систем измеряется не объемом хранимой информации, а количеством входных данных, которые они могут обработать. В этом смысле мощность продуктов весьма различна. Большие OLAP- системы могут оперировать по крайней мере в 1000 раз большим количеством данных по сравнению с простыми версиями OLAP-систем.

Сопоставление систем: OLTP и OLAP_1 Характеристика Требования к OLTP- системе Требования к системе анализа Степень детализации хранимых данных Хранение только детализированных данных Хранение как детализированных, так и обобщенных данных Качество данных Допускаются неверные данные из-за ошибок ввода Не допускаются ошибки в данных Формат хранения данных Может содержать данные в разных форматах в зависимости от приложений Единый согласованный формат хранения данных Допущение избыточных данных Должна обеспечиваться максимальная нормализация Допускается контролируемая денормализация (избыточность) для эффективного извлечения данных Управление данными Должна быть возможность в любое время добавлять, удалять и изменять данные Должна быть возможность периодически добавлять данные

Сопоставление систем: OLTP и OLAP_2 Характеристика Требования к OLTP- системе Требования к системе анализа Количество хранимых данных Должны быть доступны все оперативные данные, требующиеся в данный момент Должны быть доступны все данные, накопленные в течение продолжительного интервала времени Характер запросов к данным Доступ к данным пользователей осуществляется по заранее составленным запросам Запросы к данным могут быть произвольные и заранее не оформлены Время обработки обращений к данным Время отклика системы измеряется в секундах Время отклика системы может составлять несколько минут Характер вычислительной нагрузки на систему Постоянно средняя загрузка процессора Загрузка процессора формируется только при выполнении запроса, но на 100 % Приоритетность характеристик системы Основными приоритетами являются высокая производительность и доступность Приоритетными являются обеспечение гибкости системы и независимости работы пользователей

Концепция хранилища данных_1 Систематизированное изложение концепции хранилища данных было сделано в 1992 г"Построение хранилищ данных" г. Уильман Г. Инмоном в монографии "Построение хранилищ данных". Хранилище данных Хранилище данных предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений. В основе концепции ХД лежит идея разделения данных, используемых для оперативной обработки и для решения задач анализа. Структура системы автоматизированных исследований с физическим ХД Система АИ

Концепция хранилища данных_2 Виртуальные ХД. достоинствами Виртуальные ХД. Основными достоинствами виртуального ХД являются: - - минимизация объема памяти, занимаемой на носителе информацией; - - работа с текущими, детализированными данными Структура системы автоматизированных исследований с виртуальным ХД Недостатки: - - время обработки запросов к виртуальному ХД значительно превышает соответствующие показатели для физического хранилища; - - интегрированный взгляд на виртуальное хранилище возможен только при выполнении условияпостоянной доступности всех ОИД; - - выполнение сложных аналитических запросов над ОИД занимает большой объем ресурсов компьютеров, на которых они работают; - - различные ОИД могут поддерживать разные форматы и кодировки данных. Часто на один и тот же вопрос может быть получено несколько вариантов ответа. Это может быть связано с не синхронностью моментов обновления данных в разных ОИД; - - главный недостаток виртуального хранилища – практическая невозможность получения данных за долгий период времени Система АИ

Концепция хранилища данных_3 Основные проблемы создания ХД: - - необходимость интеграции данных из неоднородных источников в распределенной среде; - - потребность в эффективном хранении и обработке очень больших объемов информации; - - необходимость наличия многоуровневых справочников метаданных; - - повышенные требования к безопасности данных Витрина данных (ВД) Витрина данных (ВД) это упрощенный вариант ХД, содержащий только тематически объединенные данные Достоинствами ВД: - - проектирование ВД для ответов на определенный круг вопросов; - - быстрое внедрение автономных ВД и получение отдачи; - - упрощение процедур заполнения ВД и повышение их производительности за счет учета потребностей определенного круга пользователей Недостатками автономных ВД: - - многократное хранение данных в разных ВД, что приводит к увеличению расходов на их хранение и потенциальным проблемам, связанным с необходимостью поддержания непротиворечивости данных; - - отсутствие консолидированности данных на уровне предметной области, а следовательно отсутствие единой картины

Концепция хранилища данных_4 Структура системы автоматизированных исследований с самостоятельными ВД Система АИ

Концепция хранилища данных_5 Структура системы АИ с самостоятельными ХД и ВД Достоинства: - - простота создания и наполнения ВД, поскольку наполнение происходит из единого стандартизованного надежного источника очищенных данных из ХД; - - простота расширения системы АИ за счет добавления новых ВД; - - снижение нагрузки на основное ХД.Недостатки: - - избыточность (данные хранятся как в ХД, так и в ВД); - - дополнительные затраты на разработку системы АИ с ХД и ВД. Система АИ

Организация хранилищ данных трикатегории: Все данные в ХД делятся на три основные категории: - - детальные данные; - - агрегированные данные; - - метаданные Архитектура ХД Система АИ

Репозиторий метаданных Для удобства работы с ХД необходима информация о содержащихся в нем данных. Такая метаданными (данные о данных). информация называется метаданными (данные о данных). что, кто, где, как, когда и Метаданные должны отвечать на следующие вопросы что, кто, где, как, когда и почему почему: - что - что (описание объектов) метаданные описывают объекты предметной области, информация о которых хранится в ХД. Такое описание включает: атрибуты объектов, их возможные значения, соответствующие поля в информационных структурах ХД, источники информации об объектах и т. п.; - кто - кто (описание пользователей) метаданные описывают категории пользователей, использующих данные. Они описывают права доступа к данным, а также включают в себя сведения о пользователях, выполнявших над данными различные операции (ввод, редактирование, загрузку, извлечение и т. п.); - где - где (описание места хранения) метаданные описывают местоположение серверов, рабочих станций, ОИД, размещенные на них программные средства и распределение между ними данных; - как - как (описание действий) метаданные описывают действия, выполняемые над данными. Описываемые действия могли выполняться как в процессе переноса из ОИД (например, исправление ошибок, расщепление полей и т. п.), так и в процессе их эксплуатации в ХД; - когда - когда (описание времени) метаданные описывают время выполнения разных операций над данными (загрузка, агрегирование, архивирование, извлечение и т.п.); - почему - почему (описание причин) метаданные описывают причины, повлекшие выполнение над данными тех или иных операций. Такими причинами могут быть требования пользователей, статистика обращений к данным и т. п.

ETL-процесс (E – extraction, T – transformation, L – loading) ETL-процесс Преобразование данных: Преобразование данных: - обобщение данных (aggregation); - перевод значений (value translation) в ОИД данные часто хранятся в закодированном виде для того, чтобы сократить избыточность данных и память для их хранения; - создание полей (field derivation); - очистка данных (cleaning). Загрузка данных Загрузка данных после того как данные преобразованы для размещения в ХД, осуществляется этап их загрузки. При загрузке выполняется запись преобразованных детальных и агрегированных данных. Кроме того, при записи новых детальных данных часть старых может переноситься в архив Система АИ

Очистка данных проблемы очистки данных классифицируютуровням: Основные проблемы очистки данных классифицируют по следующим уровням: уровень ячейки таблицы; - уровень записи; - - уровень таблицы БД; - - уровень одиночной БД; - - уровень множества БД. очистка данных включает несколько этапов: В целом, очистка данных включает несколько этапов: - - выявление проблем в данных; - - определение правил очистки данных; - - тестирование правил очистки данных; - - непосредственная очистка данных. Непосредственная очистка данных. Непосредственная очистка данных. На этом этапе выполняются преобразования в выполняется в два приема соответствии с определенными ранее правилами. Очистка выполняется в два приема: - - сначала устраняются проблемы, связанные с отдельными источниками данных, - - за тем устраняются проблемы множества БД. Над отдельными ОИД выполняются следующие процедуры Над отдельными ОИД выполняются следующие процедуры: - - проверка допустимости и исправления; - - стандартизация; - - исключение дубликатов

Многомерная модель данных_1 Э. Ф. Кодд основоположник реляционной модели БД рассмотрел ее недостатки, указав в "объединять, просматривать и анализировать первую очередь на невозможность "объединять, просматривать и анализировать данные с точки зрения множественности измерений, т. е. самым понятным для аналитиков способом". Измерение Измерение это последовательность значений одного из анализируемых параметров. Каждое измерение может быть представлено в виде иерархической структуры. Например, измерение "Исполнитель" может иметь следующие иерархические уровни: "предприятие подразделение отдел служащий". Более того, некоторые измерения могут иметь несколько видов иерархического представления. Например, измерение "время" может включать две иерархии со следующими уровнями: "год квартал месяц день" и "неделя день" На пересечениях осей измерений (Dimensions) располагаются данные меры На пересечениях осей измерений (Dimensions) располагаются данные, количественно характеризующие анализируемые факты, меры (Measures). Это могут быть объемы продаж, выраженные в единицах продукции или в денежном выражении, остатки на складе, издержки и т. п.

Многомерная модель данных_2 Над гиперкубом могут выполняться следующие операции: - Срез (Slice) - Срез (Slice) формируется подмножество многомерного массива данных, соответствующее единственному значению одного или нескольких элементов измерений, не входящих в это подмножество; - Вращение (Rotate) - Вращение (Rotate) изменение расположения измерений, представленных в отчете или на отображаемой странице

Многомерная модель данных_3 Над гиперкубом могут выполняться следующие операции: - Консолидациядетализация - Консолидация (Drill Up) и детализация (Drill Down) операции, которые определяют переход вверх по направлению от детального (down) представления данных к агрегированному (up) и наоборот, соответственно. Направление детализации (обобщения) может быть задано как по иерархии отдельных измерений, так и согласно прочим отношениям, установленным в рамках измерений или между измерениями Консолидация Детализация

Архитектура OLAP-систем OLAP-система включает в себя два основных компонента: - OLAP-сервер - OLAP-сервер обеспечивает хранение данных, выполнение над ними необходимых операций и формирование многомерной модели на концептуальном уровне. В настоящее время OLAP-серверы объединяют с ХД или ВД; - OLAP-клиент - OLAP-клиент представляет пользователю интерфейс к многомерной модели данных, обеспечивая его возможностью удобно манипулировать данными для выполнения задач анализа. OLAP-серверы скрывают от конечного пользователя способ реализации многомерной модели. Они формируют гиперкуб, с которым пользователи посредством OLAP-клиента выполняют все необходимые манипуляции, анализируя данные. Между тем способ реализации очень важен, т. к. от него зависят такие характеристики, как производительность и занимаемые ресурсы. Выделяют три основных способа реализации OLAP-серверов Выделяют три основных способа реализации OLAP-серверов : -MOLAP - MOLAP для реализации многомерной модели используют многомерные БД; -ROLAP - ROLAP для реализации многомерной модели используют реляционные БД; -HOLAP - HOLAP для реализации многомерной модели используют и многомерные и реляционные БД.

Архитектура OLAP-систем: MOLAP MOLAP-серверы гиперкубы и поликубы MOLAP-серверы используют для хранения и управления данными многомерные БД. При этом данные хранятся в виде упорядоченных многомерных массивов. Такие массивы подразделяются на гиперкубы и поликубы. гиперкубе В гиперкубе все хранимые в БД ячейки имеют одинаковую размерность, т.е. находятся в максимально полном базисе измерений. поликубе В поликубе каждая ячейка хранится с собственным набором измерений, и все связанные с этим сложности обработки перекладываются на внутренние механизмы системы. Физически данные, представленные в многомерном виде, хранятся в "плоских" файлах. При этом куб представляется в виде одной плоской таблицы, в которую построчно вписываются все комбинации членов всех измерений с соответствующими им значениями мер Достоинства: - - высокая скорость обработки данных.Недостатки: - - за счет денормализации и предварительно выполненной агрегации объем данных в многомерной БД в 2, раз меньше объема исходных детализированных данных; - - информационный гиперкуб является сильно разреженным; - - многомерные БД чувствительны к изменениям в многомерной модели. При добавлении нового измерения приходится изменять структуру всей БД, что влечет за собой большие затраты времени.

Архитектура OLAP-систем: ROLAP ROLAP-серверы ROLAP-серверы используют реляционные БД. "звезда" "снежинка" В настоящее время распространены две основные схемы реализации многомерного представления данных с помощью реляционных таблиц: схема "звезда" и схема "снежинка" Звезда Снежинка Денормализованная таблица фактов Таблица измерений

Архитектура OLAP-систем: HOLAP ROLAP-серверы ROLAP-серверы используют гибридную архитектуру, которая объединяет технологии ROLAP и MOLAP. В отличие от MOLAP, которая работает лучше, когда данные более-менее плотные, серверы ROLAP показывают лучшие параметры в тех случаях, когда данные довольно разрежены. Серверы HOLAPROLAP MOLAP Серверы HOLAP применяют подход ROLAP для разреженных областей многомерного пространства и подход MOLAP для плотных областей. Серверы HOLAP Серверы HOLAP разделяют запрос на несколько подзапросов, направляют их к соответствующим фрагментам данных, комбинируют результаты, а затем предоставляют результат пользователю. Основные производители OLAP-систем: - SAS Институт, - SAS Институт, - Компания ORACLE, - Компания ORACLE, - Компания Microsoft, - Компания Microsoft, - Компания «Прогноз» - Компания «Прогноз»

OLAP-система SAS-института_0 Рассмотрите подробнее предлагаемые нами продукты: SAS System AppDev Studio Base SAS Enterprise Guide Enterprise Miner Enterprise Reporter (English)Enterprise Reporter JMP Software (English)JMP Software SAS/ACCESS (English)SAS/ACCESS SAS/AF (English)SAS/AF SAS/ASSIST (English)SAS/ASSIST SAS/C Compiler (English)SAS/C Compiler SAS/CONNECT (English)SAS/CONNECT SAS/EIS SAS/ETS (English)SAS/ETS SAS Financial Management Solutions SAS/FSP (English)SAS/FSP SAS/GIS SAS/GRAPH (English)SAS/GRAPH SAS Human Capital Management SAS/IML (English)SAS/IML SAS/INSIGHT (English)SAS/INSIGHT SAS Integration Technologies SAS/IntrNet SAS IT Charge Management (English)SAS IT Charge Management SAS IT Resource Management (English)SAS IT Resource Management SAS/LAB (English)SAS/LAB SAS/MDDB Server (English)SAS/MDDB Server SAS OnLineTutor (English)SAS OnLineTutor SAS/OR (English)SAS/OR SAS/QC (English)SAS/QC SAS Risk Management SAS/SECURE (English)SAS/SECURE SAS/SHARE SAS/SPECTRAVIEW (English) SAS/SPECTRAVIEW SAS/STAT (English)SAS/STAT SAS Strategic Performance Management (English)SAS Strategic Performance Management SAS/TOOLKIT (English)SAS/TOOLKIT SAS/TUTOR (English)SAS/TUTOR SAS/Warehouse Administrator SAS Universal ODBC Driver (English) SAS Universal ODBC Driver Scalable Performance Data Server StatView Software (English)StatView Software SYSTEM 2000 software (English)SYSTEM 2000 software webAF WebHound webEIS

OLAP-система SAS-института_1 SAS включает свыше 20 различных программных продуктов, объединенных друг с другом Information Delivery System «средствами доставки информации» (Information Delivery System, или IDS), так что весь SAS/IDS. пакет иногда обозначается как SAS/IDS. SAS/IDS SAS/IDS это система комплексной интеграции разнообразных возможностей доступа к данным и управления ими, а также средств анализа данных, способов представления информации, генерации отчетов и визуализации результатов обработки информационных материалов SAS/IDS В составе системе SAS/IDS функционируют следующие компоненты (модули системы): BASE SAS BASE SAS ядро системы со встроенным языком программирования 4GL и языком работы с базами данных SQL, средства управления данными, поддержки индексов для баз данных, возможностями доступа к широкому набору форматов данных, процедуры описательной статистики и генерации отчетов. FSP FSP - обеспечивает доступ к данным, ввод, редактирование, преобразование данных, генерацию отчетов и деловую переписку. GRAPH GRAPH - содержит деловую, научную, рекламную графику, различные шрифты и карты. STAT STAT - включает в себя многофункциональный набор статистических процедур анализа данных.

OLAP-система SAS-института_2 SAS включает свыше 20 различных программных продуктов, объединенных друг с другом Information Delivery System «средствами доставки информации» (Information Delivery System, или IDS), так что весь SAS/IDS. пакет иногда обозначается как SAS/IDS. Дополнительные модули: 1ML 1ML - представляет собой интерактивный матричный язык программирования для выполнения углубленных математических, инженерных и статистических расчетов. Этот язык дает возможность математику легко программировать свои собственные процедуры, используя язык, близкий к языку линейной алгебры. LAB LAB - предоставляет пользователю экспертную поддержку. В частности, здесь система подсказывает пользователю, выполняются или нет предположения, лежащие в основе того или иного метода анализа данных. ASSIST ASSIST - служит средством для обеспечения интерактивного доступа пользователей к различным возможностям системы SAS/IDS. EIS EIS - является меню-управляемым инструментом разработки и поддержки интерактивных исполняемых информационных систем методом объектно-ориентированной технологии. С помощью этого модуля легко настроить систему на собственные данные и формы представления результатов. ACCESS ACCESS - дает возможность конструировать отдельные интерфейсы для связи SAS/IDS с самыми разнообразными СУБД (ADABAS, DB2, ORACLE, SQL/DS и др.). INSIGHT INSIGHT - представляет собой интерактивный инструмент для графического анализа данных

OLAP-система SAS-института_3 Стратегия SAS в области интеграции данных предполагает их преобразование в обобщенный ресурс – независимо от того, на какой платформе эти данные хранятся. SAS ETLQ SAS ETLQ (Extraction, Transformation, Load integrated with Data Quality – извлечение, преобразование, загрузка интегрированные с поддержкой качества данных) представляет собой платформу интеграции, позволяющую клиентам извлекать их из любого источника – в том числе таких приложений, как Oracle, PeopleSoft, Siebel и SAP, а также их различных реляционных, нереляционных и других систем хранения данных. По существу, где бы данные ни хранились, SAS располагает инструментами для доступа к ним и их анализа. SEMMA выборка, исследование, изменение, моделирование и оценка Инструменты пакета реализуют провозглашенную SAS методологию работы с данными - методологию SEMMA (Sample, Explore, Modify, Model, and Assess - выборка, исследование, изменение, моделирование и оценка). Enterprise Miner Компонент Enterprise Miner является заглавной составляющей общего семейства систем анализа данных, которые предлагает компания SAS. Он в полном объеме реализует методологию SEMMA в работе с данными. Enterprise Miner В Enterprise Miner : функции выборки (Sample)Input Data Source, Sampling и Data Partition функции выборки (Sample) собраны в узлах Input Data Source, Sampling и Data Partition (Источник входных данных, Выборка и Разбиение данных) этого продукта. Sampling В узле Sampling размещены функции простой случайной выборки, выборки всех n- ных элементов, расслоенной (стратифицированной) выборки, выборки первых n элементов и групповой выборки. Data Partition Input Data Source Узел Data Partition позволяет разбить исследуемый набор данных на подмножества для обучения, тестирования и проверки. В сочетании с Input Data Source этот узел предоставляет удобный в работе набор функций доступа к данным.

OLAP-система SAS-института_4 Enterprise Miner В Enterprise Miner : Функции исследования (Explore)Distribution Explorer, SAS InsightLink Analysis Функции исследования (Explore) размещаются в узлах Distribution Explorer, SAS Insight, а также в узле Link Analysis. Noninteractive ExploreMultiplot, AssociationVariable Selection К категории Noninteractive Explore относятся Multiplot, Association и Variable Selection. Multiplot Multiplot это узел простых неинтерактивных графических операций, позволяющий создавать диаграммы и гистограммы. Association Узел Association позволяет определять традиционные правила ассоциаций и последовательных цепочек. Variable Selection Узел Variable Selection служит для автоматического или ручного выбора входных переменных. В нем можно выполнить оценки критерия хи-квадрат и R-квадрат для автоматического определения наиболее важных входных переменных при попытке создания моделей прогноза интервальных или двоичных значений. Distribution Explorer Distribution Explorer позволяет создавать многомерные гистограммы. Он оптимизирован для эффективной обработки больших наборов данных и позволяет интерактивно вращать и перемещать объемные диаграммы. Insight Узел Insight это ссылка на систему SAS Insight, интерактивное средство исследования и анализа данных. Distribution ExplorerInsightDistribution Explorer Insight Узлы Distribution Explorer и Insight взаимно дополняют друг друга: Distribution Explorer применяется для исследования очень больших наборов данных с ограниченной графической поддержкой, а Insight для тщательных изысканий в меньших, более тщательно отобранных подмножествах данных.

OLAP-система SAS-института_5 Enterprise Miner В Enterprise Miner : Функции модификации (Modify) Функции модификации (Modify) позволяют: 1. (Data Set Attributes) (Transform and Replace Variables) (Filter Outliers), узлов Cluster и SOM/Kohonen 1. Управлять атрибутами наборов данных (Data Set Attributes), выполнять преобразования и замену переменных (Transform and Replace Variables) и фильтрацию выбросов (Filter Outliers), а также проводить кластеризацию данных (разбиение на кластеры). Для этих операций используются программные средства узлов Cluster и SOM/Kohonen (самоорганизующиеся схемы Кохонена). 2. Time Series. 2. Преобразовывать транзакционные данные во временные ряды с помощью нового (экспериментального) узла Time Series. Data Set Attribute Узел Data Set Attribute это инструмент создания и использования набора данных для просеивания. Transform В узле Transform можно создавать из существующих переменных новые. Replace Узел Replace применяется для преобразования существующих или восстановления недостающих значений. Filter Outliers Узел Filter Outliers служит для работы с интервальными переменными и переменными типа категория и предоставляет автоматические и ручные методы удаления выбросов.

OLAP-система SAS-института_6 Enterprise Miner В Enterprise Miner : - кластеризация рассматривается как функция «модификации» данных, а не «моделирования». Возможно, это объясняется тем, что чаще всего кластеризация применяется для деления набора данных на группы для дальнейшего анализа. Cluster SOM/Kohonen - есть два узла для выполнения кластеризации Cluster (рекомендуемый) и SOM/Kohonen. Cluster Узел Cluster это просто ссылка на процедуру SAS Fastclus, которая позволяет эффективно распределять очень большие наборы данных на взаимоисключающие кластеры. SOM/Kohonen Узел SOM/Kohonen используется преимущественно для выделения признаков и сокращения размерности, особенно в случаях, когда переменные характеризуются высокой степенью нелинейных отношений.

OLAP-система SAS-института_7 Enterprise Miner В Enterprise Miner : Regression, Tree, Neural Network, Principal Components/DMNeural, Memory-Based Reasoning, Two-Stage, Ensemble и User Defined. К функциям моделирования (Model) относятся узлы Regression, Tree, Neural Network, Principal Components/DMNeural, Memory-Based Reasoning, Two-Stage, Ensemble и User Defined. Regression Узел Regression позволяет выполнять стандартные линейную и логистическую регрессии, причем в нем доступны почти все функции основного модуля SAS/Stat. Tree Задача узла Tree создание деревьев решений с использованием составного алгоритма, в который SAS включила некоторые возможности алгоритмов CHAID и CART. Это позволяет выполнять как автоматическое, так и интерактивное обучение. Principal Components/DMNeural Имя узла Principal Components/DMNeural указывает на то, что речь здесь идет о комбинации анализа главных компонентов (principal component analysis, PCA) и нейронных сетей. PCA популярная методика для выделения признаков. Поскольку алгоритмы нейронных сетей чувствительны к объемам наборов входных переменных и переменных со многими возможными значениями (большие области определения), в них обычно используется PCA или другие методы выделения признаков или сокращения размерности. Размещение указанных операций в этом узле оказывается весьма удобным для пользователя. Two-Stage Two-Stage это действительно составная модель, в ней объединены классовая и интервальная модели прогнозирования. Узел хорошо приспособлен для разработки моделей, предназначенных для решения задач типа: «Станет ли покупатель A приобретать товар X (да/нет), и если да, то сколько (количество/объем)?». Ensemble В узле Ensemble результаты отдельных моделей (апостериорная вероятность или прогнозируемые величины) объединяются в единый составной результат. Объединения могут быть как гомогенными, так и гетерогенными.

OLAP-система SAS-института_8 Enterprise Miner В Enterprise Miner : AssessReporter Узел оценки (Assess) делится на два подузла Assess и Reporter. Assess Подузел Assess это комплексный модуль для сравнения ожидаемых результатов моделей с реальной производительностью или моделей между собой. Reporter Подузел Reporter автоматически генерирует HTML-отчеты о потоках завершенных проектов добычи данных. Интеллектуальность этого узла заключается в этом, что он «понимает» свое место в рамках конкретного проектного потока и создает отчеты с разной детализацией в зависимости от своего местоположения и входных данных. Enterprise MinerData Mining Database Помимо прочего, в Enterprise Miner включена база данных Data Mining Database (DMDB) для хранения уже добытых результатов. DMDB это особый набор данных SAS, оптимизированный для операций по добыче данных. Хранение предварительно рассчитанных статистических данных в DMDB позволяет алгоритмам Enterprise Miner не выполнять эти операции и сэкономить на многих «проходах» по данным.

OLAP-система компании ORACLE_1

OLAP-система компании ORACLE_2 В качестве механизма хранения в реляционных Хранилищах и Витринах Данных Oracle9i (Oracle10i),Express Server используется сервер Oracle9i (Oracle10i), в многомерных Витринах - Express Server. Oracle Warehouse Builder Инструментальное средство Oracle Warehouse Builder, построенное на базе современной архитектуры Common Warehouse Metadata, позволяет спроектировать структуру целевого Хранилища, создать процедуры извлечения, согласования и загрузки данных из различных Discoverer источников и сгенерировать метаданные для средств доступа, таких как Discoverer и Express Express. Oracle Designer Для проектирования Хранилища можно также использовать Oracle Designer, а затем Warehouse автоматически перенести описание проекта в репозиторий метаданных Warehouse Builder Builder. Средства доступа к данным покрывают весь спектр аналитических задач: для стандартной Reports отчетности используется Reports, для генерации нерегламентированных отчетов и запросов DiscovererExpress - Discoverer, для сложного многомерного анализа - продукты семейства Express, а для задач Darwin Data Mining Suite "извлечения знаний" - Darwin Data Mining Suite. Существуют готовые аналитические приложения для решения специализированных задач Sales Analyzer, Financial Analyzer, Activa и Balanced Scorecard - Sales Analyzer, Financial Analyzer, Activa и Balanced Scorecard. В настоящее время Demand Planning, Value готовятся к выпуску новые аналитические приложения, такие как Demand Planning, Value Based Management Based Management и другие. Конечные пользователи могут получать информацию как с помощью традиционных клиент-серверных технологий, так и в Интранет-архитектуре с использованием Application Server масштабируемого сервера приложений Application Server.

OLAP-система компании ORECLE_3 Oracle Warehouse Builder Oracle Warehouse Builder - многофункциональная расширяемая среда для разработки и развертывания корпоративных Хранилищ и Витрин Данных: Продукт позволяет визуально моделировать схему Хранилища либо импортировать описывающие ее метаданные из репозитория Oracle Designer В Warehouse Builder включены возможности визуального определения отображений между источниками и Хранилищем и последующей генерации на их основе модулей загрузки данных в виде процедур PL/SQL или с использованием SQL*Loader Используемый в сочетании с Warehouse Builder продукт Oracle Pure*Integrate предоставляет мощные средства автоматической очистки данных, включающие алгоритмы нечеткой логики, синтаксический разбор имен и адресов, вероятностные модели и т.д Источниками данных для Warehouse Builder, помимо СУБД Oracle различных версий, могут быть плоские файлы, СУБД других производителей (доступ через шлюзы и ODBC), файловые системы мэйнфреймов (через шлюзы либо продукт Oracle Pure*Extract), а также приложения ERP (через компоненты Integrator for Oracle Applications, SAP R/3 и др.) Открытая архитектура Common Warehouse Metadata позволяет осуществлять обмен метаданными между Warehouse Builder и средствами бизнес-анализа - Discoverer и Express. Oracle Reportsстандартных Oracle Reports - это инструмент создания и публикации стандартных отчетов с помощью визуального интерфейса. Oracle Reports позволяет распространять информацию, используя Web-архитектуру Oracle Discoverer Oracle Discoverer - это инструмент для получения произвольных отчетов, формирования нерегламентированных запросов и анализа данных, который дает бизнес-пользователям всех уровней быстрый и удобный доступ к информации, содержащейся в реляционных Хранилищах и Витринах Данных, а также в OLTP-системах (в том числе не обязательно реализованных на СУБД Oracle).

OLAP-система компании ORECLE_4 Oracle Discoverer Существует несколько редакций Oracle Discoverer для разных категорий пользователей. 1.Discoverer Administration Edition 1. Discoverer Administration Edition предназначен для создания и администрирования слоя метаданных, а также для разграничения прав доступа к данным и функциональным возможностям Discoverer на уровне каждого конечного пользователя. 2. Discoverer User Edition 2. Discoverer User Edition - это генератор интерактивных отчетов для конечного пользователя, позволяющий ему формулировать свои потребности в информации в терминах бизнес-области и не требующий от него знания языка SQL. Встроенные Мастера позволяют определять условия-фильтры, итоги и подитоги, вычислимые поля и т.д., а также представлять информацию в графическом виде. Существует "тонкий" клиент с ограниченной функциональностью - Discoverer Viewer, предназначенный для просмотра отчетов, созданных в User Edition.

OLAP-система компании ORECLE_5 Продукты Oracle Express Продукты Oracle Express предназначаются для решения аналитических задач высокого уровня, связанных со сложными расчетами, прогнозированием, моделированием сценариев "что-если" и т.д. Эти продукты используют особую технология. Она реализована в виде семейства OLAP-продуктов Oracle Express, включающего в себя: - - специальный сервер многомерных БД, - - инструментарий администрирования, - - средства разработки в среде клиент-сервер и Web, - - готовые аналитические приложения, ориентированные на конкретные функциональные задачи, такие как анализ продаж и маркетинговые исследования, финансовый анализ и бюджетное планирование. Oracle Express Server Oracle Express Server использует многомерную модель данных. Express Server Express Server имеет механизм аналитический вычислений, включающий в себя более сотни встроенных функций - математических, статистических, функций анализа временных рядов, финансовых и других. Express SPL Разработчики могут расширять аналитические возможности путем создания собственных функций на процедурном языке Express SPL

OLAP-система компании ORECLE_6 Express Server, Personal Express Существует версия Express Server, работающая на персональном компьютере под управлением Windows 95/98/NT, - Personal Express. С точки зрения архитектуры, модели данных и аналитических возможностей эти продукты абсолютно идентичны. Personal Express Personal Express используется прежде всего мобильными пользователями, отсоединенными от корпоративной сети. Oracle Express Administrator Oracle Express Administrator является инструментом построения и администрирования многомерных Витрин Данных. Это визуальная среда разработчика для создания, модификации и управления объектами БД Express, а также загрузки данных из различных источников. Express Relational Access Manager Express Relational Access Manager используется для динамического доступа к реляционным Хранилищам и Витринам. Он позволяет реализовывать произвольные схемы хранения данных - ROLAP (реляционный OLAP), MOLAP (многомерный OLAP) или HOLAP (гибридный OLAP). Express Relational Access Administrator Express С помощью графической утилиты Express Relational Access Administrator создается структура многомерной базы данных, а затем, используя drag-and-drop, устанавливает соответствие между объектами Express и структурами реляционного Хранилища Express Relational Access Manager Warehouse Builder Express Relational Access Manager – инструмент генерация метаданных непосредственно на основе структуры Хранилища, описанной в репозитории Warehouse Builder

OLAP-система компании ORECLE_7 Oracle Express Analyzer Oracle Express Analyzer - средство конечного пользователя, предназначенное для самостоятельного построения отчетов, анализа многомерных данных Express и публикации результатов на Web. Основным понятием в Express Analyzer является брифинг - набор страниц, содержащих динамические интерактивные отчеты в табличном и графическом виде, кнопки с привязанными к ним действиями (например, печать или экспорт в Excel) и OLE-объекты. Oracle Express Objects Oracle Express Objects - объектно-ориентированная графическая среда, предназначенная для быстрой разработки полнофункциональных OLAP-приложений в среде клиент/сервер. В качестве языка управления объектами в Express Objects используется Express Basic, синтаксически совместимый с Microsoft Visual Basic. Oracle Express Spreadsheet Add-In. Oracle Express Spreadsheet Add-In. Кроме Express Analyzer или Express Objects, Express Spreadsheet Add-In пользователи могут получать динамический доступ к многомерным данным, используя в качестве интерфейса Microsoft Excel. Специальная компонента Express Spreadsheet Add-In дополняет стандартные возможности этой электронной таблицы функциональностью OLAP, позволяя с помощью простого Мастера строить в среде Excel интерактивные многомерные отчеты.

OLAP-система компании ORECLE_8 Технология Express Технология Express позволяет пользователям проводить интерактивный анализ не только в среде клиент-сервер, но и в архитектуре Web Oracle Express Web Agent Express Server Express Серверная компонента Oracle Express Web Agent, состоящая из интерфейсного модуля к Express Server и набора Java- апплетов для визуализации и работы с данными, предоставляет все возможности OLAP, не требуя программного обеспечения Express на персональном компьютере Oracle Financial Analyzer Oracle Financial Analyzer - интегрированное решение для формирования финансовой отчетности, анализа, прогнозирования, составления и контроля исполнения бюджетов. Oracle Sales Analyzer Oracle Sales Analyzer - приложение масштаба предприятия, предназначенное для анализа продаж и маркетинговых исследований. В продукт встроен графический инструментарий для построения индикаторов эффективности и других показателей, таких как динамика продаж, доля рынка, различные индексы, результаты нарастающим итогом, скользящее среднее, сдвиги по времени и т. д. Darwin "data mining" Инструментальная среда Darwin предназначена для анализа данных методами, относящимися к технологии "data mining" (извлечение знаний).

OLAP-система компании «Прогноз»_1

OLAP-система компании «Прогноз»_2

OLAP-система компании «Прогноз»_3

OLAP-система компании «Прогноз»_4

OLAP-система компании «Прогноз»_5