Дисциплина : «Экономическая информатика» Лекция 9. Введение в основы проектирования баз данных РОССИЙСКАЯ АКАДЕМИЯ НАРОДНОГО ХОЗЯЙСТВА И ГОСУДАРСТВЕННОЙ.

Презентация:



Advertisements
Похожие презентации
База данных – информационная модель, позволяющая упорядоченно хранить данные о группе объектов, обладающих одинаковым наборов свойств Базы данных Фактографические.
Advertisements

СУБД Базы данных. Информационная система Совокупность базы данных и всего комплекса аппаратно- программных средств для ее хранения, изменения, и поиска.
© М.Е.Макарова
Базы данных Реляционная база данных MS Access. Повторение База данных организованная совокупность данных из какой-либо предметной области, предназначенная.
Базы данных Учитель информатики МАОУ "СОШ 55" г. Пермь Бадьина Лариса Ивановна.
Муниципальное общеобразовательное учреждение Онохойская средняя общеобразовательная школа 2 Разработал : учитель информатики и ИКТ Потёмкина С. А.
Базы данных Назначение и основные функции Гусельникова Е.В. МБОУ Лицей 130 имени академика М.А.Лаврентьева Новосибирск, 2011.
Организация данных в виде отдельных файлов Файл с данными по договорам договора Дата Организация Директор Адрес Телефон Файл с данными по письмам исх/вх.
Билет Табличные базы данных (БД): основные понятия (поле, запись, первичный ключ записи); типы данных. Системы управления базами данных и принципы.
БАЗА ДАННЫХ – ОСНОВА ИНФОРМАЦИОННОЙ СИСТЕМЫ ТЕХНОЛОГИЯ ИСПЛЬЗОВАНИЯ И РАЗРАБОТКА ИНФОРМАЦИОННЫХ СИСТЕМ.
База данных (БД) – основа информационных систем(ИС)
База данных – это совокупность структурированных данных определенного назначения. Структурирование данных – это объединение данных по определенным параметрам.
Базы данных. Системы управления базами данных (СУБД)
Системы управления базами данных БД – это информационная модель, позволяющая в упорядоченном виде хранить данные о группе объектов, обладающих одинаковым.
Виды моделей данных. Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности.
Технология хранения, поиска и сортировки информации. Работу выполнили ученики 11 класса: Черных Елена и Навезнев Алексей.
База данных – это: а) специальным образом организованная и хранящаяся на внешнем носителе совокупность взаимосвязанных данных о некоторых объектах; б)
ВИДЫ МОДЕЛЕЙ ДАННЫХ. Ядром любой базы данных является модель данных. Модель данных представляет собой множество структур данных, ограничений целостности.
Основные понятия и определения Различные модели данных.
Транксрипт:

Дисциплина : «Экономическая информатика» Лекция 9. Введение в основы проектирования баз данных РОССИЙСКАЯ АКАДЕМИЯ НАРОДНОГО ХОЗЯЙСТВА И ГОСУДАРСТВЕННОЙ СЛУЖБЫ Доктор технических наук, профессор Павлов Алексей Николаевич

Вопросы к экзамену: 1.Дайте определение – «Документ», назовите его основные свойства. 2.Классификация баз данных, особенности их построения. 3.Назначение системы управления базой данных (СУБД). 4.Этапы проектирования базы данных. 5.Особенности реляционных баз данных.

Документ – основа информационных систем Основным инструментом информатизации всех областей человеческой деятельности являются Информационные системы (ИС). ИС включают в себя: информационные ресурсы - документы и массивы документов в информационных системах (библиотеках, архивах, фондах, банках данных, депозитариях, музейных хранилищах и т.д.); информационные массивы, представляющие собой упорядоченную совокупность данных и (или) документов, необходимых для решения задач определенной области деятельности; информационные технологии, которые можно определить как систему методов и способов сбора, хранения, анализа, обработки и передачи информации; дополнительные средства, обеспечивающие реализацию информационных технологий и тем самым функционирование всей ИС (к таким средствам относят программные, технические, лингвистические, правовые, организационные и др.). В документоведении применяется следующее определение документа: Документ - это материальный объект с информацией, закрепленной созданным человеком способом для ее передачи во времени и пространстве (лат. documentum - образец, доказательство, свидетельство).

Виды информационных документов Независимо от формы представления сведений в документе, их объемов и содержания, в информационных системах принято выделять две категории информационных документов. [Федеральный закон "Об обязательном экземпляре документов" от 29 декабря 1994 г. - СЗ РФ (Собрание законодательства Российской Федерации) ¦ 1. Ст.1]: - "ДОКУМЕНТ - материальный объект с зафиксированной на нем информацией в виде текста, звукозаписи или изображения, предназначенный для передачи во времени и пространстве в целях хранения и общественного использования".

Свойства документа Как и всякий объект, документ обладает множеством свойств (отличительных качеств). Наиболее существенные из них следующие: а) атрибутивность документа, т.е. наличие неотъемлемых слагаемых, без которых он существовать не может. Документ как целостная система состоит из двух основных слагаемых - информационной и материальной. Отсутствие одной из составляющих превращает документ в не документ (в устную речь, вещь); б) функциональность документа, т.е. его предназначенность для передачи информации в пространстве и времени. Документ - полифункциональный объект, т.е. он выполняет множество общесистемных и специфических функций, обусловленных разнообразными потребностями общества в информации, знаниях; в) структурность документа, т.е. тесная взаимосвязь его элементов и подсистем, обеспечивающая его целостность и тождественность самому себе, т.е. сохранение основных свойств при различных внешних и внутренних изменениях. Типовую структуру, т.е. одинаковый набор элементов для определенного вида документов, имеют практически все функционирующие в системе социальных коммуникаций документы. Типовая структура документов различных видов определяется специальными стандартами, положениями, инструкциями и т.д. Именно структура обеспечивает эффективность использования и долговременность хранения документа.

Фазы работы с документами в информационной системе

Наименование документа Дата Наименов. товара Кол-во Цена Сумма Товар 1Товар 2 От кого Структуризация документа марта 9 Павлов А.Н. Шариковая ручка (штук) 5 3,50 17,50 Карандаш цветной (коробка) 28 36, ,20 Одна тысяча пятьдесят руб. 1050,70 Любой документ можно представить в виде иерархической структуры, в которой узлы дерева на определенном уровне могут обозначать: А) обозначение элемента в документе; В) обозначение содержимого в элементе. Для хранения значения каждого элемента, необходимо создавать структуру, которая называется моделью данных. Логическая структура документа (семантика)

Представление объекта на естественном языке Например, понятие ШАР Игрушка на елкуВоздушный шарМеталлический шар Класс объекта:ИгрушкиМашиностроениеЛетательные аппараты Описание объекта: Материал, Назначение, Стоимость, Размер, Вес и т.п. Совокупность сведений об объекте представляет из себя информационный образ, на основании которого возможно идентифицировать объект и ему подобные в информационно- поисковых системах (ИПС). Распределение объектов похожих по значению, но используемых в различных областях, осуществляют с помощью классификаторов, которые имеют привязку к конкретной предметной области.

Базы данных (БД) - поименованная совокупность структурированных данных, относящихся к некоторой предметной области или БД – именованная совокупность данных, отображающая состояние объектов и их отношений в рассматриваемой предметной области. По виду хранимых данных различают: фактографические БД; документальные БД. По способу структуризации данных различают: иерархические сетевые; реляционные (табличные). Банк данных – БД и управляющая ею система управления базой данных.

Пример построения модели иерархической базы данных Иерархическая модель данных представление базы данных в виде древовидной (иерархической) структуры, состоящей из объектов (данных) различных уровней. Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня). По принципу иерархической БД построены иерархические файловые системы и Реестр Windows.

Пример построения модели сетевой базы данных Сетевая модель данных опирается на математическую теорию направленных графов. Базовыми элементами сетевой модели являются: · Элемент данных – минимальная информационная единица доступная пользователю. · Агрегат данных – именованная совокупность элементов данных внутри записи или другого агрегата. Агрегат бывает двух видов – агрегат типа вектор и агрегат типа повторяющаяся группа.

Пример модели реляционной базы данных Студенты ФамилияГод рожд Группа Алферова Маркелов Сафина Преподаватели ФамилияПредмет ДанчулМатематика ПавловИнформатика СафоноваМатематика Сводная ведомость ДисциплинаСтудентОценкаДата сдачи Информатика1зачет Математика2Отл Математика3зачет Информатика4Хор Термин «реляционный» означает, что теория основана на математическом понятии отношение (relation). В качестве неформального синонима термину «отношение» часто встречается слово таблица. Модель реляционной базы данных представляет данные в виде таблиц, разбитых на строки и столбцы, на пересечении которых находятся данные.

Схема взаимодействия пользователя с базой данных Запросы на поиск информации Ввод и коррекция данных Интерфейс пользователя Программы обработки СУБД Структури- рованные данные (БД) Подготовка в виде свободной формулировки Подготовка с использованием типовых функций. Подготовка по готовому шаблону. Прямой ввод данных в заданную область. Ввод данных с помощью конструктора. Ввод данных по заданным полям документа. Материалы организованы в базе данных в виде отдельных записей, которые формируются в структуры (линейные, иерархические, сетевые, табличные, смешанные). Трехуровневая модель функционирования базы данных

Система управления базами данных (СУБД) СУБД- программная система, с помощью которой можно: создавать базы данных; пополнять и модифицировать БД, обеспечивая хранение данных; осуществлять поиск и обработку данных; представлять результаты обработки данных в виде отчетов; представлять пользователю интерфейс для работы с БД.

Представление базы данных Под базой данных следует понимать – упорядоченный набор однотипных записей, имеющих постоянную структуру. Объект Атрибуты (элементы данных) Значения данных КлиентНомерФамилияАдрес 1872СергеевУл. Правды, 35 КлиентНомерФамилияАдрес 1872СергеевУл. Правды, 35 КлиентНомерФамилияАдрес 1872СергеевУл. Правды, 35 Каждая запись имеет определенную структуру, обозначение элементов и их значения ПоставщикНаименованиеАдресТовар АО-ЗаряМосква, а\я-47Телевизор21000 руб. ЦенаПоставщикНаименованиеАдресТовар АО-ЗаряМосква, а\я-47Телевизор21000 руб. Цена

База данных – носитель информационной модели предметной области Реальный мир Информация Данные СвойстваАтрибут Элемент данных Жители района Значение атрибута - фамилии Значение элемента данных Объект - город Описание предметной области Олег Анофриев

Основные задачи проектирования базы данных Основные задачи: 1. Обеспечение хранения в БД всей необходимой информации. 2. Обеспечение возможности получения данных по всем необходимым запросам. 3. Сокращение избыточности и дублирования данных. 4. Обеспечение целостности данных (правильности их содержания): исключение противоречий в содержании данных, исключение их потери и т.д. Перед созданием базы данных необходимо располагать описанием выбранной предметной области, которое должно охватывать реальные объекты и процессы, иметь всю необходимую информацию для удовлетворения предполагаемых запросов пользователя и определить потребности в обработке данных. На основе такого описания на этапе проектирования базы данных осуществляется определение состава и структуры данных предметной области, которые должны находиться в базе данных и обеспечивать выполнение необходимых запросов и задач пользователя.

Тезаурус информационной системы Тезаурус (От греч.Thesauros - запас, сокровище) Информационно-поисковый тезаурус - словарь дескрипторного информационно-поискового языка с зафиксированными в нем парадигматическими отношениями лексических единиц. Тезаурус содержит список ключевых слов, которыми может быть охарактеризовано содержание документов, с выделением слов, рекомендованных для индексирования (дескрипторов). Парадигматические отношения указывают общность или противопоставление значений и использования лексических единиц. В соответствии с тематическим профилем различают многоотраслевые, отраслевые и узкотематические тезаурусы. Тематический словарь: распределение терминов, которые встречаются в документах по тематической принадлежности. Внутри каждой темы слова сортируются по алфавиту. Темы определяют в соответствии с рубрикой. Частотный словарь: в словаре распределяются термины в порядке их значимости. Чем чаще встречается термин в текстах, которые хранятся в базе данных, тем его значение выше (частота встречаемости выше).

Хранение и поиск текстовой информации 1.Травка зеленеет, солнышко блестит 2.Зеленая трава у дома Словарь З... Зеленая (2) Зеленеет (1)... Т... Трава (2) Травка (1) Выделяется основа слова Добавляется в словарь слово полностью В словаре присваивается индекс слову (его номер) и наименование документа Процесс индексирования текстовых данных Процесс поиска информационного документа с встречающимся в нем словом или группой слов 1. Формулирование запроса, например: зеленая травка 2. Поиск по словарю 3. Оценка частоты встречаемости

Различия в определении Релевантность и Пертинентность R = S / K Релевантность запроса Количество найденных документов Общее количество документов в базе данных Объём полезной информации Объём полученной информации Запрос от пользователя База данных P = Пертинентность K = 7 S = 2 R = 2/7 P = 0 / 4

Современные виды поиска Полнотекстовый поиск Полнотекстовый поиск поиск по всему содержимому документа. Пример полнотекстового поиска любой интернет-поисковик, например Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы. Поиск по метаданным Поиск по метаданным это поиск по неким атрибутам документа, поддерживаемым системой название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам диалог поиска в файловой системе (например, MS Windows). Поиск по изображению Поиск по изображению поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения.