Лекция 8 Формализованное представление и поиск информации Экономический факультет Кафедра «Прикладная информатика» Дисциплина «Информационные системы в.

Презентация:



Advertisements
Похожие презентации
Теория экономических информационных систем Семантические модели данных.
Advertisements

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ.
Информационные системы Тема 6: «Документальные информационные системы» Колмыкова Оксана Владимировна ВГУЭС, г.Владивосток, ул.Гоголя 41 каф. ИИКГ, ауд.
Поиск информации в ИНТЕРНЕТЕ Для слушателей курсов. ХалкечеваЛ.В.
Тема урока: « Информационные системы. Классификация информационных систем »
ИСПОЛЬЗОВАНИЕ ЦИФРОВЫХ ОБРАЗОВАТЕЛЬНЫХ РЕСУРСОВ (ЦОР) В УЧЕБНОМ ПРОЦЕССЕ ЧЕРЕЗ ИНТЕРНЕТ.
ГОРОДСКОЙ МЕТОДИЧЕСКИЙ ЦЕНТР mosmetod.ru Примерная программа учебного предмета «Информатика»
Государственное бюджетное образовательное учреждение среднего профессионального образования «Мишкинский профессионально-педагогический колледж» Структура.
Конструирование учебно-методического комплекса. Учебно-методический комплекс является обязательной частью основной образовательной программы ВУЗ, разрабатывается.
1 Требования к содержанию электронных образовательных ресурсов СОИРОСОИРО.
Презентация курса по выбору «Технологии визуализации данных» Кафедра Информатики и МОИ Факультет Математики, физики и информатики.
Система программ «1 С: ПРЕДПРИЯТИЕ» Структура Элементы Средства.
Цифровые образовательные ресурсы ЦОР это сложный информационный объект, выводимый с помощью мультимедийного проектора на экран, т. е. это объект, существующий.
Использование Веб-квестов в дистанционном обучении Ревчук И.И., учитель английского языка Лычковской средней школы.
Структура информационно- образовательного WEB-сайта преподавателя.
Технология описания педагогического опыта Подготовила: учитель начальных классов МОУ гимназии 44 имени В.Н.Деева Сенницкая Надежда Александровна.
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В НАУКЕ И ОБРАЗОВАНИИ Тема 2. Базы данных, базы знаний, экспертные системы, интеллектуальные информационные системы.
Проектирование информационной системы СРО изыскателей и ее образовательная функция.
Целью данного проекта является - рассмотреть возможность различных программ для создания ЦОР. Для достижения поставленной цели в работе решены следующие.
Языки и методы программирования Преподаватель – доцент каф. ИТиМПИ Кузнецова Е.М. Лекция 7.
Транксрипт:

Лекция 8 Формализованное представление и поиск информации Экономический факультет Кафедра «Прикладная информатика» Дисциплина «Информационные системы в образовании» Разработал к.п.н., доцент кафедры «Прикладная информатика», Попова Марина Викторовна

Содержание 1. Данные и знания. 2. Информационный поиск. 3. Навигационные и диспетчерские системы.

Семантические модели данных представляют собой средство представления структуры предметной области. Эти модели используют общий набор понятий и отличаются конструкциями, применяемыми для их выражения, полнотой отражения понятий в модели, удобством использования при разработке информационных систем. Как эталон семантической полноты рассматривается естественный язык, а для формализации языковых конструкций в моделях применяется аппарат математической лингвистики.

Наиболее распространенной семантической моделью является модель «сущность- связь». Эта модель использует графическое представление всех компонентов. Структура предметной области в модели «сущность-связь» изображается в форме диаграммы. Дуги на диаграмме соединяют тип сущности с типом связи. Диаграмма может представлять только объекты и их связи или дополнительно содержать атрибуты, описывающие свойства объектов.

В современных системах управления вопрос о принятии решения требует фиксации знаний об управляемом объекте и реализации моделей принятия решений, характерных для человека- специалиста (инженер, экономист, педагог). Способность человека накапливать и использовать знания, принимать решения можно назвать естественным интеллектом; соответствующие возможности информационной системы получили название искусственного интеллекта.

Система понятий для представления знаний существенно отличается от системы понятий для представления данных, поэтому отображение знаний производится в базу знаний. Вместе с тем, база знаний способна хранить данные как простую разновидность знаний.

Запросы, которые формируют пользователи информационных систем, реализуются следующими способами: * сообщения, являющиеся ответом на запрос, хранятся в явном виде в базе данных, и процесс получения ответа представляет собой выделение подмножества знаний из файлов базы данных, удовлетворяющих запросу; * ответ не существует в явном виде в базе данных и формируется в процессе логического вывода на основании имеющихся данных. Последний случай принципиально отличается от применяющихся технологий использования баз данных и рассматривается в рамках представления знаний, т.е. информации, необходимой в процессе вывода новых фактов.

Базы знаний содержат: * сведения, которые отображают существующие в предметной области закономерности и позволяют выводить новые факты, справедливые в данном состоянии предметной области, но отсутствующие в базе данных, а также прогнозировать потенциально возможные состояния предметной области; * сведения о структуре информации в базе данных (метаинформация); * сведения, обеспечивающие понимание входного языка, т.е. перевод входных запросов во внутренний язык.

Принято говорить не о знаниях «вообще», а о знаниях, зафиксированных с помощью той или иной модели знаний. Принципиальными различиями обладают три модели представления знаний: продукционная модель, модель фреймов и модель семантических сетей.

Продукционная модель знаний состоит из трех основных компонентов: * набора правил, представляющего собой в продукционной системе базу знаний; * рабочей памяти, в которой хранятся исходные факты и результаты выводов, полученных из этих фактов; * механизма логического вывода, использующего правила в соответствии с содержанием рабочей памяти и формирующего новые факты.

В основе теории фреймов лежит фиксация знаний путем сопоставления новых фактов с рамками, определенными для каждого объекта в сознании человека. Структура в памяти компьютера, представляющая эти рамки, называется фреймом (в переводе с английского – рамка). С помощью фреймов мы пытаемся представить процесс систематизации знаний в форме, максимально близкой к принципам систематизации знаний человеком. Фрейм представляет собой таблицу, структура и принципы организации которой являются развитием понятия отношения в реляционной модели данных. Слотом фрейма называется элемент данных, предназначенный для фиксации знаний об объекте, которому отведен данный фрейм.

Новизна фреймов определяется двумя условиями: * имя атрибута может в ряде случаев занимать в фрейме позицию значения; * значением атрибута может служить имя другого фрейма или имя программно реализованной процедуры. Фреймовые системы обеспечивают ряд преимуществ по сравнению с проекционной моделью представления знаний: * знания организованы на основе концептуальных объектов; * допускается комбинация представления декларативных («как устроены объекты») и процедурных («как взаимодействуют объекты») знаний; * иерархия фреймов вполне соответствует классификации понятий, привычной для восприятия человеком; * система фреймов легко расширяется и модифицируется.

Семантические сети представляют собой ориентированные графы с помеченными дугами. Они позволяют структурировать имеющуюся информацию и знания. Аппарат семантических сетей является естественной формализацией ассоциативных связей, которыми пользуется человек при извлечении каких-то новых фактов из имеющихся. Построение сети способствует осмыслению информации и знаний, поскольку позволяет установить противоречивые ситуации, недостаток имеющейся информации и т.п.

Наблюдается переход от индивидуального (межличностная коммуникация, самостоятельное обучение) к групповому (малые и большие группы), от группового к организационному интерфейсу в электронных средах обучения, что согласуется с конструктивистским подходом, но требует методической мотивации в соответствии с целями и задачами обучения. Педагогическая коммуникация немногочисленной по составу группы реализуется между участниками образовательного процесса, которые разделяют общие учебные цели и задачи, имеют чувство принадлежности к данной группе и влияние друг на друга.

Среди Интернет-технологий, поддерживающих групповое обучение, следует отметить дискуссионные методы (телеконференция, список рассылки, веб-форум), Интернет- конференции, электронные журналы (форма научной коммуникации), электронные библиотеки (упорядоченные коллекции разнообразных электронных документов в совокупности с серверами навигации и поиска) и их комбинации. Информация в Интернете, как правило, слабо структурирована и не подготовлена к использованию в образовательных целях, поэтому доступ в Интернет с непрерывно возрастающим объемом неструктурированной информации должен опираться на обучение анализу, синтезу и критической оценке сообщений, что входит в набор навыков профессиональной компетентности. Кроме того, информация в Интернете может быть недостоверной, неполной, неточной и несвязанной с контекстом обучения, что делает ее бесполезной для целей обучения.

Связь с контекстом обучения является критичным фактором при оценке используемого ресурса. При его создании следует исходить из традиционных критериев качества информации (репрезентативность, доступность, точность, достаточность, экономичность, релевантность, достоверность, защищенность, своевременность и т.п.), а также критериев оценки качества веб-сайта (автор, источник, сервер, активность, стиль, цель, аккуратность, актуальность).

Принципы формирования типовой информационной структуры: однократный ввод и многократное использование информации; полнота удовлетворения информационных потребностей основных групп пользователей; оперативное пополнение ресурсов обязательными документами; комфортный доступ к ресурсам в off- и on- line режимах; выполнение как конкретных узкотематических, так и широких по тематике запросов.

Основные задачи, возникающие при создании электронного архива: * Предоставление пользователям оперативного доступа к информационному массиву по интересующей их тематике. * Автоматическое ведение журнала модификации информации. * Исключение размещения посторонней информации. * Распределение прав доступа. * Исключение несанкционированного изменения информации. * Организация любой другой информационной структуры без необходимости существенной переработки имеющейся информации. * Возможность перехода к иной форме хранения/обработки информации без необходимости ручной обработки основной части размещенной информации. * Возможность добавления в схему обработки информации дополнительных элементов поиска, структурирования и т.п.

Единое образовательное пространство педагогического вуза включает централизованную информационную базу, диспетчерскую систему, средства администрирования, управления и коммуникации, рис. 6.3.

Индивидуальное образовательное пространство педагога формируется на базе единого образовательного пространства вуза и включает электронный конспект лекций, видеотеку лектора, систему заданий для самостоятельной деятельности обучаемого, средства мониторинга учебного процесса, сетевую страницу для дистанционного обучения. Информационные средства этого пространства обеспечивают выполнение следующих функций: 1. Создание и модификация учебного материала и учебных заданий курса (отдельные уроки, модули, лекции, учебные пособия, задания для тестов, контрольные работы, курсовые проекты, экзаменационные материалы). 2. Управление библиотеками разработки курсов (шаблоны, аудио- и видеофрагменты, анимация). 3. Модификация состава и уровня курса под конкретных обучаемых. 4. Навигация и быстрый поиск необходимой информации о курсе. 5. Мониторинг курса (получение любой статистической информации о курсе, обучаемых, заданиях). 6. Включение разработанного курса в базу данных.

Индивидуальное образовательное пространство обучаемого включает электронное учебное пособие, видеокурс лекций, практикум по компьютерному моделированию, адаптивную систему тестирования и сетевую версию курса для дистанционного обучения. Информационные средства этого пространства обеспечивают выполнение следующих функций: 1) конфигурирование курса по желанию обучаемого; 2) воспроизведение мультимедийных и анимационных фрагментов курса; 3) самотестирование и самоконтроль знаний обучаемых на всех этапах изучения курса; 4) доступ к курсу через сеть и его изучение с помощью программ–навигаторов; 5) введение паролей для исключения случаев несанкционированного доступа к работам и файлам обучаемых; 6) развитие навыков сетевого обучения.

Знание бывает двух видов: мы знаем предмет по существу, или же мы знаем, где можно найти информацию о нем. В этой мысли содержится главный признак, по которому деятельность информационная отделяется от научно-исследовательской. С незапамятных времен для поиска информации применяют ряд логических процедур, которые в совокупности и составляют процесс поиска информации.

Прочтение полного текста документа заменили просмотром заглавий, аннотаций, рефератов. Однако и эта процедура в многотысячных собраниях документов оказалась слишком трудоемкой. Документы пришлось систематизировать по содержанию, которое условно стали обозначать индексами (буквами и/или цифрами). Систематизация по разделам наук (классам) – один из самых первых способов раскрытия содержания научно- технических документов, моделирующий работу человеческого сознания и восходящий к глубокой древности. По мере увеличения количества письменных и печатных документов и объема наших знаний о мире их классификация усложнялась. Эти классификации получили название иерархических.

В семидесятых годах 19-го века сформировалась предметная (точнее, алфавитно-предметная) классификация. На долгие годы она стала господствующей при составлении энциклопедий, вспомогательных указателей к трудам, систематически излагающим проблему или раздел науки, а в США, где она была создана – при организации каталогов. До середины 20 века возможность содержательного поиска информации по справочникам или документам, содержащим нужную информацию, в библиотеках ограничивалась тремя способами: систематическим, предметным, алфавитным.

В пятидесятые годы 20-го века были сформулированы понятия информационного поиска, информационно- поисковой системы, информационно-поискового языка, была выдвинута задача механизации, а затем и автоматизации информационного поиска. К этому времени стало ясно, что информационный поиск – это совокупность логических процедур, в результате которых на информационный запрос выдается либо необходимая информация (фактографический поиск), либо библиографические адреса этих документов (библиографический поиск). Документы подвергаются анализу (интеллектом человека), абстрактное представление о его содержании выражается на некотором информационно- поисковом языке, т.е. синтезируется в виде библиографического описания и индекса. Индекс образуется путем мысленного сопоставления основного смыслового содержания с потенциальными запросами потребителей информации.

Процедура выражения основного смыслового содержания документа и информационных запросов на информационно-поисковом языке получила название индексирования и составляет существенную часть аналитико-синтетической обработки документов. Информационный поиск, таким образом, заключается в замене содержательного прочтения полного текста документов формальным «сличением» (сравнением на соответствие) их поисковых образов с запросами на языке индексов. Метод координатного индексирования (М. Таубе, К. Муэрс – США, пятидесятые годы 20-го века) основан на предположении, что основное смысловое содержание любого документа и информационного запроса можно выразить при помощи набора терминов, по большей части содержащихся в самом индексированном документе. Эти термины получили название ключевых слов. Ключевые слова образуют для данного документа координатную сетку, по которой в дальнейшем ведется информационный поиск по соответствующему запросу. Термины находятся в сложных взаимоотношениях между собой, выражают более узкие или более широкие понятия, могут быть связаны по сходству, по контрасту (омонимия, синонимия) или по другим ассоциациям. Чтобы иметь возможность учитывать это при поиске, приходится составлять специальные понятийные справочники (тезаурусы). В них для каждого понятия (класса условной эквивалентности) выбирается один термин – дескриптор, а для остальных слов указывается их связь с дескриптором.

Рубрикатор – это особым образом организованный перечень рубрик иерархической классификации, предназначенный для отражения сведений о текущих публикациях в информационных изданиях или системах информационного обслуживания. К его характерным особенностям относятся сравнительно небольшая глубина индексации, ориентированность на межотраслевые, междисциплинарные, комплексные проблемы, простота и линейность структуры, достаточная гибкость, частая и безболезненная изменяемость формулировки рубрик. По рубрикаторам классифицируются самые мощные потоки научных публикаций (за год в мире появляется примерно 5 млн. не совпадающих документов).

Гипертекст – это новая технология представления неструктурированного, свободно наращиваемого знания (В. Буш, 1945 год; Т.Нельсон, 1965 год). Здесь обработка информации осуществляется совместно с человеком (авторская технология). Весь поисковый аппарат реализуется как тезаурус гипертекста (нет поисковых образов документов). Восприятие и понимание гипертекстовых сообщений, экранная культура текста, электронная риторика взаимоувязаны с учебными материалами, размещенными в электронных средах (программный подход клиент-сервер, язык форматирования HTML, протоколы HTTP). Встраиваемые в текст Web-страницы, гипертекстовые ссылки различаются по решаемым задачам (структурные, ассоциативные, дополнительные) и позволяют создавать нелинейную структуру обучения с возможностью выбора различных путей для прочтения текста, реализация которых невозможна в печатном варианте.

Построение (редактирование, комментирование) сообщений веб-страниц, их навигационной структуры подчиняется своим правилам (принцип «перевернутой пирамиды», синергетический подход, массовая издательская среда), которые реализуются в различной веб-архитектуре (одиночная страница, веб-презентация, семантическая сеть, иерархический веб-сайт). Наиболее частыми проблемами конструирования гипертекстовой структуры и веб-сайтов для учебных целей являются сложность навигации по гипертексту (необходимы направленные маршруты по учебному материалу, ведение фрейма или карты с исходным перечнем всех частей документа – индексами), когнитивная перегруженность (учебники ограничены пространством книги и определенным количеством информации, компьютерные сети практически не ограничены), что требует иных методов создания (характеристика информационного, мультимедийного воздействия на человека, учет особенностей поисковых систем) и освоения образовательных веб-сайтов (проблемный метод, индивидуализированный и деятельностный подходы).

Модульный подход к построению образовательной области обеспечивает применение современных методов теоретического и практического обучения в конкретной образовательной области, что позволяет повысить уровень подготовки обучаемых. Этот подход соответствует концепции открытого образования и, в частности, применению электронных учебных пособий. Образовательной области «Информатика» соответствует образовательный модуль, включающий набор специальностей в соответствии с республиканской номенклатурой. Специальности соответствует специализированный модуль, включающий набор дисциплин, формируемый в соответствии с учебно-методическим комплексом по специальности. Дисциплине соответствует комплексный модуль, включающий перечень учебных тем в соответствии с учебно- методическим комплексом по дисциплине

Тема характеризуется базовым модулем (перечень учебных вопросов). Учебному вопросу соответствует опорный модуль, ссылающийся на тип учебного занятия (теоретические, практические, лабораторные, самостоятельные). Через тип занятия учебный вопрос ссылается на исходный модуль, содержащий учебный материал (теоретический, практический, контролирующий, методический, программно- технический). Интегрированный модуль на входе анализирует информацию, состоящую из понятий элементарных модулей, и на выходе создает совокупность новых понятий, знаний, используя экспертные системы. До базового уровня включительно целесообразно работать в регламентированном режиме, с опорного уровня можно интегрировать учебный материал для каждого вида занятий (проектировать этапы учебного процесса). Описание информационных модулей осуществляется в технологических картах. Карта интегрированного модуля содержит ссылку на включаемые модули (выполняет функции навигатора). Карта исходного модуля характеризует его принадлежность к виду учебного материала, типу учебного занятия и учебного вопроса (выполняет функции специф

Информационный поиск реализуется при помощи информационно-поисковой системы, которая в абстрактном виде должна состоять из информационно- поискового языка, правил перехода на этот язык и критерия смыслового соответствия, определяющего объем выдачи документов или информации – критерия выдачи, рис. 6.4.

Модель организации данных в гипертекстовых справочных системах основана на сочетании ассоциативных гиперссылок и иерархического принципа организации фрагментов и документов. Данные модели сочетают апробированные и интуитивно понятные большинству пользователей, по аналогии работы с книгой, иерархическую навигационную структуру (гипертекстовое оформление и предметный указатель) с дифференцированными ассоциативными гиперссылками, выражающими рассмотренные выше различные типы ассоциаций при изучении и восприятии текстовой информации.

Обращение к сетевым объектам по адресам осуществляют навигаторы (браузеры), например, Microsoft Internet Explorer (или «Обозреватель», по терминалогии фирмы Microsoft). Портал – это веб-страница с гиперссылками на ресурсы Интернет. Web-страница – это электронный документ, записанный в HTML-формате. Браузер определяет профиль пользователя, позволяет работать с Web-страницами (со встроенными объектами или без них), ведет регистрационный журнал и имеет меню настройки.

Поисковые системы делятся на глобальные, отраслевые, национальные и региональные, фирменные и индивидуальные. Эти системы могут осуществлять простой, расширенный и специальный поиск. Поисковые сетевые системы являются специфическими браузерами, формирующими ссылочные списки. Мощные поисковые системы хранят сведения о примерно 300 млн. web-страниц (на начало 2000 года насчитывалось порядка 1 млрд. документов). Поисковые системы подразделяются на каталоги и указатели; они различаются технологией подготовки справочного материала: каталоги составляют люди, а указатели формируются автоматически. Самый крупный каталог Интернет – Yahoo! (www. yahoo.com); он содержит 1 миллион ресурсов и поддерживается 150 редакторами. Ведущий каталог России – List.Ru (www. list.ru); 100 тысяч ссылок, классифицированных по 18 каталогам.

Поисковые указатели работают в три этапа: 1. Собирается информация из www (программы Червь, Гусеница, Спайдер, Кроулер). 2. Создается индексированная база данных (словарь). 3. Осуществляется обработка запроса клиента и выдача результата поиска в виде списка гиперссылок. 4. Осуществляется сортировка полученных результатов (ранжирование). Каждой странице присваивается определенный рейтинг, отражающий качество материала (показатель цитирования, размещение ключевых слов, коммерциализация). 5. Оценивается качество самых первых ссылок (качество искусственного интеллекта).

Классификационно-рейтинговые системы создаются для «туристов». Классификатор похож на каталог, но по каждой категории представляются лучшие сайты и фиксируется число посетителей. Самый крупный классификатор России – Рамблер Тор 100 (размещается на портале поискового указателя России Рамблер -

Пример 6.1. Диспетчерская обучающая система ДОС Информатика. Система предназначена для работы с информационной базой образовательного пространства вуза и может выполнять следующие функции: формирование и просмотр каталогов модулей всех типов; формирование и просмотр технологических карт интегрированных (составных) модулей; поиск учебного материала для интегрированных модулей в информационной база; проведение индивидуального обучения. Контент для диспетчерской обучающей системы сделан в виде учебно-методических модулей в формате html. Подобраны библиотеки теоретических, практических и контролирующих модулей по каждой теме. Имеется возможность самому пользователю составлять новые библиотеки из исходных элементарных модулей, выполняя навигацию между модулями с помощью ключевых слов. Связь между модулями осуществляется по системе индексов, т.к. за каждым модулем закреплен свой индекс, состоящий из нескольких признаков (указание на дисциплину, тему, вид материала).

Для подготовки учебных модулей не требуется специальных знаний в области программирования. Задачу можно решить с помощью стандартного средства (например, с помощью текстового процессора Microsoft Word). В этом редакторе для создания файла формата html достаточно после подготовки нужного документа сохранить его как web- страницу. Можно воспользоваться также программой Microsoft FrontPage, которая входит в комплект Microsoft Оffice и позволяет создавать web- страницы на языке html без программирования. Созданные учебные модули затем подключаются к информационной базе с помощью гиперссылок.