Каталогизация образовательных информационных ресурсов Каталогизация образовательных информационных ресурсов В.А. Старых (РГУИТП), А.И. Башмаков (УНИКОР, ЦИАН) В.А. Старых, А.И. Башмаков, 2002
Отраслевая система государственного учета, регистрации и мониторинга информационных ресурсов системы образования (ОСГУРМ) повышения эффективности и качества учебного процесса на всех уровнях образования; рационализации использования ИР и средств, выделяемых государством на их развитие; содействия коммерциализации ИР; объективного оценивания состояния ИР образовательной сферы; содействия интеграции отечественных ИР в мировое информационное пространство; содействия защите прав интеллектуальной собственности владельцев ИР. ОСГУРМ – организационная структура, решающая задачи, связанные с систематизацией сведений об информационных ресурсах (ИР) системы образования России, в целях :
Отраслевая система государственного учета, регистрации и мониторинга информационных ресурсов системы образования Основные задачи, решаемые ОСГУРМ: регистрация ИР, присвоение ИР уникальных идентификаторов; ведение хранилища (репозитория) метаданных об ИР (в том числе обработка и актуализация метаданных); обработка внешних запросов на поиск описаний ИР в хранилище метаданных; депонирование ИР; направление ИР на сертификацию (по распоряжению их владельцев); мониторинг состояния ИР образовательной сферы; информационно-аналитические задачи; информационное обслуживание пользователей системы: - поиск описаний ИР в хранилище метаданных; - выполнение заказного поиска; - проведение информационно-аналитических исследований и др. - подписка на информационно-аналитические материалы, разрабатываемые ОСГУРМ, и др.
В рамках проекта по созданию концепции ОСГУРМ будут разработаны: требования к ОСГУРМ, а также принципы ее построения и функционирования; архитектура ОСГУРМ; спецификация информационной модели метаданных об ИР; словари и классификаторы, используемые в метаданных; спецификация XML-привязки информационной модели; руководство по применению спецификаций, содержащее ограничения целостности, профили описаний ИР разных классов и др.; прототипы программных средств для формирования метаданных; техническая спецификация ОСГУРМ. Вывод: для российской образовательной системы должна быть разработана и принята единая спецификация метаданных, используемая и в образовательных порталах, и в системе регистрации, и в хранилищах метаданных и ИР. Отраслевая система государственного учета, регистрации и мониторинга информационных ресурсов системы образования
Информационные ресурсы как объекты каталогизации Выделяются два подхода к определению схем описания ИР в каталогах: декомпозиция ИР на классы, для которых создаются разные формы описания; создание единой формы описания для всех классов ИР с представлением их особенностей с помощью ограничений целостности. 1) компьютерные ИР с сетевым доступом; 2) компьютерные ИР на информационных носителях; 3) прочие виды ИР. Приоритетность классов ИР при формировании каталогов:
Информационные ресурсы как объекты каталогизации Информационный ресурс – это документ (совокупность документов), предназначенный и самостоятельно оформленный для распространения среди неограниченного круга лиц либо служащий основой для предоставления информационных услуг. Неотъемлемые признаки ИР: Характерные признаки ИР: ориентация на распространение среди неопределенного круга лиц, для которых он представляет интерес, т.е. имеет потребительскую ценность; оформление, обеспечивающее возможность самостоятельного распространения. статус товара на рынке интеллектуальной продукции (есть исключения – мегаресурсы, служащие основой для предоставления услуг); ориентация на использование в самостоятельном качестве (исключение – образовательные объекты).
Метаданные об образовательных ИР универсальность (в рамках установленного понимания ИР как объекта каталогизации); достаточная выразительность для обеспечения эффективного решения задач, требующих наличия метаданных; совместимость с международными стандартами и протоколами в области метаданных и информационного поиска (обеспечение условий для интероперабельности); соответствие российскому законодательству в области образования (в частности, установленным уровням образования) и отражение особенностей отечественной образовательной системы; возможность задания ограничений целостности, отражающих взаимосвязи полей описания ИР; обеспечение возможности хранения метаданных как совместно с ИР, так и отдельно от него. Основные требования к схеме метаданных и способу их представления:
учет ИР; поиск ИР по метаданным; сбор метаданных программными агентами; навигация по каталогу ИР портала; формирование покрытия учебного плана образовательными ИР; управление контентом, в том числе агрегация ИР (построение интегрального ИР из имеющихся ИР и их компонентов); мониторинг состояния ИР образовательной сферы; проведение информационно-аналитических исследований. Метаданные об образовательных ИР Основные задачи, при решении которых используются метаданные:
Построение схемы метаданных 1. Выбор одной из существующих международных схем (Dublin Core, Learning Object Metadata). 2. Выбор одной из существующих международных схем и ее расширение. 3. Формирование оригинальной схемы. Интероперабельность Метаданные об образовательных ИР
LOM удовлетворяет почти всем указанным выше требованиям (для отражения особенностей российской системы образования предлагается расширение); схема ориентирована именно на образовательные ИР; по сравнению с Dublin Core схема LOM более структурирована и обладает большей выразительностью; LOM отражает опыт, приобретенный ведущими мировыми разработчиками образовательных ИР и поставщиками образовательных услуг; описание ИР на основе LOM является частью манифеста (внешнего формата представления информации, фиксирующей структуру ИР и логику навигации по нему);манифеста набор обязательных полей, который будет определен в расширении LOM, будет достаточно компактным. Выбор в качестве основы схемы Learning Object Metadata (LOM): Метаданные об образовательных ИР
Структура манифеста IMS Content Packaging Specification – спецификация компоновки дистрибутива образовательного ресурса; ADL Sharable Content Object Reference Model (SCORM). Content Aggregation Model – модель агрегации контента в рамках ссылочной модели совместно используемых объектов контента.
Классификаторы и словари в метаданных Место классификаторов и словарей Классификаторы и словари, играющие центральную роль при описании ИР: словарь (одноуровневый классификатор) целевых назначений ИР; классификатор видов ИР (типология ИР).
Классификация ИР по целевому назначению 1) официальное; 2) научное; 3) научно-популярное; 4) производственно-практическое; 5) нормативное производственно-практическое; 6) учебное; 7) массово-политическое; 8) справочное; 9) для досуга; 10) рекламное; 11) художественное. Источники: ГОСТ и ГОСТ Один и тот же ИР может иметь несколько целевых назначений
Классификатор видов ИР среда, необходимая для использования ИР; форма представления информации, содержащейся в ИР, и тип носителя ИР; статус ИР как товара на рынке интеллектуальной продукции либо средства, на основе которого оказываются определенные услуги; составляющая ИР, представляющая основную ценность; характер информации, содержащейся в ИР, а также типы решаемых с помощью него задач. Базируется на типологии видов изданий (ГОСТ ). Базовые основания деления: ИР может быть отнесен только к одному виду (листу классификационного дерева).
Классификатор видов ИР На каком носителе представлен ИР и требуется ли для его использования компьютерная среда? ИР на компьютерных носителях, требующих для использования компьютерной среды (в том числе Internet-ресурсы) Класс 1 ИР на некомпьютерных носителях аудиоинформации Класс 2 Аудиозаписи различного содержания и назначения на CD, аудиокассетах и т.д. ИР на некомпьютерных носителях видеоинформации Класс 3 Видеозаписи различного содержания и назначения на CDVideo, DVD, кассетах VHS, Video 8 и т.д. ИР на бумажных носителях Класс 4 Традиционные книги, журналы, газеты, брошюры и другие издания и документы на бумажных носителях Выступает ли ИР в качестве товара на рынке интеллектуальной продукции? Да Что представляет основную ценность в ИР? Собственно информация (содержание) Подкласс 1.1: информационные продукты Функции, обеспечиваемые программными средствами Подкласс 1.2: программные продукты И информация, и функции, обес- печиваемые программными средствами Подкласс 1.3: программно- информационные продукты Дальнейший выбор вида ИР производится путем движения по ветвям дерева классификатора слева направо и сверху вниз. По каждому виду ИР (листу дерева) можно запросить определение Нет, но описываемый Internet-ресурс служит основой для предоставления определенных услуг Подкласс 1.4 Нет
Классификаторы и словари, которые целесообразно использовать при навигации по каталогу ИР портала: словарь целевых назначений ИР; классификатор видов ИР; предметный классификатор; словарь уровней образования; словарь целевой аудитории (категорий пользователей ИР). Классификаторы и словари в метаданных
Словарь уровней образования Источник – Закон РФ об образовании ( от ) основное общее среднее (полное) общее начальное профессиональное ст. 27 п. 5 среднее профессиональное (образовательные цензы) высшее профессиональное послевузовское профессиональное дошкольное образованиест. 18 начальное общее образование ст. 19 профессиональная подготовка ст. 21 дополнительное образование ст. 26 Один и тот же ИР может быть отнесен к нескольким уровням
Словарь целевой аудитории (категорий пользователей ИР) Этот элемент данных предлагается ассоциировать только с ИР учебного назначения. Предлагаемое расширение словаря LOM: Teacher – преподаватель; Author – автор; Learner – обучаемый; Manager – менеджер; Methodologist – методист; Instructional Designer – разработчик образовательных компонентов; Graphical Designer – графический дизайнер; Multimedia Developer – разработчик мультимедийных компонентов; Programmer – программист; Technical Implementer – технический разработчик. Один и тот же ИР может быть ориентирован на несколько категорий пользователей
Расширение схемы LOM отражение специфики российской системы образования, а также отечественных законодательства и стандартов; более глубокая структуризация и формализация ряда элементов описания ИР; представление характеристик, специфичных для ИР, распространяемых на информационных носителях; развитие ограничений целостности в целях снижения ошибок в метаданных; определение профилей описаний для разных классов ИР. Причины введения расширения и его цели:
Схема LOM. Раздел 1: Общая информация об ИР 1.1. identifier – глобальный уникальный идентификатор ИР title – заглавие ИР (*) catalogentry catalog – имя каталога (депозитария ИР, системы регистрации) entry – идентификатор ИР в рамках каталога (*) language – язык ИР (*) description – описание ИР (аннотация) (*) keyword – ключевое слово (*) coverage – пространственный и временной охват содержимого ИР. 1.7.e1. (*) формальное представление временного охвата содержимого ИР structure – структура ИР aggregation level – уровень агрегации ИР. 1.e1. услуги, оказываемые на базе ИР. 1.e1.1. (*) формальное представление услуги, оказываемой на базе ИР.
Схема LOM. Раздел 2: Жизненный цикл ИР 2.1. version – версия ИР status – статус ИР (*) contribute role – вид вклада в ИР [расширение словаря] (*) centity – субъект, внесший вклад в ИР date – дата вклада. 2.e1. период обновления ИР. 2.e2. дата последнего обновления ИР. 2.e3. (*) место издания. 2.e4. источник публикации. 2.e5. том. 2.e6. номер (выпуск). 2.e7. демо-версия (иллюстрация основных возможностей) ИР.
Схема LOM. Раздел 3: Метаметаданные 3.1. identifier – глобальный уникальный идентификатор описания ИР (*) catalogentry catalog – имя каталога (хранилища метаданных) entry – идентификатор описания ИР в рамках каталога (*) contribute role – вид вклада в описание ИР (*) centity – субъект, внесший вклад в описание ИР date – дата вклада (*) metadatascheme – схема метаданных language – язык описания ИР.
Схема LOM. Раздел 4: Технические характеристики ИР 4.1. (*) format – тип данных, используемых в ИР size – объем цифрового ИР (*) location – доступ к ИР (*) requirement – технические требования type – тип технологии или программной среды, требуемой для использования компьютерного ИР name – название технологии или программной среды minimumversion – низшая (минимальная) версия технологии или программной среды, позволяющая использовать ИР maximumversion – высшая (максимальная) версия технологии или программной среды, позволяющая использовать ИР installationremarks – порядок инсталляции otherplatformrequirements – прочие технические требования.
Схема LOM. Раздел 4: Технические характеристики ИР 4.7. duration – длительность воспроизведения. 4.e1. кодировка кириллицы. 4.e2. число документов. 4.e3. информация о носителе информации. 4.e3.1. (*) тип и количество носителей. 4.e тип носителя. 4.e число информационных носителей. 4.e3.2. тираж. 4.e3.3. количество страниц. 4.e3.4. количество печатных листов. 4.e3.5. формат бумажного носителя. 4.e4. (*) способ удаленного доступа к ИР.
Схема LOM. Раздел 5: Образовательные характеристики ИР 5.1. interactivitytype – тип интерактивности ИР (*) learningresourcetype – тип образовательного ИР (образовательного объекта) interactivitylevel – уровень интерактивности ИР semanticdensity – семантическая емкость ИР (*) intendedenduserrole – категория пользователей [расширение словаря] (*) context – уровень образования (словарь LOM) (*) typicalagerange – возрастной диапазон пользователей ИР difficulty – сложность ИР typicallearningtime – контактное время description – методика применения ИР в учебном процессе (*) language – язык представления информации. 5.e1. (*) сведения о грифах и сертификатах, присвоенных ИР. 5.e1.1. организация, присвоившая гриф или выдавшая сертификат. 5.e1.2. резолюция организации, присвоившей гриф или выдавшей сертификат. 5.e1.3. дата присвоения грифа или выдачи сертификата.
Схема LOM. Раздел 6: Права интеллектуальной собственности на ИР 6.1. cost – признак платности ИР copyrightandotherrestrictions – признак наличия или отсутствия ограничений по использованию ИР, связанных с правами интеллектуальной собственности description – комментарий по правовым условиям использования ИР. 6.e1. (*) правообладатель. 6.e2. описание отношений, связанных с правами интеллектуальной собственности на ИР. 6.e3. (*) права доступа к ИР.
Схема LOM. Раздел 7: Отношения с другими ИР (*) 7.1. kind – тип отношения resource – ресурс, связанный с данным ИР identifier – глобальный уникальный идентификатор ресурса, связанного с описываемым ИР description – характеристика ресурса, связанного с описываемым ИР (*) catalogentry catalog – имя каталога (депозитария ИР, системы регистрации) entry – идентификатор ИР в рамках каталога.
Схема LOM. Раздел 8: Аннотация (*) 8.1. person – автор аннотации date – дата составления аннотации description – текст аннотации.
Схема LOM. Раздел 9: Классификационные признаки (*) 9.1. purpose – назначение классификации [расширение словаря] (*) taxonpath – путь в классификаторе source – название классификатора (классификационной системы) (*) taxon – вершина классификатора id – идентификатор вершины классификатора entry – текстовое наименование вершины классификатора description – описание ИР в контексте цели классификации (*) keyword – ключевое слово в контексте цели классификации.
Выводы Спецификация метаданных об образовательных ИР строится как расширение схемы LOM. Для предложенной информационной модели метаданных разрабатываются: профили описаний ИР разных классов; ограничения целостности; XML-привязка; программные средства формирования метаданных. словарь целевых назначений ИР (на основе ГОСТ и ); классификатор видов ИР (на основе типологии видов изданий); предметные классификаторы (УДК, ГРНТИ); словарь уровней образования (в соответствии с Законом РФ об образовании); словарь целевой аудитории (расширенный словарь LOM). В качестве базовых классификаторов и словарей, используемых в метаданных, предлагается использовать: