Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемrcdl2011.vsu.ru
1 Комбинированное электронное представление печатных изданий С.И. Трифонов Лаборатория Разработки и Внедрения Информационных Технологий Научная педагогическая Библиотека им. К.Д. Ушинского РАО RCDL-2011
2 Электронные библиотеки: эволюция понятия 1980-е 1 Mb Электронные каталоги традиционных библиотек 1990-е Много текстов ЭБ Текстовое представление 100 Mb ФЭБ Фундаментальная Электронная Библиотека «Русская литература и фольклор» 2002 Google Books 2004 ЭБ Графическое представление 1 Tb 2000-е Много изображений ЭБ Комбинированное представление 2010-е Эффективность? Удобство? «Научное наследие» ЭБ РАО
3 Технологии для электронной библиотеки Подготовка изданий для электронной библиотеки требует разработки технологии, поддерживающей: Большие объёмы работы, большую долю ручного квалифицированного труда Единые требования к качеству подготовки электронного вида, по возможности гибкие Средства интеграции изданий в библиотеку - систему, с единой навигацией и поддержкой возможностей информационного поиска Комбинированное представление одно из ключевых решений, которые должна поддерживать любая перспективная технология
4 Подготовка электронного издания: операции Текст Изображения вычитка Текстовое представление совмещение Комбинированное представление Графическое представление сканирование обработка изображений распознавание разметка оформительская / логическая
5 Форматы представления изданий Текстовое представление: XHTML единый документ на всё издание Графическое представление: JPG изображение каждой страницы Комбинированное представление: XHTML + JPG + Графический индекс имеет два вида: текстовый понятный редактору, постраничный бинарный оптимизированный под задачи сервера библиотеки, единый
6 Графический индекс Вопросы, на которые предстоит ответить: Какие задачи решает графический индекс? Какую информацию он содержит? Зачем нужны два вида (текстовый и бинарный) ? Как устроен формат индекса? Почему не PDF или DjVu?
7 Основная задача показать результаты поиска Задача: выделять найденные слова на графическом изображении - подсветки Запрос: «движение преобладает»
8 Содержание графического индекса Для каждого слова текстового представления графический индекс должен хранить соответствие, где оно находится: на какой странице и в каком прямоугольнике Дополнения: Прямоугольников может быть несколько Kоординаты могут быть приблизительными Могут быть переносы между страницами
9 Пример текстового вида графического индекса W |АКАДЕМИЯ _W |ПЕДАГОГИЧЕСКИХ _W |НАУК _W |СССР W |Л |. _W |С |. _W |ВЫГОТСКИЙ W |СОБРАНИЕ W |СОЧИНЕНИЙ W |ТОМ W |ПЕРВЫЙ W |МОСКВА
10 Флаги графического индекса «_» перед атомом стоит пробел «W» атом словный «.» атом несловный «-» перенос слова «!» пометка «проверить текст» «?» пометка «проверить графику» «/» разрыв абзаца
11 Архитектура сервера библиотеки Пакеты изданий Изображения страниц, JPG Текст, XHTML Графический индекс, Сервис просмотра Поисковая машина Сервис подсветок
12 Почему не PDF или DjVu? Форматы PDF и DjVu прекрасные решения для отдельных книг и их автономного использования. Но они не адекватны для создания электронных библиотек потому, что они разработаны для других целей, см. выше Решение для комбинированного представления это технологическое решение, специально разрабатываемое под электронные библиотеки. Различий в «идеологии» нет.
13 Вопросы?
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.