Июль 12© Инфосистемы Джет Открытые стандарты обработки документов. SGML и XML Борис Тоботрас, «Инфосистемы Джет»

Презентация:



Advertisements
Похожие презентации
Язык запросов XML. XML (Extensible Markup Language) - это новый SGML-производный язык разметки документов, позволяющий структурировать информацию разного.
Advertisements

WEB- ТЕХНОЛОГИИ Лекция 4. Задача преобразования XML- данных 1 Задача преобразования Для передачи данных между разными приложениями необходимо преобразовать.
XML - ПРАВИЛА ПОСТРОЕНИЯ ДОКУМЕНТОВ. Элементы электронного УМК Учебный план Программа дисциплины Структура курса Электронный конспект Обучающие и аттестующие.
БАЗЫ ДАННЫХ ЛЕКЦИЯ 14. тема: XML-ТЕХНОЛОГИИ В БАЗАХ ДАННЫХ.
ЯЗЫКИ РАЗМЕТКИ введение. Категории информационных ресурсов Данные – сведения о сущностях предметной области, их свойствах и связях с другими сущностями.
Web-сайты и Web- страницы. Web-страницы - специальные файлы, написанные на языке HTML (HyperText Markup Language - язык разметки гипертекста). Браузер.
Представление документов, содержащих математические формулы на www. Степанова Т.Б. Магистратура 1 курс.
Языки разметки. Разметка «Разметка» (markup) - «marking up» (помечание, размечание анг.) «разметчики» (markup men) указывали гарнитуру, стиль и размер.
Автоматическая обработка естественного языка I. Обработка письменного текста.
Работу выполнил: Студент группы ИС-С 06 Попов М.М. Попов М.М.
М.Ю.Колодин. РИ Представления и преобразования гипертекстовой информации в специализированных расширяемых форматах «Региональная информатика-2000»
Общие сведения об HTML. История развития html Основой даже самых продвинутых Интернет - технологий в настоящий момент является уже давно используемый.
Создание и форматирование документов в текстовых редакторах Угринович базовый курс 10.
HTML (от англ. Hyper Text Markup Language «язык разметки гипертекста») стандартный язык разметки документов во Всемирной паутине. Большинство веб-страниц.
HyperText Markup Language (HTML) - язык разметки гипертекста Гипертекст - информационная структура, позволяющая устанавливать смысловые связи между элементами.
Технология обработки текстовой информации. Процесс подготовки печатного издания включает в себя следующие этапы: Набор; Редактирование; Форматирование.
XSLT-ТРАНСФОРМАЦИЯ XML- ТЕХНОЛОГИИ Лекция 4. Трансформация XML- данных Категории трансформации Структурные трансформации – трансформация одного словаря.
Создание документов в текстовых редакторах Учитель информатики: Общева Ирина Сергеевна
Разработка Web-сайтов. Термин гипертекст был введен Тедом Нельсоном в 1965 г. для описания документов, которые выражают нелинейную структуру идей, в противоположность.
Основы языка гипертекстовой разметки. Web - сайты и Web – страницы.
Транксрипт:

июль 12© Инфосистемы Джет Открытые стандарты обработки документов. SGML и XML Борис Тоботрас, «Инфосистемы Джет»

июль 12© Инфосистемы Джет Почему SGML? Проблемы с обработкой документов: множество различных закрытых несовместимых форматов постоянная смена форматов и приложений трудности автоматической генерации и обработки документов непереносимость документов

июль 12© Инфосистемы Джет Что такое SGML? международный стандарт разметки документов (ISO 8879:1986) метаязык для создания языков разметки - приложений SGML (например, HTML) документы хранятся в текстовом виде документы состоят из текста и элементов разметки структура документа строго определена

июль 12© Инфосистемы Джет Что можно в SGML? один источник - много выходных форматов Web, связанные документы управление документами, версии, контекстный поиск управление данными

июль 12© Инфосистемы Джет В чем суть SGML? Отличия SGML разделение информации и представления типизированные документы выявление структуры информации управление данными связывание документов

июль 12© Инфосистемы Джет Информация и представление описательная разметка вместо процедурной жесткая структура документа разные способы обработки документа стили

июль 12© Инфосистемы Джет Типизированные документы понятие DTD анализаторы какие бывают DTD –универсальные –специализированные как сделать свой DTD? –элементы и их структура –атрибуты

июль 12© Инфосистемы Джет Структура информации структурные элементы обработка текста в контексте структуры Пример: Книга Глава Раздел параграф таблица

июль 12© Инфосистемы Джет Управление данными смысловые выделения обработка текста в контексте содержания Пример: Техническое задание Задачи разработки Раздел Тех. требования Раздел

июль 12© Инфосистемы Джет Связывание документов гарантия целостности двусторонние связи связи «один-ко-многим» и «многие-ко- многим» связи с произвольными точками документа Пример: –«ссылка на 3-ю главу 4-й части Руководства Администратора»

июль 12© Инфосистемы Джет Преимущества SGML Продуктивность Единая стилистика Повторное использование Долговечность информации Разделяемость Мобильность Гибкость

июль 12© Инфосистемы Джет SGML и другие HTML –уклон в сторону представления –размытость стандарта –нет возможностей расширения MS Word –закрытый –слабые средства автоматизации –нет смысловой и структурной разметки TeX –сложный, низкоуровневый –плохо экспортируется в Word

июль 12© Инфосистемы Джет Как это делается DTD Стили Редактор Поисковая машина Управление версиями SGML процессор Документы HTML PDF RTF

июль 12© Инфосистемы Джет Как это делается SGML-редакторы –ArborText ADEPT*Editor, SoftQuad Author/Editor, Xemacs+psgml, Corel WordPerfect/SGML SGML-процессоры –SP, CoST, Jade, OmniMark, Balise,... Стили –DSSSL (Jade), XSL, CSS,... Выходные форматы –HTML, RTF, TeX, PostScript, PDF,...

июль 12© Инфосистемы Джет Xemacs

июль 12© Инфосистемы Джет Author/Editor

июль 12© Инфосистемы Джет Контроль версий Текстовые файлы CVS/RCS diff Web-интерфейс

июль 12© Инфосистемы Джет Групповая работа над документами Внешние объекты (документы, рисунки...) Параллельная работа Библиотека иллюстраций Пакетная обработка (сборка документа)

июль 12© Инфосистемы Джет Поиск в документах Текстовые файлы Полнотекстовый поиск Поиск в контексте (структурном и смысловом) glimpse, CGI, Web

июль 12© Инфосистемы Джет Генерация Web-сервера Общее дерево сервера в SGML Мастер-документ Взаимные ссылки Средства верификации Единый стиль

июль 12© Инфосистемы Джет XML SGML, ориентированный на Web Упрощенный синтаксис Не обязательно наличие DTD Простые анализаторы

июль 12© Инфосистемы Джет XML vs. HTML Автоматизация формирования страниц Возможность экспорта с WWW Точность поиска Неограниченное количество элементов Что такое XML? eXtensible Markup Language XSL и XLL - дополнение к XML

июль 12© Инфосистемы Джет Инфосистемы Джет Тел , Борис Тоботрас,