Ю.Н.Филиппович, А.Ю.Филиппович, ИНТЕГРИРОВАННЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ В МЕДИАИНДУСТРИИ Слайд-лекции для студентов специальности 230204 «Информационные технологии.

Презентация:



Advertisements
Похожие презентации
Автор: Осина Е.Л. Группа: МГ-18 Prezentacii.com Показать разнообразие русского языка, его виды и функции. Рассмотреть различия устной и письменной речи.
Advertisements

Язык и речь Назаренко Оксана Вячеславовна, канд. филол. наук, преподаватель кафедры гуманитарных и экономических дисциплин Назаренко Оксана Вячеславовна,
Основы информационной культуры. Модуль «Работа с информационными ресурсами: поиск и извлечение информации». ЛАНГЕПАССКОЕ ГОРОДСКОЕ МУНИЦИПАЛЬНОЕ БЮДЖЕТНОЕ.
Библиотечный урок. Познакомить учащихся с различными видами словарей русского языка и их структурой.
Особенности различных типов и видов информационных ресурсов. Справочная литература Урок информационной грамотности. 8класс.
Типология словарей Выполнила студентка группы 2 « АФ » Борисова Алена Проверила преподаватель русского языка Матвеева Ильмира Борисовна.
Презентация на тему: Студентки 23 группы Бельковой Светланы.
Онлайн-словари и переводчики (английский язык). Англо-русские (русско-английские) электронные словари.
Словари русского языка Выполнила работу: Ученица 7 класса «В» Ворсина Елизавета.
Библиотеки, энциклопедии и словари в Интернете. Библиотека (греч. bibliothēkē, от biblíon книга и thēkē хранилище) – это культурно - просветительное и.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
1 Exactus Expert - система интеллектуального поиска и анализа научных публикаций Смирнов Иван Валентинович с.н.с. ИСА РАН.
Тема семинара:. Библиографическая справка ответ на разовый запрос, содержащий библиографическую информацию о наличии и (или) местонахождении документа.
Говоря о двух последних «умениях» компьютера, необходимо помнить, что почти во всех существующих системах автоматического реферирования в качестве основных.
Презентация по просеминару «Корректорское дело» Тема: «Знаки корректуры и правила их применения»
Подготовка и публикация ЭОР КГОУ СПО « Хабаровский педагогический колледж » Шевелёва В. С г.
Урок 2: Гипертекст "Это открытая книга... В ней есть словарные статьи, перекрестные ссылки и комментарии как в священных книгах или кроссвордах, и все.
БИБЛИОТЕЧНЫЙ УРОК. СПРАВОЧНЫЕ ИЗДАНИЯ. Справочные издания включают сведения научного или прикладного характера, расположенные в порядке удобном для их.
Частные методы, входящие в контекстный анализ. Апресян,Ю.Д. Дистрибутивный анализ // Лингвистический энциклопедический словарь. - М., 1990: 137 – 138.
Тема проекта: Авторы: обучающиеся начальной школы Сургут 2011.
Транксрипт:

Ю.Н.Филиппович, А.Ю.Филиппович, ИНТЕГРИРОВАННЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ В МЕДИАИНДУСТРИИ Слайд-лекции для студентов специальности «Информационные технологии в медиаиндустрии» Модуль 1. Интегрированные издательские технологии Тема. Технологии корректуры. Москва, 2012 г.

Корректура Корректура – совокупность процессов, назначением которых является исправление ошибок и нарушений технических правил в наборе. В «традиционном классическом описании» корректура состоит из двух основных процессов: чтения корректурных оттисков и правки набора.

Корректурные знаки При чтении оттисков ошибки отмечаются специальными корректурными знаками, повторяемыми на полях оттисков, причем рядом с этими знаками указываются правильные буквы, слова и т.п. Фрагмент корректурной правкиПримеры корректурных знаков

Факторы, влияющие на процесс корректуры особенности издания (первое издание или какое-либо его переиздание); индивидуальные особенности текста (тема, предмет, язык, авторские цели, назначение и т.п.); профессионализм корректора (культурный уровень, знания, навыки, умения, психологические установки, социально-экономические факторы и др.); технологические факторы (форма рабочего материала, инструментальные аппаратные и программные средства поддержки корректорской деятельности, временные и стоймостные ресурсные ограничения, методика и др.)

Инструментарий корректора Печатные словари. Электронные лексикографические ресурсы, в числе которых: – локальные электронные словари; – интернет-порталы; – словарные базы данных; – встроенные в текстовые редакторы и издательские системы орфо- и грамматические редакторы; – программы спеллеры.

Два основных типа словарей Лингвистические словари – Объектом описания лингвистических словарей являются языковые единицы: слова, устойчивые словосочетания, словоформы, морфемы и др. Энциклопедические словари – Энциклопедические словари – научные или научно- популярные справочные издания, представляющие собой систематизированный свод знаний в каких-либо областях. – Объектом их описания служат научные (реже обиходные) понятия, термины, исторические события, персоналии, географические реалии и т.д.

Два основных типа словарей Пример словарной статьи из лингвистического словаря: – СУРОК, -р к а, м. Небольшой грызун сем. бельчьих, живущий в норах и зимой впадающий в спячку. Пример словарной статьи из энциклопедического словаря: – СУРКИ, род млекопитающих сем. бельчьих. Длина тела до 60 см, хвоста менее 1/2 длины тела. 13 видов, в Сев. полушарии (исключая пустыни и тундры); в России неск. видов. Объект промысла (мех, жир, мясо). Могут быть носителями возбудителя чумы. Нек-рые виды редки, охраняются.

Грамматические словари Грамматические словари – это словари, которые содержат сведения о морфологических и синтаксических свойствах слова. Расположение в прямом или обратном алфавитном порядке. Принципы отбора и объем сведений о слове различны в зависимости от назначения и адресата каждого грамматического словаря. Печатные словари: – Зализняк А. А. Грамматический словарь русского языка. Словоизменение. М., 1977; 3-е изд. М., – Дискурсивные слова русского языка: Опыт конкретно-семантического описания / Под ред. К. Киселевой и Д. Пайара. М., – Панов Б. Т., Текучев А. В. Грамматико-орфографический словарь русского языка. М., 1976.

Пример словарной статьи АВОСЬ, част., разг. Употребляется для выражения такого предположения, которое свидетельствует, с одной стороны, о желательности для говорящего наступления какого-л. события, а с другой о ясном осознании говорящим того, что если предшествующее событие и наступит, то только из-за особенного стечения обстоятельств, т. е. независимо от его воли. * С и н. может быть,

Морфемные и словообразовательные словари Словари, показывающие членение слов на составляющие их морфемы, словообразовательную структуру слова, а также совокупность слов с данной морфемой – корневой или аффиксальной. Слова в словообразовательных словарях приводятся с расчленением на морфемы и с ударением. Морфема (от греч.morphe – форма) – минимальная значимая часть слова. Существует 4 основных типа морфемных словообразовательных словарей: – словари-корнесловы; – словари морфемной членимости слов; – толковые словари аффиксальных морфем; – частотные словообразовательные словари.

Морфемные и словообразовательные словари Печатные словари: – Тихонов А. Н. Словообразовательный словарь русского языка: В 2 т. М., 1985; 2-е изд., стер. М., – Кузнецова А. И., Ефремова Т. Ф. Словарь морфем русского языка. М., – Ефремова Т. Ф. Толковый словарь словообразовательных единиц русского языка. М., Электронные ресурсы: – Морфемно-орфографический словарь на

Орфографические словари Словари, содержащие алфавитный перечень слов в их нормативном написании. Печатные словари: – Зелинский В. Подробный орфографический словарь. Для учащихся. Изд. 2-е, испр. и значительно увеличенное. М., – Букчина Б. З. Русский орфографический словарь. М., – Орфографический словарь русского языка / Под ред. С. Г. Бархударова, С. И. Ожегова, А. Б. Шапиро. М., Электронные ресурсы: – – Пример словарной статьи: шаблоìнный; кр. ф. -оìнен, - оìнна филлопоìд, -а

Электронные словари Проект «РУССКИЕ СЛОВАРИ» предназначен для всех, кто интересуется русским языком - как родным или как иностранным, для учащихся средней и высшей школы, а также для специалистов, профессионально занимающихся лингвистикой или преподаванием русского языка. Он содержит общедоступную лингвистическую информацию разного типа. Словарная база сайта содержит 21 том основных интерактивных лингвистических словарей, многие из которых входят в золотой фонд отечественной лексикографии. Режим доступа:

Электронные словари Яндекс-словари содержат 11 словарей русского языка, 86 энциклопедий и переводной словарь (7 языков). – Словари и энциклопедии на Академике – «Кругосвет» – универсальная энциклопедия – Википедия – свободная энциклопедия – Словари на «Рубриконе» – река информации – «Мир словарей» – коллекция словарей и энциклопедий – Мир энциклопедий –

Электронные переводные словари Система электронных словарей Lingvo – Онлайновый переводчик компании ПРОМТ – Электронные словари компании Мультилекс – Переводной словарь Google –

Корректура Сегодня для подготовки текстов используются различные программы верстки и текстовые редакторы. А в качестве средств автоматизации корректурных процессов выступают различные встроенные функции проверки текста на наличие орфографических, синтаксических и стилистических ошибок. Одна из таких функций – функция спеллер (speller – сокращение от spelling checker – программа поиска опечаток, корректор). Особенность современных программ проверки текстов является их ориентация на современную общеупотребительную лексику, что затрудняет их использование для специфических, старинных текстов.

Традиционная технология корректуры где: tср – время сравнения слова, tи – время исправления ошибки; ni – общее количество слов на i-ой странице, nоi – количество ошибок на i-ой странице. где m – количество страниц всего текста.

Автоматизированная технология корректуры

где nнов_i – количество новых слов на i-ой странице, nоi – количество ошибок на i-ой странице. Количество новых слов – занесенных в словарь: где nрi – количество разных слов на i-ой странице (неповторяющихся на странице), - количество общих разных слов i-ой и предыдущей (i-1) странице.

Эффективность технологии корректуры Эффективность той или иной технологии корректуры будем определять исходя их времени, затрачиваемом на корректуру текста. В формальной модели корректуры фигурируют два вида параметров: время, затрачиваемое, на ту или иную деятельность и количественные характеристики. Проанализируем количественные характеристики на примере корректуры Словаря Академии Российской гг.

Исследование количества ошибок Характеристики сравнения (кол-во)Введенный текстВычитанный текст Всего записей Всего неповторяющихся записей Всего неповторяющихся слов Одинаковых записей5499 Одинаковых неповторяющихся записей5477 Одинаковых неповторяющихся слов5571 Ошибок в неповторяющихся записях601 Ошибок в неповторяющихся словах460 Ошибок в номерах колонок108 Отсутствующих записей11 Отсутствующих номеров колонок33 Результаты сравнения ошибок в «Показании» САР 1-го тома

Исследование количества ошибок Общее количество несоответствий (ошибок) в тексте Показания составляет 612 ошибок. Общий объем текста Показания составляет 46 страниц. Таким образом, среднее количество ошибок на странице составляет 13,3. Если считать, что ошибки распределены равномерно по всему тексту словаря, тогда на одной странице будет встречаться ошибок.

Анализ систематических ошибок Ошибки, связанные со старинной лексикой и грамматикой

Анализ систематических ошибок Ошибки, обусловленные особенностями графем шрифта

Анализ систематических ошибок Другие систематические ошибки (технические)

Анализ систематических ошибок Другие систематические ошибки

Анализ систематических ошибок Соотношение разных видов ошибок Характер некоторых систематических ошибок свидетельствует о том, что данный текст был сформирован с помощью ручного набора. На это указывают некоторые технические ошибки и опечатки, которые мог сделать только человек. Некоторые систематические ошибки можно устранить автоматически с помощью замен, что уменьшит временные затраты на корректуру.

Исследование частотных характеристик слов Графическая модель страниц Словаря

Исследование частотных характеристик слов Характеристики сравнения Страницы Общее количество слов на странице Количество разных слов Общее количество ранее встречавшихся на странице слов Количество разных слов ранее встречавшихся на странице Количество слов проверяемых корректором Характеристики страниц 1-8

Исследование частотных характеристик слов Соотношение количества ранее встречавшихся слов, известных и не известных Word

Исследование частотных характеристик слов Рост количества ранее встречавшихся слов в выборках

Эффективность технологии корректуры Для оценки общего количества проверяемых слов при использовании автоматизированной технологии корректуры для 1-8 страниц была построена аппроксимирующая функция. Количество слов, проверяемых корректором для страниц 1-8.

Эффективность технологии корректуры Соотношение количества слов, проверяемых корректором для страниц с учетом промежуточных значений Для оценки общего количества слов на промежутке с 9 по 570 страницу построим аппроксимирующую кривую с учетом промежуточных значений. В качестве метода аппроксимации используем метод наименьших квадратов и линейную зависимость. Уравнение аппроксимирующей прямой имеет вид: y = -0,11 x + 10,84.

Эффективность технологии корректуры Количество слов, проверяемых корректором при использовании автоматизированной технологии корректуры определяется следующим выражением: Эта величина соответствует количеству новых слов:

Эффективность технологии корректуры Будем считать, что время исправления ошибки в K раз больше времени сравнения слова, тогда, обозначив время сравнения как t, получим: tср = t, tи = Kt.

Эффективность технологии корректуры Традиционная технологий корректуры: Автоматизированная технологий корректуры:

Эффективность технологии корректуры Сравнение технологий корректуры: При K=1, суммарный выигрыш времени корректуры может достигнуть 68%, а при К=10 и выигрыш времени корректуры 47,7%.

Эффективность технологии корректуры Оценивая полученные показатели, следует отметить ряд допущений, которые были приняты в формальной модели корректуры. Во-первых, было принято, что ошибки распределены по тексту равномерно, поэтому количество ошибок на каждой странице постоянно. Во-вторых, рассматривались только орфографические ошибки, не рассматривались ошибки пунктуации и связанные с нарушением правил верстки. В данную модель не входят также ошибки в словах, входящих в состав словаря спеллера.