Кодирование символов : ASCII, KOI8, UNICODE. Все, что мы видим на экране монитора это символы. Для вывода каждого символа нужен машинный код, который.

Презентация:



Advertisements
Похожие презентации
Кодирование текстовой информации. Минимальной и основной единицей измерения информации является один бит. Бит – количество информации, необходимое для.
Advertisements

Двоичное кодирование текстовой информации. Текст – последовательность символов компьютерного алфавита. Текстовая информация – это информация, выраженная.
Текст – последовательность символов компьютерного алфавита. Текстовая информация – это информация, выраженная с помощью естественных и формальных языков.
Кодирование и обработка информации 10 класс.
Для английского языка действует стандарт ASCII (American Standard Code For Information Interchange - стандартный код информационного обмена США). В системе.
двоичное кодирование текстовой информации ; таблицы кодировки ; понятие кодировки Unicode; научиться определять числовые коды символов ; научиться вводить.
Двоичное кодирование текстовой информации Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и.
Любая информация всегда хранится в виде кодов. Код - система знаков для представления информации. Кодирование информации – переход от одной формы представления.
КОДИРОВАНИЕТЕКСТАКОДИРОВАНИЕТЕКСТАКОДИРОВАНИЕТЕКСТАКОДИРОВАНИЕТЕКСТА.
Московский Гуманитарный Университет. Тема доклада: «Стандарты кодов символов в Информационных Системах. Использование оригинальных шрифтов в ИС». Подготовила:
Кодирование текстовой информации. Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время.
это информация, выраженная в письменной форме преобразование входной информации в форму, воспринимаемую компьютером, т.е. двоичный код. преобразование.
ОЦЕНКА КОЛИЧЕСТВЕННЫХ ПАРАМЕТРОВ ТЕКСТОВЫХ ДОКУМЕНТОВ ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ.
ОЦЕНКА КОЛИЧЕСТВЕННЫХ ПАРАМЕТРОВ ТЕКСТОВЫХ ДОКУМЕНТОВ ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ.
Представление информации в ЭВМ Урок 1. Основы кодирования информации в ЭВМ Обработка информации в ЭВМ основана на обмене электрическими сигналами между.
Оценивание количественных параметров информационных объектов Подготовка к ГИА по информатике Задания А 1.
Информация, выраженная с помощью естественных и формальных языков в письменной форме, называется текстовой информацией.
Оценивание количественных параметров информационных объектов Подготовка к ГИА(ОГЭ) по информатике Задания А 1.
Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой.
Кодовые таблицы. Кодовая таблица - это таблица соответствий символов ( например, букв русского языка ) и их компьютерных кодов. В России есть несколько.
Транксрипт:

Кодирование символов : ASCII, KOI8, UNICODE

Все, что мы видим на экране монитора это символы. Для вывода каждого символа нужен машинный код, который будет соответствовать только этому символу, или же правило, организующее корректный вывод каждого символа на дисплей. Попробуем прикинуть, сколько же нужно всего символов пользователю: для начала, 26 букв английского алфавита (строчных), во-вторых, 26 прописных, пробел, 10 цифр, 9 знаков препинания (., : ! " ; ? ( ) ), 5 арифметических действий (+,,*, /, ^) и спецсимволы ( % _ # $, ^, &, >,

ASCII Для отображения всех этих символов была создана таблица ASCII (англ. American Standard Code for Information Interchange) американский стандартный код для обмена информацией; произносится [э́ски].

Изначально разработана как 7-битная, потом ASCII стала восприниматься как 8-битная. Так выглядят таблицы ASCII- кодов с печатаемыми и непечатаемыми символами (для удобства в таблицах приведены коды в шестнадцатеричной системе счисления). ASCII-кодировка: печатаемые символы

Дальнейшее развитие привело к появлению понятия «кодовая страница», т.е. набор из 256 символов для определения группы языков (например, некоторые славянские языки с латинским алфавитом, турецкий, мальтийский, эсперанто и т.д.), но она не позволяла смешивать языки, и к тому же, не могла создать кодовые страницы японского и китайского языков. Но скоро набора кодов стало не хватать. Возникла новая таблица кодировок, названная «расширенная таблица ASCII», число знакомест в которой возросло до 256. Таблица имела полностью восьми битный код Latin-1.

КОИ-8 KOI8 восьмибитовая ASCII-совместимая кодовая страница, созданная для кодирования букв кириллических алфавитов. В КОИ-8 символы русского алфавита поместили в верхнюю часть кодовой таблицы так, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это значит, что убрав в тексте, написанном в КОИ-8, восьмой бит каждого символа, то получится текст, написанный латинскими символами. Например, слова «Кодировка» превратились бы в «kODIROVKA».

ASCII-кодировка: непечатаемые символы

UNICODE Юнико́д стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Это новая система кодирования символов, способная закодировать символов (code points). Большинство символов, используемых в основных языках мира занимают code points. Остальные (более миллиона) code points вполне достаточно для кодирования всех известных символов, включая даже исторические знаки и редкие языки. Стандарт UNICODE очень обширен, имеет три формы: 32-битную (UTF-32), 16- битную (UTF-16) и 8-битную (UTF-8). Весьма распространенная восьми битная форма UTF-8 была создана для удобной совместимости с ASCII- ориентированными системами кодирования

Решение примера. При перекодировке в 8-битный код, каждый символ уменьшился в «объеме» в два раза (было 16 бит стало 8). Следовательно, и все сообщение (сумма кодов символов) тоже уменьшилось в 2 раза. Т.к. полученное сообщение стало меньше на 480 бит, то умножив его на 2, мы получим длину исходного. Это 960 бит. Изначально кодировка была 16-битная, значит разделив исходную длину 960 бит на 16 разрядов, получим кол-во символов. 960/16=60 символов (вариант 2). Ответ:вариант 2 60 символов. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах? Варианты: