Технологии обработки информации. Лекция 1. Введение Антон Викторович Кудинов, доцент кафедры ВТ.

Презентация:



Advertisements
Похожие презентации
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ЭКОНОМИКЕ Тема 2. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ОБРАБОТКИ ДАННЫХ Подготовил Иванов А.Н.
Advertisements

Введение в задачи исследования и проектирования цифровых систем Санкт-Петербургский государственный университет Факультет прикладной математики - процессов.
ПРОЕКТ ОТКРЫТАЯ МЕДИЦИНА ТМ:Аналитик. 2 Назначение системы АИС ТМ:Аналитик Обработка Управление Интеграция данных, отражающих различные аспекты деятельности.
ГОРОДСКОЙ МЕТОДИЧЕСКИЙ ЦЕНТР mosmetod.ru Примерная программа учебного предмета «Информатика»
Информация 2 Термин Информация происходит от латинского слова informatio – пояснение, разъяснение.
Меркулова О.П. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПСИХОЛОГИИ (Пс-1) Тема: Информация и информационные технологии (2 ч.)
Лекция 2. Поддержка принятия управленческих решений А. Ф. Оськин Кафедра технологий программирования Методы и алгоритмы принятия решений1.
ИНФОРМАЦИЯ. ИНФОРМАТИКА. ИНФОРМАТИЗАЦИЯ. ВОПРОСЫ: n1n1. Что такое информация? n2n2. Носители информации. n3n3. Виды классификации информации. n4n4. Свойства.
Программа 8-9 класс Семакин И.Г.. 8 класс (1 час в неделю) 1.Введение в предмет (1 ч) 2.Человек и информация (4 ч (3 + 1)) 3.Первое знакомство с компьютером.
Введение в информатику Окладникова О.Л.. Термин «информация» Происходит от латинского слова informatio, что означает разъяснение, осведомление, изложение.
Урок 1 Введение. Понятие информационной технологии.
Формирование универсальных учебных действий на уроках информатики Босова Людмила Леонидовна
1. Что такое информационная безопасность? 2. От чего необходимо защищать информацию? 3. Как обеспечить информационную безопасность данных на личном ПК?
Информация и информационные процессы Информация и информационные процессы 1.Понятие информации 2.Классификация информации 3.Свойства информации.
Понятие информации является ключевым понятием информатики. Любая деятельность человека представляет собой процесс сбора и переработки информации, принятия.
Колмыкова Оксана Владимировна Кафедра ИСПИ Ауд
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ.
сведения об окружающем мире Задание «Свойства информации» Задание «Свойства информации»
Человек и информация. Работу выполнила Ученица 8 «А» класса МОУ лицея 10 Осотова Дарья.
Компьютерный анализ естественно-языкового текста Кафедра информационных систем в искусстве и гуманитарных науках.
Транксрипт:

Технологии обработки информации. Лекция 1. Введение Антон Викторович Кудинов, доцент кафедры ВТ

Содержание Структура курса Основные понятия – информация, данные, знания Виды информации Обработка данных и ее виды Модели процессов обработки данных Общие задачи обработки данных Понятие анализа данных. Технология OLAP Задачи обработки данных различных типов Прикладные области обработки данных, 2

Структура курса Итоговая аттестация экзамен 3

Выписка из ГОС Студент должен знать : основные виды и процедуры обработки информации, модели и методы решения задач обработки информации ( генерация отчетов, поддержка принятия решений, анализ данных, искусственный интеллект, обработка изображений ) Студент должен уметь : осуществлять математическую и информационную постановку задач по обработке информации, использовать алгоритмы обработки информации для различных приложений Студент должен владеть : инструментальными средствами обработки информации 4

Лекции Введение. Понятие информации, данных, знаний. Типы данных. Общие задачи обработки информации. Задачи обработки данных различных типов Принципы и методы оцифровки аналоговых данных. Стандарты представления различных видов цифровой информации Технология обработки графической информации. Кодирование и сжатие изображений Технология обработки текстовой информации Технология обработки числовой информации. Статистические методы. Технология Data Mining Технология хранения, поиска и сортировки информации Методы и технологии интеграции данных Аналитическая обработка информации. Технология OLAP Инструментальные средства обработки информации 5

Лабораторные работы Методы и алгоритмы сжатия информации (8 часов ) Технология обработки графической информации. Практическое изучение и освоение возможностей методов бинарного анализа при решении задач выделение контуров, выпуклых областей и связных компонент (8 часов ) Методы и алгоритмы обработки текстовой информации. Алгоритмы поиска и сортировки информации (8 часов ) Интеллектуальные методы и алгоритмы обработки числовой информации. Алгоритмы классификации (8 часов ) 6

Учебно - методическое обеспечение дисциплины Программные продукты : Microsoft SQL Server 2008 Analysis Services Microsoft Visual Studio 2010 Borland Delphi, C++ Builder Литература : Назаров С. В. и др. Основы информационных технологий. Курс на портале Интернет - университета Информационных технологий Павлидис Т. Алгоритмы машинной графики и обработки изображений : Пер. с англ. - М.: Радио и связь, с.: ил. Роджерс Д. Алгоритмические основы машинной графики : Пер. с англ. - М.: Мир, с., ил. Бендат Дж., Пирсол А. Прикладной анализ случайных данных : Пер. с англ. – М.: Мир, – 540 с. Чубукова И. А. Data Mining : учебное пособие – 2- е изд., испр. – М.: Интернет - Университет Информационных технологий ; БИНОМ. Лаборатория знаний, – 382 с. 7

Введение. Основные понятия В чем разница между данными, информацией и знаниями ? 8

Понятие информации (1) Понятие информации переживает свою эволюцию Философы : информация - это передача, отражение разнообразия в любых объектах и процессах живой и даже неживой природы Математики, физики и специалисты по системам связи : информация - фактор и мера уменьшения, снятия неопределенности в результате получения сообщения Кибернетики : информация - сообщение, неразрывно связанное с управлением в единстве синтаксических, семантических и прагматических характеристик Для социологов важны аксиологические ( т. е. связанные с ценностью, полезностью ) свойства информации, для ИТ - специалистов наиболее существенным является знаковое представление информации и т. д. 9

Понятие информации, данных (2) Информация ( от лат. informatio, разъяснение, изложение, осведомленность ) сведения о чем - либо, независимо от формы их представления ( Википедия ) Информация - новые знания, полученные в результате интерпретации данных ( Энциклопедия технологий баз данных ) Данные - факты, идеи, сведения, представленные в знаковой ( символьной ) форме, позволяющей производить их передачу, обработку и интерпретацию Данные – представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе ( Википедия ) 10

Понятие информации, данных (3) Информация - это потенциальное свойство данных, которое может быть реализовано одним воспринявшим их человеком и не реализовано другим Объектом машинной обработки являются данные, а не информация ! Знание форма существования и систематизации результатов познавательной деятельности человека, субъективный образ реальности в форме понятий и представлений ( Википедия ) Сведения - это знания, выраженные в сигналах, сообщениях, известиях, уведомлениях и т. д. 11

Виды информации Текстовая передаваемая в виде символов, предназначенных обозначать лексемы языка Числовая в виде цифр и знаков, обозначающих математические действия Графическая в виде изображений, предметов, графиков Звуковая устная или в виде записи и передачи лексем языка аудиальным путём другие виды 12

Способы обработки информации неавтоматизированный автоматизированный 13

Обработка данных (1) Обработка - преобразование объектов обработки, которое придает им новые, необходимые свойства. Это преобразование осуществляется в форме процесса, протекающего во времени Технология – система взаимосвязанных способов обработки материалов и приемов изготовления продукции в производственном процессе Информационная технология – совокупность методов, способов, приемов и средств обработки документированной информации, включая прикладные программные средства, и регламентированного порядка их применения Важное свойство процесса обработки – этапность, стадийность 14

Обработка данных (2) Алгоритм - это точное, т. е. сформулированное на определенном языке, конечное описание того или иного общего метода, основанного на применении исполнимых элементарных тактов обработки Виды обработки : последовательная параллельная Формальные модели обработки данных : конечные автоматы сети Петри процессы Хоара системы и сети массового обслуживания и др. 15

Модель процесса обработки данных. Конечные автоматы Конечным автоматом называется набор из пяти объектов, в котором : - входной алфавит ; - выходной алфавит ); - множество внутренних состояний автомата ; - функция перехода в следующее состояние ( переходная функция ); - функция выхода ( выходная функция ). 16

Модель процесса обработки данных. Сети Петри В сетях Петри события и условия представлены абстрактными символами из двух непересекающихся алфавитов, называемых соответственно множеством переходов и множеством мест 17 В процессе функционирования сети происходит смена разметок мест, как результат срабатывания ее переходов. Сеть останавливается, если ни один из ее переходов не может сработать

Типичные цели обработки данных собрать всю доступную информацию, представленную в данных различной природы отделить существенную информацию, представленную данными, от несущественной, для рассмотрения в данный момент представить существенную информацию в виде, наиболее удобном для восприятия человеком 18

Общие задачи обработки данных (1) сбор данных оценка качества данных ввод данных в различные информационные системы автоматический ввод данных ручной ввод данных контроль и исправление ошибок ручного ввода накопление данных хранение накопленных данных, в том числе : учёт и инвентаризация данных сортировка данных классификация данных 19

Общие задачи обработки данных (2) доступ к данным поиск нужных данных в накопленных массивах данных контроль доступа и защита данных передача данных и обмен данными интеграция данных упаковка данных маркировка данных надёжность передачи данных 20

Общие задачи обработки данных (3) представление данных, как то : наглядные представления данных : текстовое представление данных табличное представление данных графическое представление данных иное визуальное представление данных форматы представления данных в различных информационных системах 21

Общие задачи обработки данных. Выводы ввод ( в т. ч. оцифровка ) поиск сортировка фильтрация классификация ( интерпретация ) сжатие ( компрессия ) представление ( форматы, визуализация ) 22

Этапы процесса обработки данных Подготовка данных ( предварительная обработка ) Анализ данных ( извлечение знаний, моделирование ) Представление знаний ( визуализация, утилизация ) 23

Понятие анализа данных Анализ данных область математики и информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных ( в широком смысле ) данных ; процесс исследования, фильтрации, преобразования и моделирования данных с целью извлечения полезной информации и принятия решений Интеллектуальный анализ данных ( Business intelligence, BI ) это особый метод анализа данных, который фокусируется на моделировании и открытии данных, а не на их описании 24

OLAP OLAP ( англ. online analytical processing, оперативная аналитическая обработка ) технология обработки данных, заключающаяся в подготовке суммарной ( агрегированной ) информации на основе больших массивов данных, структурированных по многомерному принципу Агрегатные функции образуют многомерный ( и, следовательно, не реляционный ) набор данных ( называемый гиперкубом или метакубом ), оси которого содержат параметры, а ячейки зависящие от них агрегатные данные. Вдоль каждой оси данные могут быть организованы в виде иерархии, представляющей различные уровни их детализации 25

Структура OLAP- куба 26

Обработка тестовых данных (1) поиск ( в т. ч. по ключевым словам ) семантический анализ тематическая и жанровая классификация сообщений на основе лексико - статистического анализа ( в т. ч. фильтрация спама ) отбор сообщений на основе структурно - статистических признаков оценка достоверности сокращения избыточности представления ( реферирование и аннотирование ) сжатие текстовых данных 27

Обработка тестовых данных (2) 28 Результаты обработки текстов песен- победителей "Евровидения« с 1956 по 2010 гг.

Обработка изображений Геометрические преобразования Цветовая коррекция Сравнение двух и более изображений Комбинирование изображений различными способами Интерполяция и сглаживание Разделение изображения на области ( сегментация изображений ). Редактирование и ретуширование Фильтрация изображений Распознавание текста Машинное зрение Сжатие изображений 29

Обработка числовой информации Задачи Классификация Кластеризация Сокращение описания Ассоциация Прогнозирование Анализ отклонений Оценивание Анализ связей Статические методы Машинное обучение 30

Что такое Data Mining Data Mining – « добыча данных » Извлечение новых знаний и неочевидных зависимостей из больших объемов сложных данных Предмет интереса : Нетривиальные знания Неявные зависимости Предварительно неизвестные знания Потенциально полезные знания Синонимы Интеллектуальный анализ данных - Business Intelligence Открытие знаний в БД Базы знаний. Извлечение знаний Анализ паттернов 31

Прикладные области обработки данных (1) Астрономия Медицина и биотехнологии Бухгалтерский учёт и инвентаризация Издательское дело Компьютерная графика и обработка изображений Конкурентная разведка Криптография Нанотехнологии Обработка результатов экспериментов Обработка сигналов 32

Прикладные области обработки данных (2) Обучение Представление знаний Прикладная статистика Экономическая кибернетика Экспериментальная психология 33

Спасибо за внимание ! 34