Представление знаний в информационных системах Спицын В.Г Томский политехнический университет work
2 Лекция 1 СИСТЕМЫ, ОСНОВАННЫЕ НА ЗНАНИЯХ Введение История создания искусственного интеллекта Процесс мышления Основные понятия и классификация систем, основанных на знаниях Экспертные системы как элемент искусственного интеллекта Методы извлечения знаний Литература
3 Введение В первой лекции рассматриваются: история возникновения систем искусственного интеллекта, процесс мышления человека, системы, основанные на знаниях, методы извлечения знаний.
4 1. История создания искусственного интеллекта Появление искусственного интеллекта (ИИ) как научного направления произошло после создания ЭВМ в 40-х годах XX в. [1-3]. В это время Норберт Винер создал свои основополагающие работы по кибернетике. Вскоре произошло разделение его на два направления: нейрокибернетика и кибернетика черного ящика.
5 Этапы развития ИИ Нейрокибернетика ориентирована на программно-аппаратное моделирование структур, подобных структуре мозга. Основной принцип кибернетики черного ящика заключается в том, что не имеет значения как построено мыслящее устройство. Требуется, чтобы на заданные входные воздействия оно реагировало так же, как и человеческий мозг. В США в середине 1970-х годов на смену поискам универсального алгоритма мышления пришла идея моделировать конкретные знания специалистов-экспертов. Появились первые коммерческие системы, основанные на знаниях, или экспертные системы.
6 2. Процесс мышления Процесс мышления, протекающий в человеческом сознании, чрезвычайно сложен [4]. Одна ячейка человеческого глаза способна выполнять за 10 мс обработку, эквивалентную решению системы из 500 нелинейных дифференциальных уравнений. Глаз человека насчитывает не менее 10 миллионов ячеек, компьютеру Cray-1 необходимо затратить по меньшей мере 100 лет, чтобы воспроизвести процессы, происходящие ежесекундно в человеческом глазу.
Обработка и анализ информации Данные из внешнего мира воспринимаются человеком с помощью одного из органов чувств и затем помещаются в буфер кратковременной памяти для анализа [4]. В долговременной памяти хранятся символьные образы и смысловые связи между ними, которые используются для объяснения новой информации, поступающей из кратковременной памяти. Большие объемы данных постоянно записываются в кратковременную память, и мы непрерывно анализируем и фильтруем получаемую информацию для того, чтобы определить степень ее важности и то, как она соотносится с образами, хранящимися в долговременной памяти 7
Система обработки информации у человека [4] 8
Доступ к информации Доступ к информации в долговременной памяти осуществляется достаточно эффективно. Любой элемент данных может быть извлечен в течение цикла обработки продолжительностью не более 70 мс и затем преобразован [4]. Перемещение данных из кратковременной памяти в долговременную память занимает приблизительно 15–20 минут. Если человек в получил мозговую травму, то долговременная память может восстановиться. Однако вся информация, поступившая в течение 15–20 минут до катастрофы, будет потеряна и никогда не восстановится. 9
10 Соответствие между памятью человека и ЭВМ Можно провести аналогию между кратковременной памятью человека и оперативной памятью ЭВМ, для которой отключение электропитания означает полное уничтожение всех данных [4]. Долговременная память человека похожа на дисковую память ЭВМ. В долговременной памяти образы существуют в виде циркулирующих электрохимических импульсов и физических нейронных взаимодействий.
11 Способ хранения символьных образов Способ хранения символьных образов в долговременной памяти во многом схож со способом хранения числовой информации в базах данных сетевого типа. Человеческая память хранит не числовые данные,, а образы или символы. В памяти существует система указателей, позволяющая нам быстро извлечь любой нужный символ и все данные, которые с ним связаны [4].
Символьные образы Символьные образы в мозге человека объединены в чанки – наборы фактов и связей между ними, запомненные и извлекаемые как единое целое. Чанки хранятся совместно с взаимосвязями между ними. В каждый момент времени человек может обрабатывать и интерпретировать не более четырех-семи чанков. 12
13 Способность формировать чанки Эксперт развивает свою способность объединять в чанки большие объемы данных и устанавливать иерархические связи между ними для того, чтобы быстро извлекать эти данные из памяти и с их помощью распознавать новые ситуации по мере поступления информации о них в мозг. Средний специалист в конкретной предметной области помнит от до чанков, которые могут быть использованы для решения той или иной проблемы. Их накопление в памяти человека и построение указателей для такого объема данных требуют от 10 до 20 лет.
14 3. Основные понятия и классификация систем, основанных на знаниях Искусственный интеллект ориентирован на создание методов дублирования функций живых интеллектуальных систем искусственными системами. Технология разработки интеллектуальных программных средств основана на том, что знания о решении задач отделяются от программ и реализуются в виде базы знаний, а в программах реализуется алгоритм манипулирования этими знаниями. Этот алгоритм называют механизмом логического вывода.
15 Виды знаний К знаниям относят информацию о логике решения задач, а к данным – информацию, которая должна быть проанализирована в соответствии с этой логикой. Знания, которыми обладает специалист в какой- либо предметной области, можно разделить на формализованные и неформализованные знания. Формализованные знания формулируются в виде общих и строгих суждений (законов, формул, моделей и алгоритмов), отражающих универсальные знания. Неформализованные знания отличаются конкретностью, субъективностью и приблизительностью.
16 Особенности экспертных систем Экспертные системы отличаются от традиционных программ тем, что ориентированы на решение неформализованных задач. Основными особенностями ЭС являются: алгоритм решения неизвестен заранее, а строится самой системой с помощью символических рассуждений, базирующихся на эвристических приемах; способность анализа и объяснений своих действий и знаний; способность приобретения новых знаний от пользователя – эксперта, не знающего программирования, и изменения в соответствии с ними своего поведения.
Экспертные системы представляют собой класс компьютерных программ, которые выдают советы, проводят анализ, выполняют классификацию и ставят диагноз. Они ориентированы на решение задач, обычно требующих проведения экспертизы человеком-специалистом. В отличие от машинных программ, использующих процедурный анализ, ЭС решают задачи в узкой предметной области на основе дедуктивных суждений. 17
Классификация ЭС по решаемой задаче Интерпретация. Диагностика. Мониторинг (наблюдение). Прогнозирование. Планирование. Проектирование. Обучение. Контроль и управление. Поддержка принятия решений. 18
4. Экспертные системы как элемент искусственного интеллекта Задачей ИИ является воссоздание с помощью искусственных устройств разумных рассуждений и действий. При этом возникают трудности двух типов: В большинстве случаев, выполняя какие-то действия, мы сами не осознаем, как мы это делаем. Нам неизвестен точный способ (или алгоритм), как именно происходит понимание текста, узнавание лица, решение задач. ЭВМ априори далеки от человеческого уровня компетентности: до начала любой их работы необходимо составить соответствующие программы. Однако в действительности языки программирования дают возможность выражать только элементарные понятия. 19
Применение ЭС позволяет при проектировании интегральных микросхем повысить производительность труда в 5 раз, при этом выполнение некоторых операций ускоряется в 10 раз; ускорить поиск неисправностей в 7 раз; повысить производительность труда программистов в 5 раз; при профессиональной подготовке сократить в 10 раз время на индивидуальную работу с обучаемым персоналом. 20
Система PROSPECTOR Предназначена для выдачи геологам следующей информации: о наличии в анализируемой местности залежей полезных ископаемых; об оценке геологических ресурсов района, о выборе мест, благоприятных для бурения. Система создана фирмой SRI International. Трудозатраты на создание системы оцениваются в 30 человеко-лет, система достигла промышленной стадии. База знаний (БЗ) системы содержат свыше 1000 правил и включают классификацию более 1000 геологических понятий. 21
Онтологии Развитие систем искусственного интеллекта и экспертных систем привело к появлению специальности инженера по онтологии. Под онтологией в данном случае понимается явная формальная спецификация терминов проблемной области и отношений между ними. Другими словами, онтологию можно представить как стандартный, согласованный набор терминов, применяемых для описания определенной прикладной области. 22
5. Извлечение знаний Можно выделить три основных аспекта извлечения знаний: психологический, лингвистический и гносеологический. Из них психологический аспект является ведущим, так как он определяет эффективность взаимодействия инженера по знаниям и эксперта. 23
Потери информации При разговорном общении велики потери информации. В связи с этим представляет интерес увеличение информативности общения аналитика и эксперта за счет применения психологических знаний. 24
Потери информации при разговорном общении 25
Число Ингве–Миллера На успех беседы влияет длина фраз. Установлено, что человек лучше всего воспринимает предложения с длиной 7+/-2 слова (число Ингве–Миллера). Опытные лекторы, используя короткие фразы в лекции, сводят потерю информации до 3 %. Несоблюдение этого принципа может приводить к потере до 20–30 % информации. 26
Лингвистический аспект извлечения знаний Лингвистический аспект извлечения знаний относится к исследованиям возникающих при этом языковых проблем. Различие языков, на которых говорят эксперт и аналитик, обусловливает возникновение языкового барьера между ними. Эти два языка являются отражением внутренней речи эксперта и аналитика. Психологи и эксперты полагают, что язык является основным средством мышления. 27
Гносеологический аспект Гносеологический аспект извлечения знаний связан с теорией отражения действительности в сознании человека. При этом вначале действительность отображается в сознании эксперта. Затем опыт эксперта интерпретируется сознанием инженера по знаниям. Далее происходит построение третьей интерпретации в виде поля знаний экспертной системы 28
Классификация методов извлечения знаний 29
СПИСОК ЛИТЕРАТУРЫ 1.Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. – Санкт-Петербург: Питер, – 382 с. 2.Корнеев В.В., Гареев А.Ф., Васютин С.В., Райх В.В. Базы данных. Интеллектуальная обработка информации. – М.: Нолидж, – 352 с. 3.Змитрович А.И. Интеллектуальные информационные системы. – Минск: Тетра Системс, – 367 с. 4.Таунсенд К., Фохт Д. Проектирование и программная реализация экспертных систем на персональных ЭВМ / пер. с англ. – М.: Финансы и статистика, – 320 с. 5.Спицын В.Г., Цой Ю.Р. Представление знаний в информационных системах: Учебное пособие. – Томск: Изд-во ТПУ, – 152 c. 6.Джарратано Д., Райли Г. Экспертные системы: принципы разработки и программирования / пер. с англ. – М.: Издательский дом Вильямс, – 1152 c. 7.Дюк В., Самойленко А. Data Mining. – Санкт-Петербург: Питер, – 368 с. 30