Знания. Виды знаний
Виды знаний Интенсиональные знания – знания о связях между атрибутами (признаки) объектов данных ПО. Они оперируют абстрактными объектами, событиями и отношениями. Экстенсиональные знания – представлены собственные данные, характеризующие конкретные объекты, их состояние, значение параметров в пространстве и времени. В глубоких знаниях отражается понимание структуры предметной области, назначение и взаимосвязь отдельных понятий. Глубинные знания в фундаментальных науках – это законы и теоретические обоснования. Поверхностные знания касаются внешних эмпирических (т.е. приобретённые знания опытным путём) ассоциаций с каким-либо феноменом предметной области. Жёсткие знания позволяют получать однозначные чёткие рекомендации при заданных начальных условиях. Мягкие знания дополняют множественные «размытые» решения и различные варианты рекомендаций.
Для наполнения ИИС знаниями, их необходимо представить в определенной форме. Возможны два основных способа наделения знаниями программных систем. Первый - поместить знания в программу, написанную на обычном языке про граммирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. В этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Затруднены модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой.
Второй способ базируется на концепции баз данных и заключается в вынесении знаний в отдельную категорию, т.е. знания представляются в определенном формате и помещаются в БЗ. База знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, и средства ведения диалога накладывают определенные ограничения на структуру БЗ и операции с нею. В современных ИИС принят этот способ.
Для размещения знаний в компьютере, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки интеллектуальной системы. При разработке ИИС сначала осуществляются накопление и представление знаний с участием человека, затем знания представляются определенными структурами данных, удобными для хранения и обработки в ЭВМ.
Знания в ИИС существуют в следующих формах: исходные знания (правила, выведенные на основе практического опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы и т. д.); описание исходных знаний средствами выбранной модели представления знаний (мн-во логических формул, продукционных правил, семантическая сеть, иерархии фреймов и т. п.); представление знаний структурами данных, которые предназначены для хранения и обработки в ЭВМ; базы знаний на машинных носителях информации.
Форма представления знаний оказывает существенное влияние на характеристики ИИС. Базы знаний являются моделями человеческих знаний. Все знания, которые привлекает человек в процессе решения сложных задач, смоделировать невозможно. Поэтому в интеллектуальных системах требуется четко разделить знания на те, которые предназначены для обработки компьютером, и знания, используемые человеком. Для решения сложных задач БЗ должна иметь достаточно большой объем, поэтому возникают проблемы управления такой базой. При выборе модели представления знаний следует учитывать факторы: однородность представления и простота понимания. Однородность представления приводит к упрощению механизма управления знаниями. Простота понимания важна для пользователей интеллектуальных систем и экспертов, чьи знания закладываются в ИИС. Если форма представления знаний будет трудна для понимания, то усложняются процессы приобретения и интерпретации знаний. Одновременно выполнить эти требования довольно сложно, особенно в больших системах, где неизбежным становится структурирование и модульное представление знаний.
Теоретический анализ процесса приобретения знаний
Термин «приобретение знаний» рассмотрим с точки зрения извлечения знаний, т.е. опросу экспертов в определенной предметной области, который выполняется аналитиком или инженером по знаниям. Темпы приобретения знаний в процессе опроса между экспертом и инженером по знаниям невелики, т.к.: перед опросом инженер по знаниям должен ознакомиться со спецификой и терминологией предметной области; для представления специфических знаний о предметной области нужно подобрать подходящую систему обозначений и структурную оболочку.
Стадии приобретения знаний Проанализируем процесс приобретения знаний в терминах модели процесса проектирования экспертной системы. Идентификация. Концептуализация. Формализация. Реализация. Тестирование.
Идентификация. Анализируется класс проблем, которые предполагается решать с помощью проектируемой системы, включая данные, которыми нужно оперировать и критерии оценки качества решений. Определяются ресурсы, доступные при разработке проекта, то есть источники экспертных знаний, трудоемкость, ограничение по времени, стоимости и вычислительным ресурсам. Концептуализация. Формулируются базовые концепции и отношения между ними. Характеризуются различные виды используемых данных, анализируются информационные потоки и лежащие в их основе структуры предметной области в терминах причинно-следственных связей, отношений "частное - целое", "постоянное - временное" и т.п.
Формализация. Представляется структура пространства состояний и характер методов поиска в нем. Выполняется оценка полноты и степени достоверности информации и других ограничений, накладываемых на логическую интерпретацию данных, таких как: зависимость от времени, надежность и полнота различных источников информации. Реализация. Преобразование формализованных знаний в рабочую программу, где особое внимание уделяется спецификации методов организации управления процессом и уточняются детали организации информационных потоков. Правила преобразовываются в форму, пригодную для выполнения программой в выбранном режиме управления. Принимается решение об используемых структурах данных и разбиении программы на ряд независимых модулей. Тестирование. Проверяется работа созданного варианта системы на большом числе задач. В процессе тестирования анализируются возможные источники ошибок в поведении системы. Чаще всего, таким источником является имеющийся в системе набор правил.
Таким образом, проектирование системы начинается с анализа класса проблем, которые предполагается решать при помощи этой системы. Нельзя заранее задавшись определенной концепцией или определенной структурной организацией знаний проектировать систему.
Уровни анализа знаний
Рассмотрим моделирующий подход к инженерии знаний в рамках созданной среды KADS. При этом приобретение знаний включает в себя не только извлечение специфических знаний о предметной области, но и интерпретацию извлеченных данных применительно к некоторой концептуальной оболочке и формализацию их таким способом, чтобы программа могла действительно использовать их в процессе работы.
В основу оболочки KADS положено ряд базовых принципов. Рассмотрим один из них: использование множества моделей, позволяющее преодолеть сложность процессов инженерии знаний.
Главным мотивом создания оболочки KADS было преодоление сложности знаний. При построении экспертных систем у инженеров по знаниям остаются три основных вопроса: определение проблемы, которую необходимо решить с помощью экспертной сис темы; определений функций, которые возлагаются на экспертную систему применительно к этой проблеме; определение задач, которые необходимо решить для выполнения возложенной функции.
Первый из принципов, положенных в основу KADS, состоит в том, что оболочка должна содержать множество частных моделей, помогающих найти ответ на стоящие вопросы. Примерами таких моделей могут служить: организационная модель "социально- экономической среды", в которой должна функционировать система (финансовые услуги, здравоохранение и т.п.); прикладная модель решаемой проблемы и выполняемой функции (диагностика, планирование расписания работ и т.д.); модель задач, демонстрирующая, как должна выполняться специфицированная функция, для чего производится ее разбиение на отдельные задачи, например, сбор данных о доходах, формирование гипотез о заболеваниях.
Соответствие со стадиями приобретения знаний Организационная и прикладная модели аналогичны стадии идентификации. Стадия "концептуализации" разбивается на две части: модель кооперации, или коммуникации, и модель эксперт насти. Первая отвечает за декомпозицию процесса решения проблемы, формирование набора простейших задач и распределение их между исполнителями, в качестве которых могут выступать и люди, и машины. Вторая модель представляет анализ разных видов знаний, которые эксперт использует в ходе решения проблемы (извлечением знаний). Рассматриваются формальное описание знаний в терминах принципиальных концепций и отношений между концепциями; выявление структурных свойств концептуальных знаний; как строится логический вывод в данной предметной области на основе имеющихся знаний. В состав, оболочки KADS также входит и модель проектирования, включающая технологии вычислений и механизмы представления знаний, которые могут быть использованы для реализации спецификаций, сформулированными предыдущими моделями (исследование механизмов программной реализации системы). Модель проектирования частично включает то, что ранее было отнесено к стадии реализации, но она не предполагает создание выполняемой программы.
Онтологический анализ
Онтология (от др.-греч. сантос сущее, логос учение, понятие) термин, определяющий учение о бытии, о сущем. Еще один уровень анализа знаний получил название онтологического анализа. В основе этого подхода лежит описание системы в терминах сущностей, отношений между ними и преобразования сущностей, которое выполняется в процессе решения некоторой задачи.
Для структурирования знаний о предметной области используются три основные категории: статическая онтология в нее входят сущности предметной области, их свойства и отношения; динамическая онтология определяет состояния, возникающие в процессе решения проблемы, и способ преобразования одних состояний в другие; эпистемическая онтология описывает знания, управляющие процессом перехода из одного состояния в другое.
Онтологический анализ предполагает, что решаемая проблема может быть сведена к проблеме поиска, но при этом не рассматривается, каким именно способом нужно выполнять поиск. Такая схема онтологического анализа выглядит довольно абстрактной, но ее ценность в том, что она упрощает анализ плохо структурированных задач. Например, когда при выявлении знаний в процессе опроса человека-эксперта, трудно найти подходящую схему организации знаний. Чаще всего в таких случаях выбирают фреймы или систему правил, откладывая таким образом выбор подходящего метода реализации на будущее, когда природа знаний эксперта станет более понятна.