Яковлев Андрей Россия, Москва, профессор МГТУ им. Н. Э. Баумана, академик Международной и Российской инженерных академий К вопросу анализа и оптимизации.

Презентация:



Advertisements
Похожие презентации
Конституционная экономика Игровые теории экономических процессов. Основные понятия и классификация игр. Белова Т.А. группа ю.з-1841.
Advertisements

Закон - это не зависящая ни от чьей воли, объективно наличествующая непреложность, заданность, сложившаяся в процессе существования данного явления, его.
Моделирование и исследование мехатронных систем Курс лекций.
МАГИСТЕРСКАЯ ПРОГРАММА ПО НАПРАВЛЕНИЮ «МЕНЕДЖМЕНТ» «ОРГАНИЗАЦИЯ И УПРАВЛЕНИЕ КОРПОРАТИВНЫМИ ФИНАНСАМИ»
ИННОВАЦИОННЫХ ПРОЕКТОВ Проблемы связанные с оценкой и реализацией ИННОВАЦИОННЫХ ПРОЕКТОВ.
Введение в задачи исследования и проектирования цифровых систем Санкт-Петербургский государственный университет Факультет прикладной математики - процессов.
Александров А.Г ИТО Методы теории планирования экспериментов 2. Стратегическое планирование машинных экспериментов с моделями систем 3. Тактическое.
Моделирование конфликтных ситуаций в экономике с применением математической теории игр.
Лекция 2 Принципы создания, классификация, состав и структура ЭИС.
Моделирование и формализация. Понятие о модели Модель – упрощенное представление о реальном объекте, процессе или явлении Модель сохраняет наиболее важные.
Основные принципы построения систем управления производственными процессами и техническими объектами Под управлением понимается целенаправленное запланированное.
Тема 1 Сущность менеджмента как процесса и науки.
Центр дистанционных автоматизированных учебных лабораторий Казанский государственный технический университет им. А.Н.Туполева Институт радиоэлектроники.
Лекция 4 Системный подход к разработке нефтяных месторождений МОНИТОРИНГ И РЕГУЛИРОВАНИЕ ПРОЦЕССОВ ИЗВЛЕЧЕНИЯ НЕФТИ.
ЛЕКЦИИ 8-9. Курс: Проектирование систем: Структурный подход Каф. Коммуникационные сети и системы, Факультет радиотехники и кибернетики Московский физико-технический.
МАГИСТЕРСКАЯ ПРОГРАММА «ФИНАНСОВАЯ ЭКОНОМИКА» КАЧЕСТВЕННОЕ ОБРАЗОВАНИЕ СЕГОДНЯ - ЗАЩИЩЕННОЕ БУДУЩЕЕ ЗАВТРА МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ.
Предложения по кадровой региональной политики для дорожной отрасли в рамках социального партнерства. Определить реальные цели и задачи социального партнерства.
РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ МОДЕЛИРОВАНИЯ КОНКУРЕНТНОГО РЫНКА НА КЛАСТЕРНЫХ СИСТЕМАХ Авторы: Е.В. Болгова, А.С. Кириллов, Д.В. Леонов Научный.
Прогнозирование ARMA- МОДЕЛЕЙ ВРЕМЕННЫХ РЯДОВ С «ПРОПУСКАМИ» БГУ, ФПМИ, МАГИСТРАНТ Лобач Сергей Викторович.
МОДЕЛИРОВАНИЕ И ФОРМАЛИЗАЦИЯ. Модель – упрощенное представление о реальном объекте, процессе или явлении. Модель сохраняет наиболее важные характеристики.
Транксрипт:

Яковлев Андрей Россия, Москва, профессор МГТУ им. Н. Э. Баумана, академик Международной и Российской инженерных академий К вопросу анализа и оптимизации адаптивно – игровых систем (АИС)

Неопределенности сотрудничества и конфликта Неопределенность – недостаточность априорной информации (неполная определенность цели, внешней среды, характеристик стратегии, параметров и структуры объекта управления). Конфликт-явления и ситуации, в которых участвуют две (или более) сторон, имеющие различные интересы и обладающие возможностями применять для достижения целей разнообразные средства и действия. Сотрудничество- деятельность, в которой происходит объединение участников (коалиций) операции для достижения их целей СлучайныеНеслучайные С неизвестными распределениями С неизвестными параметрами распределения С неизвестным законом распределения Природная неопределенность Поведенческая неопределенность Целевая неопределенность

Раскрытие неопределенности методами адаптации Адаптивные (обучающиеся) системы –класс систем, который способен с течением времени улучшать свое функционирование. (Цыпкин Яков Залманович) Традиционный адаптивный подход (дискретный алгоритм) опознания: a[n]= a[n-1] + Г[n]F [n-1]{y[n ] – a[n-1]f(x[n])}f(x[n]), где а[n]- вектор определяемых параметров, Г[n]-квадратная дискретная матрица, элементы которой постоянны или зависят от n, F {.} – градиент случайного функционала, f(x[n]) – линейные независимые функции, формирующие разделяющую функцию y[n]=a т f[n], известную с точностью до параметра а. Адаптивные системы управления: *Самонастраивающиеся, в тои числе и экстремальные (с адаптацией параметров); *Самоорганизующиеся (с адаптацией структуры); * Самообучающиеся (с адаптацией алгоритмов).

Игровая модель конфликта Ф ЛПР (P,I) n n Абстрактная модель n n D = = , где n n А-множество целей, n n S-множество стратегий, n n - множество факторов внешней среды, n n Н-Н--множество операций n n G-множество исходов операции, n n Y-Y-вектор характеристик операций, n n F-F-множество операторов соответствия «результат-показатель» n n W-множество показателей эффективности решений, n n K-множество критериев эффективности решений, n n Р-множество отношений предпочтения ЛПР, n n I-множество информированности ЛПР. Ф Игра: 1.Кто и как в конфликте участвует? 2. Каковы его исходы? Кто в этих исходах заинтересован и каковы его результаты? Стратегические игры: более одной коалиции Ri, i.>1,2,… Бескоалиционные игры: Rи = Rд. Антагонистические игры: W = - W. Неатагонистические игры: W = - W. R- коалиции интересов и действий,

Классификация АИС Технические АИС: СУ управления подвижными объектами (морскими, воздушными, космическими); системы управления энергосистемами (атомными и электрическими станциями), телекоммуникациями и т.п. Человеко-машинные АИС : ручного и полуавтоматического управления, автоматизированные и др. Интеллектуальные АИС : управление социально- экономическими системами (формирование концепций, стратегий, системных программ и проектов), управление инвестиционно- инновационной и научной деятельностью (введение в хозяйственный оборот РНТД и интеллектуальной собственности и т.п.), решение международных конфликтов и образование региональных содружеств. Глобальные АИС : мониторинг окружающей среды, анализ глобальных изменений в мире, обеспечение безопасности человека на море и в космосе, прогноз природных и техногенных катастроф, управление межпланетными полетами,

Концепция адаптивно-игровых систем (АИС) Игровые системы (ИС) Адаптивные системы (АС) Адаптивно-игровые системы (АИС) ИС (теория игр): необходима дополнительная информация о игроках, их коалициях и интересах; новое понимание оптимальности на основе принципа Парето, равновесия Нэша, переговорных процессов (Д. Харшаньи, Р. Зельтон, Р. Ауманн и Т. Шиллинг.) АС (теория адаптации): параметрическая, структурная, алгоритмическая априорная неопределенность; идентификации неопределенностей осуществляется путем использования рабочей информации; достижения целей в процессе функционирования системы (Фельдбаум Алекс. Арон., Цыпкин Я. З., Андреев Н. И., Петров Б. Н.) АИС (инженерная интеграция теорий игр и адаптации): наличие различных типов неопределенностей, частичное раскрытие неопределенностей на основе алгоритмов адаптации (обучения и идентификации), обеспечения получения гарантированных результатов в результате решения игровых задач.

Блок идентификации Алгоритмы управления, в том числе и адаптивные Органы управления Объект управления Внешняя среда, включающая метасистему Игровые решающие устройства Априорная информация ЭВМ Функциональная схема АИСУ

Структурная схема АИСУ Данные системы: X 0 ( q, g) – начальные условия, возмущения-(W С, V С ), неопределенные параметры (q, g), игроки и их интересы Внешняя среда X(t) = F(t; x, q, g) + P V С P C(t; q, g) Y(t; q, g) = B (t; q, g)X(t; q, g) + C (t; q, g) W С (t; q, g) X 0 ( q, g) V С (t; q, g) W С (t; q, g) Основная система управления Z(t) = Ф{t; а и 1,…, а и n ; а а 1,…, а и к } Игровые алгоритмыАдаптивные алгоритмы АИС Z(t)

Системная модель АИСУ S = (F, D) –система, состоящая из регулятора D и объекта управления F, где заданы отображения F = {f: M x V Y}, D = ( d: Y x V M}, и алгоритмы оценивания и управления задаются в традиционной форме: H= {h: T x Y x M Z}, K = {k: T x Z x V M}, где Т – множество моментов времени, М-множество управлений, Н- множество алгоритмов оценивания, К – множество алгоритмов управления, Z- множество оценок состояния системы. V Z Т k: A и x T x Z x V M} h: A и x T x Y x M Z}, а и : Y x N x Z x M A и k X A и h M Формирование параметров как результат решения игры Регулятор с игровым решающим устройством:

Статистически оптимальная система с ИРУ G(t;gj) G-полезный сигнал; Z- помеха. Все вероятностные характеристики полезного сигнала и помехи известны за исключением дисперсии Dgi полезного сигнала (неизвестны априорные вероятности). Возникает конфликт. Игрок А имеет своими стратегиями параметры аi, сторона В управляет выбором дисперсии gj. Сформулируем матричную антагонистическую игру, характеризуемую матрицей для вероятности невыхода ошибки из заданных допусков при нормальном законе распределения ошибки Рij = Pij(С1

Кооперативные и бескоалиционные ИРУ А В Раij = -Рвij Ра11 Ра12 Ра21 Ра22 Рв11 Рв12 Рв21 Рв22 Дж. Нэш: Любая конечная бескоалиционная игра n лиц имеет хотя бы одну ситуацию равновесия в смешанных стратегиях Кооперативная игра сталкиваемся с коалицией. Кооперативная игра может рассматриваться как бескоалиционная игра. Дж. Харшаньи, Рейнхард Зельдан. Общая теория выбора равновесных ситуаций. – СПб, ЭШ, Борьба за рынки фирм А и B А1- выбор фирмой А первого рынка; А2-второго рынка. В1- выбор фирмой В второго рынка; В2- второго рынка. Компания В более крупная. Выигрыш А только на разных рянках. AB

Системная модель с адаптивным управлением Адаптация- процесс изменения параметров, структуры и алгоритмов системы на основе текущей информации с целью достижения определенного, обычно оптимального состояния Регулятор с адаптивным управлением: Z Т k: A а x T x Z x V M V h: A а x T x Y x M Z, а а : Y x N x Z x M A а k х A а h M Формирование параметров на основе алгоритмов адаптации

Системная модель регулятора АИС k: A аи x T x Z x V M} Z Т h: A аи x T x Y x M Z}, а и : Y x Т x Z x M A и k х A и h M V а а : Y x Т x Z x M A а k х A а h а аи : A и k х A и h A а k х A а h хY x Т x Z x M A аи k х A аи h

АИС на основе фильтра Калмана - Бьюси Вычисление апостериорных вероятностей Pi = Р(qi/t,0), где i=1, 2,…,n (адаптивная часть) Алгоритмы решения игры на основе априорной информации Измеритель У(t)= B X(t) + C W Оценка измеренного сигнала Z(t) Фильтр КБ для qn Фильтр КБ для q2 Фильтр КБ для q1 Сумматор ………… P1 P2 …. Pn X(t)

Системы полуавтоматического управления (СПУ) СПУ находят эффективное применение в управлении полетом самолетами, вертолетами, космическими кораблями (КК) и орбитальными станциями (ОС). Моделирование систем полуавтоматического управления КК / Авторы: Г. Т. Береговой, А. И. Яковлев, Туманов А. В. и др. // Под редакцией д.т.н. А. И. Яковлева. – М.: Машиностроение, A. I. Yakovlev. Hybrid complex of the aircraft intellectualized systems simulation at the stage of their research projecting. AIAA CP. Полеты летчиков (космонавтов) показали: Летчик во время полета может решать интеллектуальные задачи. Деятельность летчиков протекает в весьма специфических условиях, что требует специальной системы отбора, обучения, подготовки и тренировки. Конструирование летательных аппаратов и их систем управления требует учета факторов полета. Определяющим фактором повышения эффективности СПУ летательных аппаратов является проведение эффективного моделирования и тренировок летчиков. Важнейшую роль в подготовке к полету космонавтов играет возможность человека адаптироваться и интеллектуально обрабатывать большие объемы информации.

АИС полуавтоматического управления Внешняя среда (факторы полета, центр управления полетом) Летательный аппарат Интеллектуальная система полуавтоматического управления Датчики и информационные системы Пилот (экипаж) Бортовой вычислительный комплекс Исполнительные органы

Пример самолетной АИС полуавтоматического управления Датчики состояния летчика Датчики перегрузок Бортовой компьютер Перегрузочный костюм Летчик самолета Информационная система Система регулирования давления перегрузочного костюма, воздействий на летчика Самолет Система управления Внешняя среда

АИС полуавтоматического управления спуском КК Информационная система, средства наблюдения Пилот-космонавт Бортовой вычислительный комплекс, обеспечивающий реализацию алгоритмов адаптации и игровых решающих устройств Датчики Исполнительные органы Космический корабль Внешняя среда

Показатели эффективности систем полуавтоматического управления КК Основные группы показателей эффективности АИС ПУ КК СистемныеФинансовые Медико -биологическиеСоциально-экономические Эргономические Субъективные Информационные Технические Интеллектуальные При выборе лучшей АИС полуавтоматического управления КК возникает необходимость определять не только эффективность достижения целей системой, но и обязательно оценивать эффективность работы летчика-космонавта, его состояние, профессиональную подготовку, интеллектуальные способности и воздействие на него факторов космического полета

Пример космического тренажера АИС полуавтоматического управления Исходные данные Воздействия на человека -оператора Инфокоммуникац ионная система моделирования внешней среды, движения КК, операций человека Кабина Дисплей Оператор Управление Информационная система регистрации результатов эксперимента Конструктора- разработчики АИС Медики Специалисты по проведению эксперимента Руководитель

Схема создания и функционирования Российско – Словенской комиссии по инновациям Российско – Словенской центр по инновациям Российская группа по коммерциализации РНТД МОН РФМО РС Программа партнерства в инновационной сфере Международный центр сотрудничества Предложения и запросы на РНТД HI -TEC МГТУ им. Н, Э, Баумана Университет Любляны Научные, консалтинговые, образовательные инновационные организации, создающие и реализующие проекты и программы проекты