Coordination of Multiple Mobile Robots via Communication Курицын Сергей 545 гр.
Управление командой Централизованное – единый центр управления – проще разрешать конфликты – центр выходит из строя => система не работает Децентрализованное – разделение функций системы – коллективное поведение
Коллективное поведение Обмен информацией Безопасность Работа в команде Наличие лидера Обучение у других роботов
Устройство робота 140 х 130 мм, 600 г 8MHz CPU Мотор: ±1, 0 Система коммуникации Система обнаружения препятствий – ультразвук – изменяемая пороговая величина
Пороговая величина Высокая – препятствие близко Низкая – для удаленных препятствий Понижается со временем Частота = 10Hz Дистанция = 30мм ÷ 1М Ощутимый интервал = 5мм
Внутрикомандное взаимодействие Ультразвук – Низкая скорость передачи Радиосвязь – Требуется антенна Инфракрасные датчики
Внутрикомандное взаимодействие 12 светодиодов 4 фотодиода
Передача информации 220 ÷ 400kHz Сообщение – заголовок (3 bytes) – тело (11 bytes) – контрольная сумма (2 bytes) Нет гарантии получения
Командное поведение Избегать столкновений Близкое расположение – много шума от датчиков Необходимо преодолевать препятствия Требуется лидер
Выбор лидера 1.Избегать препятствий 2.В случае выгодной позиции и отсутствия других роботов – стать лидером 3.Обойти препятствия 4.Пытаться удержать позицию лидера 5.Действия повторяются Каждый робот – лидер или последователь
Алгоритм обучения На основе конечного автомата Начальные состояния: 1)рядом с роботом нет объектов 2)препятствие далеко и правее 3)препятствие далеко и левее 4)препятствие близко и правее 5)препятствие близко и правее 9 конечных состояний (действий)
Выбор действий Вероятностный вектор для конечных состояний Выбирается наиболее вероятное состояния В случае успеха вероятность еще увеличивается p n = p n + α p j = p j – α/8 Sonar reading & detect obstacles Choose probability set based on obstacle position Choose action & execute 80ms Read sonar system Evaluate the chosen action Update probability
Успешные действия Препятствие отсутствует – двигаться прямо Препятствие рядом – избегать Вычисление α: (1) : α = (LeftSpeed + RightSpeed)*12 (2),(3): α = (LeftSpeed + RightSpeed)*6 + (LeftDir+ RightDir)*2 (4),(5): FrontDir*4 LeftSpeed, RightSpeed: ±1, 0 LeftDir, RightDir, FrontDir: значения ограничены ±9 (35мм)
Обучение Транслируются – начальные состояния – конечные состояния – результат (α) Наборы кодируются: – пакеты по 6 наборов – стартовый пакет – ID пакета – контрольная сумма Потери – около 5% Choose probability set based on obstacle position Sonar reading & detect obstacles Choose action & execute 80ms Read sonar system Evaluate the chosen action & update the probability Collect & transmit data to other robots
Тестовое применение 4 робота Эллиптическое поле 7,5м (стена h = 120мм) Вероятности фиксировались каждые 3,4 сек. 5 состояний – слишком мало групповое обучение эффективнее индивидуального
Дальнейшие задачи Как повысить эффективность обучения? Какие сенсоры и алгоритмы распознавания данных выгодно применять? Как бороться с неточност ью сенсоров? Каково оптимально е число начальных состояний?