МОСКВА, 15 мая. /ТАСС/. Исследователи из России разработали подход, который помогает ИИ-агентам быстро подстраиваться под новые условия работы без дополнительного дообучения и остановок. Новый подход позволит почти вдвое ускорить процесс адаптации роботов к реальным условиям работы, сообщила пресс-служба Института искусственного интеллекта AIRI.
"Метод протестировали в экспериментах на дискретных и непрерывных средах - в задачах навигации и управления, где изменялись структура пространства и его физические параметры. Подход сравнили с базовыми методами как в знакомых условиях, встречавшихся во время обучения, так и в новых конфигурациях, которые система ранее не видела. В результате качество выполнения задач выросло почти в два раза по сравнению с базовыми подходами", - говорится в сообщении.
Как отмечают разработчики этого подхода, руководитель группы "Адаптивные агенты" Института AIRI Владислав Куренков и его коллеги, системы ИИ на базе поведенческих фундаментальных моделей могут решать много разных задач без отдельной настройки под каждую из них, но плохо адаптируются к переменам внешних условий. В результате этого существующие формы "физического ИИ" испытывают проблемы с переходом от обучения в симуляции к работе в реальном мире, где параметры среды постоянно меняются и заранее неизвестны.
Российские ученые сделали большой шаг к решению этой проблемы, модифицировав один из популярных подходов для разработки подобных ИИ, концепцию Forward-Backward. В ее рамках алгоритм строит прогнозы возможных будущих состояний системы и путей к целям, но в нестабильной среде он начинает усреднять разные варианты развития событий и из-за этого чаще ошибается при выборе действий
Для предотвращения этих ошибок исследователи расширили базовую архитектуру двумя модификациями, одна из которых помогает модели по последовательности наблюдений понять, с какой средой она столкнулась, а вторая - дополнительно организует внутренние представления стратегий так, чтобы варианты поведения для разных условий не "смешивались" друг с другом. Это позволяет системе ИИ лучше связывать параметры среды с действиями и переносить знания на ситуации, которых не было в обучающих данных.
Как надеются ученые, разработанный ими подход не только удвоит скорость адаптации роботов к работе в незнакомых и меняющихся условиях среды, но и также позволит этим машинам более эффективно взаимодействовать в режиме реального времени с другими ИИ-агентами и людьми. Это важно для повышения эффективности работы подобных систем ИИ на складах и на дорогах общего пользования, подытожил исследователь.







Комментарии 0