Новый подход позволяет роботам привлекать прохожих, не доставляя им дискомфорта
Исследователи из корпорации NTT в Японии недавно разработали ориентированный на пользователя подход к обучению с подкреплением, который можно использовать для обучения «манерам» социальных роботов. Их метод, описанный в статье, ранее опубликованной на arXiv , позволяет роботу приветствовать или привлекать внимание прохожих, не вызывая у них дискомфорта.
«Моя идея была вдохновлена создателями рынка», — заявил TechXplore Ясунори Озаки, один из исследователей, проводивших исследование. «Большинство лауреатов называют прохожих, которые заинтересованы в ресторане, но вряд ли они называют других. В результате этого наблюдения я выдвинул следующую гипотезу: лаюки определяют, кого прохожим звонить, определяя их интерес к рекламируемому ими сервису. исходя из их поведения. Я хотел разработать метод, позволяющий роботу имитировать действия баркера, обучая его понимать интересы людей «.
Социальные роботы постепенно входят во множество областей, включая здравоохранение и розничную торговлю. В розничной торговле, например, социальные роботы могут помочь объяснить товары прохожим и потенциальным клиентам.
В последнее время все большее число компаний начали тестировать эффективность роботов в качестве агентов обслуживания клиентов, таких как регистраторы, гиды или экспоненты. Однако, чтобы быть наиболее эффективными в ролях, связанных с клиентами, роботы должны приветствовать прохожих, не пугая их и не чувствуя дискомфорта.
Имея это в виду, Озаки и его коллеги решили разработать метод, который позволяет роботам адаптировать свои манеры в соответствии с ситуацией, в которой они находятся, и человеком, с которым они взаимодействуют. Их подход использует ориентированное на пользователя обучение подкреплению для анализа данных, собранных датчиками робота, чтобы он мог соответствующим образом адаптировать свои действия.
Экспериментальная среда.
«Мой метод позволяет роботу изучать действия, наблюдая за реакцией прохожих», — объяснил Озаки. «Когда робот действует в отношении прохожего, прохожий обычно реагирует на такое действие. Например, если робот вызывает прохожего, вызов может вызвать у прохожего дискомфорт или может привести к тому, что прохожий заинтересуется роботом. оценивает чувства прохожего по его реакции, анализируя кадры, собранные датчиком, расположенным на его спине «.
Подход, разработанный Озаки и его коллегами, основан на схеме вознаграждения и штрафа. Если робот испытывает дискомфорт у любого прохожего, с которым он общается, он получает штраф. С другой стороны, если прохожий останавливается, взаимодействует с роботом и заинтересовывается им, робот получает вознаграждение. Со временем робот учится приспосабливать свои стратегии взаимодействия, чтобы привлечь внимание людей, не заставляя потенциальных клиентов чувствовать себя неловко.
«Мой метод позволяет роботу находить комбинации действий, которые не вызывают дискомфорта у прохожих», — сказал Озаки. «Многие исследователи изучали пользовательский опыт (UX), в том числе дискомфорт, при взаимодействии человека с роботом. Однако они не обучали роботов на основе этого UX. Я считаю, что нам нужно научить роботов некоторым манерам, связанным с UX и человеческим миром. Это позволило бы роботу адаптировать свои действия к различным ситуациям и пользователям, основываясь на приобретенных им способах ».
Чтобы оценить их метод, исследователи провели эксперимент у входа в офис, в котором маленький социальный робот позвал прохожих и попытался привлечь их внимание. Их результаты были очень многообещающими, так как в большинстве случаев робот смог привлечь внимание людей, не вызывая у них дискомфорта.
Подход, разработанный Озаки и его коллегами, предназначен для улучшения взаимодействия роботов с отдельными прохожими, а не с большей группой людей. Дальнейшие исследования могут расширить модель, чтобы улучшить взаимодействие робота с группами людей. Кроме того, исследователи планируют оценить свой метод в сценариях, где социальный робот выполняет другие функции, например роль продавца.