Технології

Робота навчили забиратися, розкладаючи речі так, як потрібно користувачеві

Інженери розробили систему управління для домашнього робота, яка допомагає йому враховувати переваги користувачів.

Дослідники з Прінстонського і Стенфордського університетів розробили систему персоналізованої допомоги для управління домашніми роботами. Вона використовує мовні моделі, щоб на основі декількох прикладів познайомити пристрій з побажаннями і перевагами конкретного користувача.

Підхід, запропонований дослідниками, використовує можливості узагальнення великих мовних моделей — нейронних мереж з безліччю параметрів, таких як ChatGPT. Ці моделі можуть узагальнювати інформацію або надавати загальні рекомендації після навчання на відносно невеликих наборах даних або прикладах сценаріїв.

Ілюстрація переваг користувача, визначених мовною моделлю. Зображення: Jimmy Wu et al., Princeton University

Інженери використовували таку модель для створення «резюме» переваг користувача, які засновані на декількох вхідних даних. Наприклад, користувач може задати таку умову: «Одяг червоного кольору кладеться в ящик, а білий — в шафу». На основі текстових даних модель сформулює узагальнені переваги, які будуть керувати роботом.

Одна людина вважає за краще зберігати сорочки в ящику столу, а інша — щоб вони лежали на полиці, пояснюють автори дослідження. Вони прагнуть створити системи, які будуть дізнаватися про такі переваги всього на кількох прикладах за допомогою взаємодій з конкретною людиною.

Робот TidyBot виконує завдання: «Утилізуй банки з-під напоїв, прибери всі інші предмети на свої місця». Відео: Jimmy Wu et al., Princeton University

Робот TidyBot виконує завдання: «Розсортуй білизну на світлу і темну». Відео: Jimmy Wu et al., Princeton University

Щоб оцінити ефективність такої системи, інженери провели серію тестів, оцінюючи як загальні переваги, які ШІ визначав на основі текстових даних, так і те, як це змінювало поведінку справжнього робота-прибиральника. Для тестування вони розробили робота TidyBot, який миє підлогу, а також збирає випадкові предмети і розміщує їх в певних місцях.

Аналіз показав швидку адаптацію і точність при розумінні команд. Навчений на основі простих правил робот правильно прибирав близько 85% предметів в реальних тестових сценаріях. Дослідники продовжать роботу над моделлю для ще більшого підвищення точності управління.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються ваші дані коментарів.

Back to top button