Штучний інтелект “дресирує” механічного собаку ефективніше за людину, показало дослідження.
Інженери використовували платформу для моделювання на основі великої мовної моделі (LLM) DrEureka, щоб навчити чотирилапого робота балансувати і ходити по м’ячу для йоги. Моделюючи навчання в штучному середовищі, алгоритм ШІ швидко допомагає роботам отримати необхідні навички для переміщення в реальному просторі, заявляють розробники.
Команда використовувала платформу для навчання робота-собаки в режимі симуляції, а потім перенесла її в реальні умови роботи. Чотирилапий пристрій з першої спроби впорався з поставленими завданнями. Детально технологію навчання інженери з Пенсільванського університету, Техаського університету в Остіні та Nvidia описали на GitHub.
Робопес, що балансує на кулі
За допомогою кількох підказок від великої мовної моделі, такої як, наприклад, ChatGPT, програма може написати код, який створює систему винагород і штрафів для навчання робота у віртуальному просторі. Штучний інтелект створює параметри для навчання, враховуючи відскік меча, силу двигуна, ступінь свободи кінцівок та інші властивості системи.
Після кожної симуляції програма аналізує, наскільки добре віртуальний робот впорався із завданням і як його можна поліпшити. Наприклад, програма відстежує потенційно небезпечні показники – перегрів мотора або надмірне навантаження на кінцівки.
Дослідники зазначають, що DrEureka перевершив людей під час “дресирування” робота-собаки. Наприклад, пристрій, навчений ШІ, рухався на 34% швидше на реальних змішаних ландшафтах. Розробники вважають, вся справа в стилі викладання. Люди розбивають завдання на кроки і намагаються пояснити їх ізольовано, тоді як GPT має здатність ефективно навчати всього відразу.