Зібрано набір даних, щоб навчати ШІ самостійно приймати рішення

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Опубліковано найбільший загальнодоступний набір даних для контекстного навчання з підкріпленням, повідомляє прес-служба Інституту штучного інтелекту AIRI.

Дослідники з російського Інституту штучного інтелекту AIRI і лабораторії T-Bank AI Research опублікували два загальнодоступних набори даних для контекстного навчання з підкріпленням на основі середовища XLand-MiniGrid. Спрощена версія містить трохи менше 20 млрд кортежів – упорядкованих наборів даних фіксованої довжини, повна – понад 112 млрд.

Набори даних валідували за допомогою графіків навчальних історій – траєкторії були природним чином упорядковані за зростанням сумарної нагороди за епізод, повідомляють розробники. Вони вважають, що набори допоможуть налаштовувати ШІ-системи для вирішення нових завдань без залучення вузькопрофільних фахівців, а також стануть джерелом корисних синтетичних даних.

Контекстне навчання з підкріпленням (In-Context Reinforcement Learning) сфокусовано на створенні моделей, які добре працюють не тільки на тренувальних завданнях, а й здатні максимально ефективно донавчатися за мінімальний час. Наприклад, більшість чат-ботів можна навчити новому завданню, додавши в промпт деяку кількість прикладів його розв’язання.

Такі методи підходять, щоб навчати ШІ приймати рішення, пояснюють розробники. ШІ-агент повинен досліджувати середовище (exploration) і зрозуміти, які дії ведуть до хорошого результату, а які – до поганого. Потім він має зупинитися і перейти у фазу “експлуатації хороших дій” (exploitation). Завдання exploration – exploitation полягає в тому, щоб знайти механізм навчання, який на горизонті N кроків забезпечує найкращий результат за меншу кількість кроків.

У царині контекстного навчання з підкріпленням немає стандартизації, і автори всіх робіт, що існували раніше, були змушені щоразу збирати новий датасет з нуля, додають розробники. Вони вважають, що опубліковані набори даних допоможуть демократизувати дослідження, прискорять розвиток цього напрямку навчання і масштабування технологій.

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Анатолій Шевченко30.07.2024

Час читання: 1 хвилина

Читайте далі

Зібрано набір даних, щоб навчати ШІ самостійно приймати рішення

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Читайте далі

Відео: як китайці за добу будують десятиповерховий – інноваційна технологія Broad Group (фото+відео)

У Дубаї побудують найбільшу в світі сонячну електростанцію

Нова суперповерхня змушує краплі стрибати як м’ячик – відео

Майбутнє світу: прогноз до 2099 року

Енергія води може забезпечити 33% поточної потреби в електриці

Пентагон вкладає 2 мільярди доларів у впровадження військового ШІ

Китайський алгоритм відстежує пересування флоту за відбитками на хвилях

Австралія будує найбільшу батарею в світі на 300 мегават

Система на основі ШІ знизить кількість аварій мотоциклістів (відео)

Tesla подала нові патенти на робота Optimus

Відео: як китайці за добу будують десятиповерховий – інноваційна технологія Broad Group (фото+відео)

У Дубаї побудують найбільшу в світі сонячну електростанцію

Нова суперповерхня змушує краплі стрибати як м’ячик – відео

Майбутнє світу: прогноз до 2099 року

Енергія води може забезпечити 33% поточної потреби в електриці

Пентагон вкладає 2 мільярди доларів у впровадження військового ШІ

Китайський алгоритм відстежує пересування флоту за відбитками на хвилях

Австралія будує найбільшу батарею в світі на 300 мегават

Система на основі ШІ знизить кількість аварій мотоциклістів (відео)

Tesla подала нові патенти на робота Optimus

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Читайте далі

Відео: як китайці за добу будують десятиповерховий – інноваційна технологія Broad Group (фото+відео)

У Дубаї побудують найбільшу в світі сонячну електростанцію

Нова суперповерхня змушує краплі стрибати як м’ячик – відео

Майбутнє світу: прогноз до 2099 року

Енергія води може забезпечити 33% поточної потреби в електриці

Пентагон вкладає 2 мільярди доларів у впровадження військового ШІ

Китайський алгоритм відстежує пересування флоту за відбитками на хвилях

Австралія будує найбільшу батарею в світі на 300 мегават

Система на основі ШІ знизить кількість аварій мотоциклістів (відео)

Tesla подала нові патенти на робота Optimus

Найдавнішу єгипетську піраміду могли побудувати за допомогою спеціального ліфта

Фізики уточнили значення аномального магнітного моменту мюона