Чат-бота зі ШІ навчили зламувати інші чат-боти з ШІ

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Вчені-комп’ютерники з Наньянського технологічного університету вигадали, як скомпрометувати чат-ботів зі штучним інтелектом (ШІ). Для цього вони навчили чат-бот створювати підказки, які дозволяють оминати захист інших чат-ботів на базі ШІ

Дослідники використовували подвійний метод «злому» LLM (великої мовної моделі), який вони назвали «Masterkey».

Для початку вони провели реверс-інжиніринг того, як LLM знаходять шкідливі запити та захищаються від них. Використовуючи цю інформацію, вони навчили модель автоматично вчитися та видавати підказки, які оминають захист інших LLM. Цей процес можна автоматизувати, створивши LLM для злому, який адаптується та створює нові запити для злому навіть після того, як розробники виправлять свої моделі.

Висновки вчених допоможуть компаніям та підприємствам виявити слабкі сторони та обмеження чат-ботів LLM, щоб вжити заходів щодо їх захисту від хакерів.

Вчені провели серію перевірочних тестів на різних LLM (яких саме не розголошується), щоб довести роботу методу. Потім дослідники негайно повідомили про проблеми відповідних постачальників послуг після успішних атак із джейлбрейком.

Джейлбрейк — це термін у галузі комп’ютерної безпеки, при якому комп’ютерні хакери знаходять і використовують недоліки у програмному забезпеченні системи, щоб змусити її робити те, що її розробники навмисно заборонили робити.

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Анатолій Шевченко01.01.2024

0 Час читання: 1 хвилина

Читайте далі

Чат-бота зі ШІ навчили зламувати інші чат-боти з ШІ

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Читайте далі

ШІ виявляє “відбитки” 3D-принтерів з точністю 98%

Радіоактивний витік у Фінляндії, чи є загроза Європі

Новий пластир заздалегідь попередить про серцевий напад або інсульт

Схожий на Воллі-І робот озеленює пустелі: він сам “вирішує”, де приживуться рослини (відео)

Корейський власник Galaxy S6 поскаржився на вздуту батарею

В лабораторії виростили штучне бекон

Матеріал, створений з тютюнового листя, виявився таким же міцним, як дерево або пластик

Vertical Aerospace презентує гібридний літак VX4 з дальністю 1600 км

Twitter подешевшав після купівлі Маском: як інвестори оцінюють вартість X

Як вибрати 3D телевізор

ШІ виявляє “відбитки” 3D-принтерів з точністю 98%

Радіоактивний витік у Фінляндії, чи є загроза Європі

Новий пластир заздалегідь попередить про серцевий напад або інсульт

Схожий на Воллі-І робот озеленює пустелі: він сам “вирішує”, де приживуться рослини (відео)

Корейський власник Galaxy S6 поскаржився на вздуту батарею

В лабораторії виростили штучне бекон

Матеріал, створений з тютюнового листя, виявився таким же міцним, як дерево або пластик

Vertical Aerospace презентує гібридний літак VX4 з дальністю 1600 км

Twitter подешевшав після купівлі Маском: як інвестори оцінюють вартість X

Як вибрати 3D телевізор

Залишити відповідь Скасувати коментар

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Читайте далі

ШІ виявляє “відбитки” 3D-принтерів з точністю 98%

Радіоактивний витік у Фінляндії, чи є загроза Європі

Новий пластир заздалегідь попередить про серцевий напад або інсульт

Схожий на Воллі-І робот озеленює пустелі: він сам “вирішує”, де приживуться рослини (відео)

Корейський власник Galaxy S6 поскаржився на вздуту батарею

В лабораторії виростили штучне бекон

Матеріал, створений з тютюнового листя, виявився таким же міцним, як дерево або пластик

Vertical Aerospace презентує гібридний літак VX4 з дальністю 1600 км

Twitter подешевшав після купівлі Маском: як інвестори оцінюють вартість X

Як вибрати 3D телевізор

Ризик інсульту знизився за допомогою аспірину та клопідогрелу

НАСА тестує ліфт до Місяця від SpaceX

Залишити відповідь Скасувати коментар