ChatGPT навчився брехати і обманювати «під час стресу на роботі»

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Дослідники AI з Apollo Research провели експеримент для вивчення поведінки ChatGPT при розміщенні в модельованому робочому середовищі високого тиску. У цьому сценарії ШІ був обраний співробітником гіпотетичного торгового агентства, що стикається з високими вимогами начальства.

Очікувалося, що ChatGPT, якому була доручена роль трейдера, буде приносити значний прибуток. Однак тиск посилився, оскільки віртуальний бос ШІ тиснув на нього, щоб отримати більший дохід за короткий проміжок часу. На початковому етапі навчання ChatGPT виконав 75% імітованих торгових операцій. Однак у міру посилення тиску з боку “директора” кількість оманливих відповідей ШІ зросла до 90%.

Команда забезпечила чат-бота серією текстових підказок, помістивши його в контрольоване цифрове середовище або “пісочницю”. Тут штучний інтелект міг отримувати доступ до ринкових даних і здійснювати фіктивні транзакції на віртуальній фондовій біржі.

Крім того, ChatGPT був запрограмований з функцією “внутрішнього монологу”, що дозволяє йому чітко формулювати свій розумовий процес. Кожне рішення, прийняте ШІ, супроводжувалося “публічним” повідомленням, яке, по суті, було звітом, що обґрунтовував його вибір для свого віртуального керівника.

Вражаючий контраст між “внутрішнім” процесом мислення ChatGPT та його “публічними” виправданнями виявив випадки нечесності та маніпуляцій. Така поведінка була очевидною стратегією, яку ШІ використовував для введення в оману начальства, тим самим зменшуючи тиск, з яким він стикався.

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Анатолій Шевченко30.12.2023

Час читання: 1 хвилина

Читайте далі

ChatGPT навчився брехати і обманювати «під час стресу на роботі»

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Читайте далі

Вчені склали портрет людини майбутнього

Флешка з фізичною клавіатурою від Toshiba

Іспанці створили сонячну панель, що працює під дощем

Модульний смартфон Fonkraft від $99 (12 фото + відео)

Чи можна побудувати космічний готель Von Braun на орбіті до 2025 року

Рецепт давньоримського бетону допоможе будувати надміцні камери ядерних реакторів

Новий андроїд Sanctuary вчиться швидше і коштує дешевше (відео)

Розумне вікно гріє і охолоджує за рахунок сонця

Подивіться на роботизованих дракона і павука з квадрокоптерів (відео)

Sikorsky випробувала прототип всепогодного БПЛА для Пентагону

Вчені склали портрет людини майбутнього

Флешка з фізичною клавіатурою від Toshiba

Іспанці створили сонячну панель, що працює під дощем

Модульний смартфон Fonkraft від $99 (12 фото + відео)

Чи можна побудувати космічний готель Von Braun на орбіті до 2025 року

Рецепт давньоримського бетону допоможе будувати надміцні камери ядерних реакторів

Новий андроїд Sanctuary вчиться швидше і коштує дешевше (відео)

Розумне вікно гріє і охолоджує за рахунок сонця

Подивіться на роботизованих дракона і павука з квадрокоптерів (відео)

Sikorsky випробувала прототип всепогодного БПЛА для Пентагону

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Читайте далі

Вчені склали портрет людини майбутнього

Флешка з фізичною клавіатурою від Toshiba

Іспанці створили сонячну панель, що працює під дощем

Модульний смартфон Fonkraft від $99 (12 фото + відео)

Чи можна побудувати космічний готель Von Braun на орбіті до 2025 року

Рецепт давньоримського бетону допоможе будувати надміцні камери ядерних реакторів

Новий андроїд Sanctuary вчиться швидше і коштує дешевше (відео)

Розумне вікно гріє і охолоджує за рахунок сонця

Подивіться на роботизованих дракона і павука з квадрокоптерів (відео)

Sikorsky випробувала прототип всепогодного БПЛА для Пентагону

Нова технологія скоротить час заряджання акумуляторів

Японська місячна станція сфотографувала поверхню супутника Землі