Штучний інтелект

ШІ досяг середнього рівня людської креативності

Водночас найкреативніші люди все ще значно випереджають ШІ, доводячи, що справжня творча майстерність залишається людською.

Чи здатні генеративні системи штучного інтелекту, такі як ChatGPT, до справжньої креативності — це питання стало предметом масштабного дослідження під керівництвом професора Каріма Джербі з Монреальського університету. До команди також увійшов Йошуа Бенхіо — один із піонерів глибинного навчання та професор того ж університету. Разом вони провели найбільше на сьогодні порівняння людської креативності та творчих здібностей великих мовних моделей.

by @freepik

Результати, опубліковані в журналі Scientific Reports, засвідчили важливий зсув. Деякі системи генеративного ШІ досягли рівня, за якого вони можуть перевершувати середньостатистичну людину у визначених тестах креативності. Водночас дослідження чітко показало, що найкреативніші люди все ще значно випереджають навіть найпотужніші моделі ШІ.

У межах роботи дослідники порівняли результати кількох великих мовних моделей — зокрема ChatGPT (GPT-4), Claude, Gemini — з даними понад 100 000 учасників-людей. Деякі моделі отримали вищі бали, ніж середній людський показник, у завданнях на «дивергентну лінгвістичну креативність».

Професор Карім Джербі зазначає: «Наше дослідження показує, що деякі системи штучного інтелекту тепер можуть перевершити середню людську креативність у чітко визначених завданнях». Водночас він підкреслює, що верхній рівень людської творчості залишається недосяжним для машин.

Подальший аналіз, проведений разом із постдокторантом Антуаном Бельмар-Пепеном та дослідником Франсуа Леспінассом з Університету Конкордія, показав, що найкреативніша половина людей стабільно перевершує всі протестовані системи ШІ. Різниця стає ще більш разючою серед 10 % найкреативніших учасників.

Для об’єктивного порівняння дослідники використали Завдання на дивергентні асоціації (DAT) — психологічний тест, розроблений Джеєм Олсоном з Університету Торонто. DAT оцінює здатність генерувати семантично віддалені ідеї, наприклад добір десяти максимально несхожих слів. Цей інструмент добре корелює з іншими тестами креативності та застосовується як до людей, так і до ШІ.

Окрім словесних асоціацій, команда перевірила творче письмо — написання хайку, сюжетів фільмів і коротких оповідань. І тут повторилася та сама закономірність: ШІ іноді перевершує середнього учасника, але досвідчені людські автори зберігають чітку перевагу.

Окрему увагу дослідники приділили питанню керованості креативності ШІ. Виявилося, що такі параметри, як «температура моделі», суттєво впливають на результат: вищі значення стимулюють ризикованіші та оригінальніші ідеї, тоді як нижчі — більш передбачувані відповіді. Також важливу роль відіграє формулювання підказок, зокрема звернення до етимології та структури слів.

У підсумку дослідження пропонує збалансований погляд на майбутнє творчості. «Генеративний ШІ не замінить творців, а радше змінить спосіб, у який вони уявляють, досліджують і створюють», — наголошує Карім Джербі.

Отже, результати вказують не на протистояння людей проти машин, а на нову модель співпраці, у якій штучний інтелект стає інструментом посилення людської уяви, а не її заміною.

Back to top button