Штучний інтелект (ШІ) на базі великих мовних моделей (ВММ) демонструє високу точність у виявленні достовірності наукових даних, перевершуючи навіть досвідчених фахівців у галузі нейробіології.
Дослідження, проведене вченими з Університетського коледжу Лондона (UCL) та опубліковане в журналі Nature Human Behaviour, показало, що ВММ здатні розпізнавати фальшиві дані й оцінювати валідність наукових результатів. У рамках експерименту використовували інструмент BrainBench, який порівнює пари наукових абстрактів: один містить реальні результати, інший – модифіковані, але правдоподібні. У тесті взяли участь 15 мовних моделей і 171 експерт із нейробіології.
Результати показали, що середня точність ШІ склала 81%, тоді як експерти досягли лише 63%. Спеціалізована модель BrainGPT, розроблена на основі відкритої ВММ Mistral і адаптована до нейробіологічних даних, показала точність 86%, що перевершує універсальні моделі. На відміну від людей, упевненість ШІ у своїх висновках корелювала з правильністю відповідей, підвищуючи довіру до таких інструментів.
Науковці зазначають, що ШІ може допомогти не тільки в аналізі існуючих даних, а й у проєктуванні нових експериментів. За словами професора Бредлі Лава з UCL, здатність моделей прогнозувати результати свідчить про те, що наукові роботи часто базуються на вже відомих закономірностях, що робить їх передбачуваними. У майбутньому це дозволить оптимізувати наукові дослідження, скорочуючи час і ресурси, необхідні для перевірки гіпотез.
Розробники планують створити платформу на основі ШІ, яка допомагатиме дослідникам оцінювати й удосконалювати свої експерименти ще до їх проведення. Вони також підкреслюють, що підхід, який використовується в BrainBench, може бути адаптований до інших наукових галузей, розширюючи вплив ШІ на прискорення наукового прогресу.
Дослідження отримало підтримку провідних організацій, включно з Microsoft та Економічною і соціальною дослідницькою радою Великої Британії (ESRC). У ньому взяли участь науковці з університетів Кембриджа, Оксфорда та інших світових дослідницьких центрів, що підкреслює глобальне значення цього прориву.
Факти по темі:
- У 2021 році було виявлено, що близько 2% рецензованих досліджень у галузі медицини містять значні методологічні помилки або підроблені дані. Такі помилки коштують науці мільярди доларів щороку.
- Інструменти ШІ вже використовуються в науці: наприклад, AlphaFold від DeepMind визначив структуру понад 200 мільйонів білків, що стало революцією в біології.
- Адаптація моделей ШІ до галузей, таких як нейробіологія чи кліматологія, дозволяє аналізувати дані в тисячі разів швидше за людей, зменшуючи час на проведення досліджень.