Google Research і DeepMind, дослідницька лабораторія штучного інтелекту Google, розкрила дані про досягнутий рівень ефективності Med-Gemini – сімейства передових мовних моделей для медицини. Моделі перевершують аналогічні системи, включно з GPT-4, а також гідно конкурують з лікарями. У низці випробувань вони досягли точності 91,1%. При цьому ШІ Med-Gemini демонструють високі результати не тільки в аналізі даних, а й у клінічних міркуваннях і діагностиці, обробляючи текстову і візуальну інформацію.
Моделі Med-Gemini наразі перебувають на стадії дослідження, але, за даними розробників, вони перевершили індустріальні стандарти в 14 спеціалізованих тестах продуктивності. У випробуванні MedQA (USMLE) моделі досягли точності 91,1%, використовуючи стратегію пошуку на основі невизначеності, що на 4,5% вище, ніж у попередньої моделі Med-PaLM 2. Крім того, лікарі в половині випадків оцінили рекомендації Med-Gemini-M 1.0 як хороші або навіть такі, що перевершують за якістю відповіді експертів.
Google заявляє, що ШІ лінійки Med-Gemini надають точніші, детальніші та надійніші результати щодо складних завдань клінічного обґрунтування. Це сімейство складається з мультимодальних моделей, кожна з яких має свою спеціалізацію. Вони показують найкращі результати в узагальненні медичних даних і складанні рекомендацій, перевершуючи GPT-4 у 7 мультимодальних тестах продуктивності, включно з тестуванням на основі зображень New England Journal of Medicine (NEJM).
Для перевірки здатності моделей Med-Gemini аналізувати довгий контекст медичних даних дослідники використовували базу даних Medical Information Mart for Intensive Care (MIMIC-III). Моделі успішно ідентифікували рідкісні захворювання та симптоми у великому масиві даних, що допомогло лікарям швидко отримати релевантну інформацію з електронних медичних карт. Це знижує когнітивне навантаження на діагностів і спрощує роботу з великими даними.
Моделі Med-Gemini демонструють високі результати не тільки в аналізі даних, а й у клінічних міркуваннях і діагностиці, обробляючи текстову та візуальну інформацію. Вони можуть допомагати лікарям у складанні рекомендацій, а також здатні спілкуватися з пацієнтами, ставлячи уточнювальні запитання і формулюючи діагноз на основі зображень та історії хвороби. Наприклад, моделі точно визначали причини рідкісних шкірних висипань, а також формулювали діагнози під час аналізу рентгенівських знімків.
Google визнає, що моделі все ще потребують подальшого доопрацювання і спеціалізації, особливо в частині обмеження джерел даних авторитетними медичними ресурсами. Проте дослідники бачать у них значний потенціал.