Google випустила новий інструмент SynthID Text для маркування текстів, створених ШІ, який допоможе розрізняти контент, згенерований нейромережами, без шкоди для його якості та швидкості.
Google представила нову технологію для маркування та розпізнавання текстів, створених генеративними ШІ-моделями. Інструмент SynthID Text не вплине на швидкість і якість генерації контенту і буде надано безкоштовно розробникам і компаніям.
SynthID Text працює так: під час генерації тексту модель пророкує, який символ або слово буде наступним, ґрунтуючись на ймовірностях, і додає додаткову інформацію в цей розподіл, що формує своєрідний водяний знак. Цей знак дає змогу визначити, чи створений текст ШІ. Як пояснює Google, комбінація обраних слів і скоригованих ймовірностей утворює “патерн”, який і виступає водяним знаком.
Компанія підкреслює, що інструмент, який навесні інтегрували в Gemini, не впливає на точність, якість або швидкість генерації. Однак тексти, що зазнали обрізки, перефразування чи інших змін, можуть оброблятися складніше. Водночас занадто чіткі запитання обмежують можливості моделі щодо внесення змін у розподіл токенів без шкоди для точності відповіді.
Google не єдина, хто розробляє такі технології. Наприклад, OpenAI також працювала над впровадженням водяних знаків для текстів, створених ШІ, але призупинила процес через технічні та комерційні складнощі. Якщо такі технології стануть масовими, вони допоможуть вирішити проблему з неточними детекторами ШІ, які часто помилково класифікують студентські роботи як створені нейромережею. Деякі країни вже починають діяти в цьому напрямку: у Китаї обов’язкове маркування ШІ-контенту вже запроваджено, а в Каліфорнії планують аналогічні заходи.