Технології

OpenAI оголосив про вихід нового “мовного ШІ” GPT-4 з підтримкою зображень та відео на наступному тижні

Попереднє покоління алгоритму обробки природної мови-GPT-3 – свого часу наробило шуму. Штучний інтелект генерував тексти, які з мінімальним доопрацюванням можна було публікувати так, ніби вони створені людиною. Наступним кроком став віртуальний співрозмовник ChatGPT, який досі не перестає дивувати навіть фахівців. На цьому тлі з’явився анонс виходу абсолютно нової мовної моделі GPT-4, і вона обіцяє справжню революцію в галузі.

Гучна новина прозвучала як би ненароком з вуст Андреаса Брауна (Andreas Braun), технічного директора Microsoft Germany. Як пише видання Heise Online, він виступав на заході AI in Focus — Digital Kickoff у четвер, 9 березня. Під час презентації представники компанії розповідали про великі мовні моделі (LLM) на кшталт серії GPT як про проривні технології, які радикально змінюють ринок. Поміж іншого зайшла мова і про партнерство Microsoft з OpenAI.

Саме в цьому контексті Браун оголосив про “майбутній випуск GPT-4 наступного тижня”. Правда, будь-яких деталей і подробиць про революційну нейромережі він не повідомив. Лише в загальних рисах змалював найбільш помітні еволюційні зміни алгоритму.

В першу чергу модель буде підтримувати “буквально всі мови”. Логічно припустити, що не взагалі всі сім з гаком тисяч існуючих мов світу, але перші кілька десятків найпопулярніших точно реалізовані. За словами Брауна, нейромережі можна буде поставити завдання німецькою та отримати відповідь італійською. Йдеться не про переклад на льоту, а про формулювання тексту відразу в необхідному мовному середовищі.

По-друге, GPT-4 став мультимодальним, тобто здатний обробляти не тільки «чистий» текст, але і розпізнавати його в аудіо, зображеннях і відео. З повідомлень преси не до кінця ясно, але складається враження, що модель зможе видавати відповідь в тій же формі.

Мабуть, найбільш цікавий елемент заходу, пов’язаний з GPT-4, – невеликі натяки на практичне застосування моделі. Браун, знову ж таки, не вдавався в подробиці, але розповів, що цей штучний інтелект вже проходить тестування в різних додатках для клієнтів Microsoft Azure.

Наприклад, для однієї з компаній створили рішення, що підсумовує телефонні розмови. Це заощадить великому call-центру близько 500 робочих годин операторів в день. Створення прототипу на основі GPT-4 зайняло менше двох годин і вимагало зусиль лише одного розробника.

Застосування мовної моделі бізнес-клієнтами розглядається в трьох основних напрямках: обробка голосових запитів телефоном, допомога в документообігу, а також відповіді на питання клієнтів, що вимагають звернення до закритих від сторонніх знань. Фактично це автоматизація цілого класу завдань, які зараз виконують сотні тисяч операторів центрів підтримки користувачів.

Нагадаємо, GPT (Generative Pre-trained Transformer) – сімейство нейромережевих алгоритмів для обробки природної мови, розроблених компанією OpenAI. З кінця 2015 року ця фірма випустила кілька продуктів, серед яких найбільш відомі DALL-e, GPT-3, ChatGPT (на базі GPT-3.5) і Codex. У 2019 році Microsoft надала компанії фінансування в розмірі мільярда доларів, а до січня 2023-го ця сума, за різними оцінками, зросла ще на 10 мільярдів.


Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук


Back to top button