AI перестане чекати вашої відповіді – стартап колишньої CTO OpenAI показав нову модель спілкуван
- Компанія Thinking Machines Lab представила модель TML-Interaction-Small, яка використовує технологію "повного дуплексу" для природнішого спілкування з ШІ.
- Модель обіцяє значно зменшити затримку відповіді до 0,40 секунди, що може стати важливим кроком для індустрії, але поки це лише дослідницький проєкт з обмеженим доступом.
Міра Мураті готує новий прорив в ШІ – стартап Thinking Machines змінює сам принцип розмови з ботами / The VergeШтучний інтелект може змінитися радикальніше, ніж після появи чат-ботів. Новий проєкт команди колишньої технічної директорки OpenAI обіцяє зробити спілкування з машинами набагато природнішим.
Компанія Thinking Machines Lab, заснована колишньою технічною директоркою Mira Murati, представила нову дослідницьку розробку під назвою TML-Interaction-Small. Її головна особливість полягає в тому, що модель працює за принципом "повного дуплексу" – тобто може одночасно слухати співрозмовника та формувати відповідь. Про це пише TechCrunch.
Дивіться також OpenAI показала голосовий ШІ нового покоління – він перекладає розмови в реальному часі
Чи зможе ШІ нарешті говорити як людина?
Це серйозно відрізняється від того, як працює абсолютна більшість сучасних чат-ботів, включно з рішеннями від OpenAI та Google. Зараз взаємодія зі штучним інтелектом побудована за черговим сценарієм: користувач говорить або вводить запит, система його обробляє, після чого генерує відповідь. Іншими словами, це нагадує листування в месенджері.
Thinking Machines хоче перетворити таку взаємодію на справжню розмову, більше схожу на телефонний дзвінок, де співрозмовники можуть реагувати майже миттєво, перебивати один одного, уточнювати та коригувати сказане прямо під час діалогу.
Чому "повний дуплекс" важливий для розвитку AI?
Технологія full duplex давно використовується у телекомунікаціях, однак для генеративного штучного інтелекту це досить складне завдання.
Проблема полягає в тому, що сучасні мовні моделі переважно працюють послідовно. Вони спершу повністю отримують вхідний сигнал, обробляють його, а вже потім починають формувати відповідь. Такий підхід створює паузу, яка часто робить розмову неприродною. У Thinking Machines стверджують, що їхня модель здатна відповідати із затримкою лише 0,40 секунди. Це дуже близько до природної швидкості людської реакції в живій розмові.
За словами компанії, цей показник перевершує результати аналогічних систем, які наразі розробляють найбільші гравці ринку. Якщо ці цифри підтвердяться в реальному використанні, це може означати важливий технологічний крок для всієї індустрії.
Не готовий продукт, а дослідницький експеримент
Попри амбітні характеристики, Thinking Machines поки не запускає продукт для масового користування. Компанія наголошує, що TML-Interaction-Small наразі є лише дослідницьким прев'ю. Обмежений доступ для дослідників і партнерів планують відкрити протягом найближчих кількох місяців, а ширший реліз очікується пізніше цього року.
Як пише The Verge, це означає, що оцінити реальний користувацький досвід поки неможливо. Публічні демонстрації та внутрішні бенчмарки можуть виглядати переконливо, але лише масове тестування покаже, чи здатна система працювати стабільно в реальних сценаріях.
Чому за цим проєктом уважно стежить індустрія?
Поява Thinking Machines викликає особливу увагу через постать її засновниці. Після роботи в OpenAI Міра Мураті вважається однією з ключових фігур, які брали участь у розвитку сучасних генеративних моделей.
Той факт, що її нова компанія одразу фокусується не просто на збільшенні потужності моделей, а на зміні самої природи взаємодії між людиною та машиною, може свідчити про новий напрям розвитку галузі. Головна ідея проєкту полягає в тому, що інтерактивність не повинна бути додатковою надбудовою над мовною моделлю. Вона має бути закладена в саму архітектуру системи.
Саме це може стати наступним великим етапом еволюції AI – переходом від чат-ботів, які відповідають на команди, до цифрових співрозмовників, здатних підтримувати справжній живий діалог. Поки що залишається головне питання: чи підтвердяться технічні заяви компанії після виходу моделі за межі лабораторних тестів. Відповідь на нього ринок може отримати вже до кінця року.
Схожі новини
Xiaomi несподівано оновила старі популярні смартфони: кому пощастило
Hey @meta.ai is that true? Threads is testing a Grok-like AI feature