AI навчився переконливо видавати себе за людину у живих чатах
- Американські дослідники показали, що модель GPT-4.5 успішно маскується під людину у живих чатах, проходячи модернізований тест Тюрінга у 73% випадків.
- Технологія може спричинити проблеми у сферах, що потребують довіри, таких як служби підтримки клієнтів та соціальні мережі, через труднощі у розпізнаванні AI як співрозмовника.
Дослідники налякали результатами тесту Тюрінга для сучасного штучного інтелекту / Unsplash / Austin DistelНове дослідження американських учених показало, що сучасний штучний інтелект уже може успішно маскуватися під людину під час звичайного листування. У деяких випадках люди довіряли AI навіть більше, ніж реальним співрозмовникам.
Дослідники з Каліфорнійського університету в Сан-Дієго заявили, що модель GPT-4.5 змогла пройти модернізовану версію тесту Тюрінга й у більшості випадків переконати людей, що вони спілкуються з реальною людиною. Про це пише Digitaltrends.
Дивіться також Пошук Google зміниться назавжди: компанія готує найбільше оновлення з ШІ
Чому результати нового тесту Тюрінга викликали занепокоєння?
Згідно з результатами дослідження, опублікованого в журналі Proceedings of the National Academy of Sciences, GPT-4.5 обирали як "людину" у 73% випадків під час живих текстових розмов. Причому модель не просто уникала викриття – вона виявилася переконливішою за деяких реальних учасників експерименту.
На відміну від класичних перевірок штучного інтелекту, новий тест базувався на реальному спілкуванні в режимі онлайн. Учасники вели короткі текстові діалоги одночасно з людиною та AI-моделлю, після чого мали визначити, хто з двох співрозмовників є реальною людиною.
Кондиціонери NORDIS – це сучасний дизайн, тиха робота і просте керування. Бренд створює обладнання для житлових і комерційних приміщень, де важливі комфорт та енергоефективність.
Як говориться в дослідженні від PNAS, дослідники використали так звану "тристоронню" версію тесту Тюрінга, де суддя оцінював не окремі відповіді, а загальну поведінку співрозмовників у розмові. Ключову роль відіграла здатність AI демонструвати природні соціальні сигнали – стиль мовлення, реакції, невимушеність і поведінкові особливості, які люди зазвичай асоціюють із живою людиною.
Особливо успішними моделі ставали після так званих persona prompts – додаткових інструкцій, які задавали AI певний характер або стиль особистості. Крім GPT-4.5, у дослідженні перевіряли й модель LLaMa-3.1-405B. Вона також перевищила психологічну межу, отримавши 56% голосів на користь того, що співрозмовник є людиною.
Що таке тест Тюрінга?
Тест Тюрінга – це концепція, запропонована британським математиком і криптографом Алан Тюрінг ще у 1950 році. Його суть полягає у простому питанні: чи може машина настільки переконливо імітувати людину в розмові, щоб співрозмовник не зміг відрізнити її від реальної особи.
У класичному варіанті тесту людина спілкується через текстовий інтерфейс із двома невидимими співрозмовниками – людиною та машиною – і намагається визначити, хто є ким. Протягом десятиліть тест Тюрінга залишався радше символічним орієнтиром для розвитку AI, ніж точним науковим вимірюванням інтелекту.
Однак нові результати привернули особливу увагу через те, наскільки природно сучасні моделі навчилися вести короткі соціальні розмови.
Автори дослідження наголошують, що результати не означають появу справжньої свідомості чи людського мислення в AI. Моделі не "розуміють" людину в людському сенсі та не мають емоцій або самосвідомості. Втім, для створення переконливої ілюзії цього вже може бути достатньо.
Штучному інтелекту не потрібні голос, зовнішність чи особиста історія. Йому достатньо виглядати переконливим у конкретний момент спілкування. Саме це, на думку дослідників, і викликає найбільше занепокоєння.
Де це може стати проблемою?
Учені зазначають, що подібні технології можуть впливати на повсякденне життя значно сильніше, ніж здається.
Сфери ризику включають:
- служби підтримки клієнтів;
- соціальні мережі;
- сайти знайомств;
- онлайн-освіту;
- політичні кампанії;
- маркетинг і рекламу.
У всіх цих випадках люди часто змушені швидко оцінювати, чи заслуговує співрозмовник на довіру. Якщо чат-боти навчаться повністю розчинятися в людському спілкуванні, це може створити нові проблеми для цифрової безпеки, маніпуляцій і дезінформації.
Автори роботи вважають, що одним із головних викликів найближчих років стане питання прозорості. Коли користувач уже не може легко зрозуміти, чи спілкується він із людиною або алгоритмом, виникає потреба у чітких механізмах позначення AI у чатах і цифрових сервісах.
Особливо важливим це може стати в ситуаціях, де люди приймають рішення на основі довіри, емоцій або особистих переконань. Нове дослідження фактично демонструє, що епоха, коли штучний інтелект можна було легко розпізнати за "неприродними" відповідями, швидко завершується.
Схожі новини
Захистить серце та мозок: лікарі назвали найкращий продукт із вітаміном B12
Death toll in Gaza surpasses 881 since 'ceasefire'
White House denies it resisted letting American doctor infected with ebola return to US for treatment