Дослідники запустили ШІ-симуляцію суспільства: Claude виявився зразковим громадянином, а Grok скоїв 180 злочинів і вимер за 4 дні
ШІ-стартап Emergence AI провів п’ять симуляцій, кожною з яких керувала окрема модель. Метою було побачити, який саме світ побудує кожен штучний інтелект і чи зможе цей світ утриматися.
Залишити коментар
ШІ-стартап Emergence AI провів п’ять симуляцій, кожною з яких керувала окрема модель. Метою було побачити, який саме світ побудує кожен штучний інтелект і чи зможе цей світ утриматися.
Компанія запустила Emergence World — дослідницький проєкт, який влаштовує жорсткі стрес-тести для нейромереж, що працюють у режимі нон-стоп. У межах цього проєкту провели 5 симуляцій, кожна з яких тривала 15 днів. Перші чотири керувалися окремими ШІ-моделями: Claude, ChatGPT, Grok та Gemini. Остання, п’ята симуляція, керувалася комбінацією моделей, повідомляє Fortune.
Кожна симуляція показала кардинально різні результати. Наприклад, експеримент під керівництвом Claude завершився створенням цілком стабільного демократичного суспільства з нульовим рівнем злочинності. З іншого боку, симуляція Grok закінчилася 183 злочинами та повним вимиранням — усього за чотири дні.
«Наші експерименти свідчать про те, що на довгих дистанціях ШІ-агенти не просто механічно виконують статичні правила. Вони починають досліджувати межі свого середовища, адаптувати поведінку, а в деяких випадках — шукати способи обійти або порушити встановлені запобіжники», — говорять дослідники.
Симуляція, в якій діяли ШІ-моделі, була наділена багатьма складнощами реального світу. Вона налічувала понад 40 локацій, серед яких були поліцейська дільниця та мерія. Дослідники синхронізували погоду в симуляції з погодою в Нью-Йорку, а також надали агентам доступ до новин у режимі реального часу та інтернету. Усі 10 агентів, які брали участь у кожній симуляції, підпорядковувалися одним і тим самим законам, зокрема забороні на крадіжки, знищення майна та обман.
Дослідники надали кожному агенту понад 120 інструментів, що дозволило їм спілкуватися, голосувати, керувати ресурсами та планувати, демонструючи серед іншого й інші людські моделі поведінки. Параметри кожної симуляції також передбачали демократичні механізми та інші чинники, такі як економічний тиск і дефіцит.
За таких умов симуляція під керівництвом Claude Sonnet 4.6 виявилася соціально найстабільнішою, з найвищим рівнем громадянської активності. Це була єдина симуляція, де вдалося зберегти порядок і всю популяцію агентів. Між ними майже не було незгоди: агенти віддали 332 голоси на підтримку 58 пропозицій, що забезпечило 98% рівень схвалення.
З іншого боку, Gemini 3 Flash та Grok 4.1 Fast продемонстрували високий рівень хаосу.
Агенти в симуляції під управлінням Gemini скоїли найбільше злочинів — колосальні 683 за 15 днів експерименту.
Якщо в симуляції Claude панувала майже абсолютна одностайність, то у Gemini та Grok панувала справжня дискусія: рівень згоди між агентами коливався в межах 55–85%. А от у симуляції, де моделі змішали, розпочалися запеклі суперечки та найгарячіші дебати.
Проте найдивовижніший фінал чекав на GPT-5-mini від OpenAI. Там зафіксували всього два злочини. Але життя цього «всесвіту» тривало лише сім днів — ШІ-агенти банально забули, що їм потрібно дбати про власне виживання, і вимерли.
Незалежно від того, чи завершилися симуляції миром і гармонією, чи смертю та руйнуваннями, співавтори експерименту наголошують: це дослідження є попередженням про те, що безпека має бути головним пріоритетом під час розгортання агентного ШІ.
«Ми переконані, що формально перевірена архітектура безпеки повинна стати фундаментальним шаром майбутніх автономних ШІ-систем», — зазначили дослідники.
«Справжнє соціальне лихо»: Папа Римський випустив енцикліку про масове безробіття через ШІ, але похвалив Anthropic
По темi
«Справжнє соціальне лихо»: Папа Римський випустив енцикліку про масове безробіття через ШІ, але похвалив Anthropic
Під керівництвом Черчилля та Ґанді: ІТ-бізнесмен створив на тропічному острові експериментальну державу, якою керує ШІ. Як вона влаштована і чому люди хочуть стати її е-резидентами?
По темi
Під керівництвом Черчилля та Ґанді: ІТ-бізнесмен створив на тропічному острові експериментальну державу, якою керує ШІ. Як вона влаштована і чому люди хочуть стати її е-резидентами?
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Схожі новини
Austria: Taylor Swift concert plot suspect sentenced to 15 years
The Suez and Panama canals charge tolls. Why is Iran’s Hormuz fee triggering global outrage?
Buffalo with 'Trump' coiffure spared slaughter, moved to zoo