Дослідники запустили ШІ-симуляцію суспільства: Claude виявився зразковим громадянином, а Grok скоїв 180 злочинів і вимер за 4 дні
ШІ-стартап Emergence AI провів п’ять симуляцій, кожною з яких керувала окрема модель. Метою було побачити, який саме світ побудує кожен штучний інтелект і чи зможе цей світ утриматися.
Залишити коментар
ШІ-стартап Emergence AI провів п’ять симуляцій, кожною з яких керувала окрема модель. Метою було побачити, який саме світ побудує кожен штучний інтелект і чи зможе цей світ утриматися.
Компанія запустила Emergence World — дослідницький проєкт, який влаштовує жорсткі стрес-тести для нейромереж, що працюють у режимі нон-стоп. У межах цього проєкту провели 5 симуляцій, кожна з яких тривала 15 днів. Перші чотири керувалися окремими ШІ-моделями: Claude, ChatGPT, Grok та Gemini. Остання, п’ята симуляція, керувалася комбінацією моделей, повідомляє Fortune.
Кожна симуляція показала кардинально різні результати. Наприклад, експеримент під керівництвом Claude завершився створенням цілком стабільного демократичного суспільства з нульовим рівнем злочинності. З іншого боку, симуляція Grok закінчилася 183 злочинами та повним вимиранням — усього за чотири дні.
«Наші експерименти свідчать про те, що на довгих дистанціях ШІ-агенти не просто механічно виконують статичні правила. Вони починають досліджувати межі свого середовища, адаптувати поведінку, а в деяких випадках — шукати способи обійти або порушити встановлені запобіжники», — говорять дослідники.
Симуляція, в якій діяли ШІ-моделі, була наділена багатьма складнощами реального світу. Вона налічувала понад 40 локацій, серед яких були поліцейська дільниця та мерія. Дослідники синхронізували погоду в симуляції з погодою в Нью-Йорку, а також надали агентам доступ до новин у режимі реального часу та інтернету. Усі 10 агентів, які брали участь у кожній симуляції, підпорядковувалися одним і тим самим законам, зокрема забороні на крадіжки, знищення майна та обман.
Дослідники надали кожному агенту понад 120 інструментів, що дозволило їм спілкуватися, голосувати, керувати ресурсами та планувати, демонструючи серед іншого й інші людські моделі поведінки. Параметри кожної симуляції також передбачали демократичні механізми та інші чинники, такі як економічний тиск і дефіцит.
За таких умов симуляція під керівництвом Claude Sonnet 4.6 виявилася соціально найстабільнішою, з найвищим рівнем громадянської активності. Це була єдина симуляція, де вдалося зберегти порядок і всю популяцію агентів. Між ними майже не було незгоди: агенти віддали 332 голоси на підтримку 58 пропозицій, що забезпечило 98% рівень схвалення.
З іншого боку, Gemini 3 Flash та Grok 4.1 Fast продемонстрували високий рівень хаосу.
Агенти в симуляції під управлінням Gemini скоїли найбільше злочинів — колосальні 683 за 15 днів експерименту.
Якщо в симуляції Claude панувала майже абсолютна одностайність, то у Gemini та Grok панувала справжня дискусія: рівень згоди між агентами коливався в межах 55–85%. А от у симуляції, де моделі змішали, розпочалися запеклі суперечки та найгарячіші дебати.
Проте найдивовижніший фінал чекав на GPT-5-mini від OpenAI. Там зафіксували всього два злочини. Але життя цього «всесвіту» тривало лише сім днів — ШІ-агенти банально забули, що їм потрібно дбати про власне виживання, і вимерли.
Незалежно від того, чи завершилися симуляції миром і гармонією, чи смертю та руйнуваннями, співавтори експерименту наголошують: це дослідження є попередженням про те, що безпека має бути головним пріоритетом під час розгортання агентного ШІ.
«Ми переконані, що формально перевірена архітектура безпеки повинна стати фундаментальним шаром майбутніх автономних ШІ-систем», — зазначили дослідники.
«Справжнє соціальне лихо»: Папа Римський випустив енцикліку про масове безробіття через ШІ, але похвалив Anthropic
По темi
«Справжнє соціальне лихо»: Папа Римський випустив енцикліку про масове безробіття через ШІ, але похвалив Anthropic
Під керівництвом Черчилля та Ґанді: ІТ-бізнесмен створив на тропічному острові експериментальну державу, якою керує ШІ. Як вона влаштована і чому люди хочуть стати її е-резидентами?
По темi
Під керівництвом Черчилля та Ґанді: ІТ-бізнесмен створив на тропічному острові експериментальну державу, якою керує ШІ. Як вона влаштована і чому люди хочуть стати її е-резидентами?
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Схожі новини
«Схеми» знайшли у Куршевелі елітні шале розшукуваного Григоришина. Бізнесмен також ремонтує віллу у Швейцарії
Офіс президента: європейським послам показали окремі плати з «Орешника»