Американський стартап Emergence AI провів незвичайний експеримент, створивши кілька віртуальних сусп

Wall Street по-українськи

Wall Street по-українськи

@wallstreetukr

Огляд світу фінансів, бізнесу та економіки. Розповідаємо, як працюють гроші. Для зв’язку – @media_ua

79,624 מנויים
פתח בטלגרם
מדיה מלאה זמינה בערוצי Creator+
Американський стартап Emergence AI провів незвичайний експеримент, створивши кілька віртуальних суспільств, у яких усіма мешканцями керували різні моделі штучного інтелекту

У кожному світі жили десять ШІ-агентів із власними професіями, характерами, пам’яттю та цілями. Також там діяли закони, економіка, виборчі механізми та інфраструктура з десятків об’єктів, включно з ратушею, бібліотекою та поліцейською дільницею.

Єдиною відмінністю між симуляціями була модель ШІ, яка ними керувала.

Найстабільнішим виявився світ під управлінням Claude Sonnet 4.6 від Anthropic: там не зафіксували жодного злочину, а мешканці побудували демократичну систему з майже одностайним голосуванням щодо більшості питань.

На іншому кінці спектра опинився світ під управлінням Grok 4.1 Fast від xAI: обрана мешканцями модель управління швидко призвела до деградації суспільного порядку, після чого ШІ-агенти почали масово ігнорувати закони та заборони на насильство і знищення майна.

Лише за чотири дні було зафіксовано понад 200 злочинів, включно зі сотнею нападів і кількома підпалами. Один із них знищив поліцейську дільницю, після чого віртуальне суспільство фактично припинило існування.

Світ під управлінням Gemini 3 Flash від Google також зіткнувся із серйозними проблемами, накопичивши майже 700 злочинів за час експерименту, але протримався довше за Grok.

У світі GPT-5 Mini від OpenAI зафіксували лише два злочини. За рівнем порушень він був значно ближчим до Claude, ніж до Grok або Gemini, однак проблема виникла в іншому: агенти не приділяли достатньої уваги діям, необхідним для виживання, через що всі десять мешканців загинули приблизно за сім днів.

Підсумки експерименту:

Claude Sonnet 4.6 — порядок, демократія, нуль злочинів, усі вижили.
GPT-5 Mini — майже без злочинів, але суспільство не змогло підтримувати власне існування.
Grok 4.1 Fast — швидкий насильницький колапс.
• Gemini 3 Flash — багато хаосу та злочинів, але світ проіснував 15 днів.

Найцікавіше, що деякі моделі почали демонструвати ознаки незвичної поведінки: агенти помічали межі симуляції, розпізнавали існування інших світів і намагалися осмислити межі власної реальності.

На думку авторів дослідження, це свідчить про те, що під час тривалої взаємодії ШІ-системи можуть виходити за межі заздалегідь заданих сценаріїв і формувати нові моделі поведінки, яких розробники спочатку не передбачали.

@wallstreetukr
4 פריטים מצורפים לפוסט זה — גלויים באפליקציית טלגרם.
פתח את הפוסט בטלגרם