Листування у Slack на продаж: ШІ-компанії скуповують цифрові архіви компаній, щоб навчати свої моделі
Лабораторії штучного інтелекту почали масово купувати внутрішні дані компаній — від архівів Slack до листування й Jira-тасків — щоб навчати нове покоління моделей.
Про це повідомляє Forbes.
За інформацією видання, деякі стартапи, що закриваються, заробляють на продажі таких даних «сотні тисяч доларів».
Наприклад, компанія cielo24, яка працювала понад 10 років, змогла продати свій архів внутрішніх комунікацій і робочих процесів, що дозволило покрити витрати перед остаточним закриттям бізнесу.
Попит формують насамперед розробники ШІ-моделей, які шукають більш «реалістичні» дані для навчання. Якщо раніше моделі тренувалися на відкритому інтернеті — Wikipedia, Reddit чи книгах — то до кінця 2024 року цей ресурс фактично вичерпався. До того ж він погано підходить для створення «агентного ШІ», який має виконувати робочі завдання, а не просто генерувати тексти.
Саме тому компанії звернулися до внутрішніх корпоративних даних — переписок, обговорень, баг-репортів, планувань і навіть жартів у чатах. Усе це дає змогу відтворити реальну робочу динаміку: як люди ухвалюють рішення, координують задачі й взаємодіють у командах.
Новий ринок архівних листувань
На цьому тлі формується новий ринок. Стартап SimpleClosure, який допомагає компаніям закриватися, уже обробив майже 100 таких угод і повернув засновникам понад $1 млн. У середньому компанії отримують від $10 тис. до $100 тис. за свої дані. Конкурент — Sunset — працює за схожою моделлю.
Ціна залежить від «якості даних»: чим більше зв’язків між системами (наприклад, коли Jira-задача пов’язана з кодом і комунікацією), тим вони цінніші. Особливо дорогими вважаються дані з фінансового або медичного секторів.
Паралельно зростає і новий сегмент — платформи, де на основі таких даних створюють симульовані робочі середовища для тренування ШІ-агентів. Наприклад, Anthropic, за даними Informaton, може витратити на це до $1 млрд у 2026 році.
Водночас експерти попереджають ризики приватності. Навіть якщо дані формально належать компанії, співробітники навряд чи очікують, що їхні робочі листування можуть бути продані третім сторонам. У компаніях із захисту даних зазначають, що анонімізація таких масивів даних є складною і не завжди гарантує повний захист.
Читайте також: Хакери зламали сайт Booking.com. У компанії попередили клієнтів про витік даних
Схожі новини
Російський бізнес знову постраждає: який новий удар готує Кремль