Компанії почали продавати переписки своїх співробітників і робочі документи для навчання ШІ
Бізнес почав заробляти на внутрішніх даних: листування співробітників, задачі та документи продають як матеріал для навчання моделей штучного інтелекту.
Залишити коментар
Бізнес почав заробляти на внутрішніх даних: листування співробітників, задачі та документи продають як матеріал для навчання моделей штучного інтелекту.
Як пише Forbes, інтерес до таких даних різко зріс через дефіцит якісного контенту для тренування ШІ. Відкритих джерел уже недостатньо, тому компанії шукають приклади реальної роботи з контекстом, помилками і повною історією рішень.
Показовий випадок — закриття сервісу cielo24. Його колишня CEO Шанна Джонсон продала архів за 13 років роботи, який включав внутрішнє листування, задачі та операційні дані. За її словами, угода принесла сотні тисяч доларів і дозволила завершити ліквідацію компанії без боргів.
Паралельно формується інфраструктура під такі угоди. Стартап SimpleClosure, який допомагає закривати бізнеси, за рік провів близько 100 продажів корпоративних архівів і повернув засновникам понад $1 млн. Типові виплати за один набір даних становлять від $10 000 до $100 000.
Вартість залежить від якості та структури. Найдорожчими є дані, де видно повний робочий процес: як формулюється задача, як її обговорюють і до якого результату приходять. Такі зв’язки дозволяють навчати моделі виконувати реальні бізнес-задачі, а не просто генерувати текст.
Окремо зростає попит на симуляції робочого середовища. У таких системах ШІ тренується на основі реальних процесів компаній і вчиться діяти як співробітник. За даними Forbes, великі гравці вже інвестують у цей напрям, а Anthropic може вкласти до $1 млрд у подібні рішення.
Водночас експерти попереджають про ризики. Навіть після анонімізації даних залишається ймовірність повторної ідентифікації людей або компаній. Крім того, дослідження показують, що мовні моделі здатні відтворювати фрагменти даних, на яких їх навчали.
Причина появи цього ринку полягає в нестачі якісних даних для розвитку ШІ. Реальні робочі процеси виявилися значно ціннішими за тексти з відкритого інтернету, бо вони містять логіку прийняття рішень. У результаті корпоративні архіви перетворюються на окремий актив, який можна монетизувати навіть після закриття компанії.
Раніше dev.ua писав про те, скільки заробляють люди, які продають свої відео та телефонні розмови для навчання ШІ.
Укрдержархів передав 10 терабайтів даних для навчання національної мовної моделі «Сяйво»
По темi
Укрдержархів передав 10 терабайтів даних для навчання національної мовної моделі «Сяйво»
Microsoft і Meta платитимуть «Вікіпедії» за навчання ШІ на її контенті
По темi
Microsoft і Meta платитимуть «Вікіпедії» за навчання ШІ на її контенті
Meta звинувачують у завантаженні 2400 порнофільмів для навчання ШІ. Компанія це заперечує
По темi
Meta звинувачують у завантаженні 2400 порнофільмів для навчання ШІ. Компанія це заперечує
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Схожі новини
Російський бізнес знову постраждає: який новий удар готує Кремль