DeepSeek представив нову модель V4 та обвалив акції конкурентів
Китайський стартап DeepSeek представив прев’ю-версію своєї нової великої мовної моделі V4. Вона має відкритий код і вже доступна для тестування у версіях pro та flash.
Залишити коментар
Китайський стартап DeepSeek представив прев’ю-версію своєї нової великої мовної моделі V4. Вона має відкритий код і вже доступна для тестування у версіях pro та flash.
Як повідомляє CNBC, реліз V4 відбувся на тлі посилення внутрішньої конкуренції в Китаї. На відміну від легендарної моделі R1, яка на початку 2025 року шокувала світ своєю дешевизною та продуктивністю, нинішнє оновлення спрямоване на пряму боротьбу з локальними гігантами на кшталт Alibaba та ByteDance.
Розробники представили дві основні варіації моделі:
-
DeepSeek-V4-Pro: має 1,6 ТБ загальних параметрів (49 млрд активних). За заявами компанії, її продуктивність не поступається провідним світовим моделям із закритим кодом.
-
DeepSeek-V4-Flash: легша версія на 284 млрд параметрів (13 млрд активних), орієнтована на максимальну швидкість й економію ресурсів.
Аналітики зазначають, що DeepSeek V4 пропонує значно нижчі витрати на виведення (inference costs) порівняно з конкурентами. «Попередній огляд DeepSeek V4 — це серйозний прорив. Вона демонструє відмінні можливості агента за значно нижчою вартістю», — вважає Вей Сун, головний аналітик з питань ШІ у Counterpoint Research.
Розробники оптимізували модель для інтеграції з популярними інструментами, такими, як Claude Code від Anthropic. Це дозволяє використовувати V4 для автоматизації складних завдань у розробці програмного забезпечення та аналітиці знань.
Попри те, що ринок уже звик до агресивної цінової політики DeepSeek, вихід V4 спричинив падіння акцій інших гравців ШІ-сектору. На гонконзькій біржі цінні папери MiniMax та Zhipu впали на 8%, а компанії Manycore Tech — на 9%. Інвестори побоюються, що черговий демпінг від стартапу з Ханчжоу знову змусить ринок переглядати маржинальність бізнесу.
Нагадаємо, DeepSeek став справжньою сенсацією у січні 2025 року. Тоді компанія довела, що здатна навчати моделі рівня лідерів галузі (OpenAI, Google) на застарілому «залізі» та з бюджетом до $6 млн. Це спростувало тезу про те, що для лідерства в ШІ обов’язково потрібні десятки мільярдів доларів та найновіші чіпи Nvidia, постачання яких до Китаю та росії обмежене санкціями США.
Читайте головні IT-новини країни в нашому Telegram
По темi
Читайте головні IT-новини країни в нашому Telegram
Загадкова ШІ-модель Hunter Alpha заінтригувала розробників: невже це новий блокбастер від DeepSeek?
По темi
Загадкова ШІ-модель Hunter Alpha заінтригувала розробників: невже це новий блокбастер від DeepSeek?
ШІ-модель для відео від ByteDance — Seedance 2.0 — стає вірусною: китайці вже пророкують їй успіх DeepSeek
По темi
ШІ-модель для відео від ByteDance — Seedance 2.0 — стає вірусною: китайці вже пророкують їй успіх DeepSeek
DeepSeek знайшла новий підхід до навчання LLM-моделей, який може знову перевернути ШІ-ринок
По темi
DeepSeek знайшла новий підхід до навчання LLM-моделей, який може знову перевернути ШІ-ринок
Схожі новини
Nomura posts record full-year profit on Japan market rebound
АМКУ затвердив рекомендації для найбільших мереж АЗС щодо цін на пальне і дав 10 днів на звіт
Нацбанк пом’якшив низку валютних обмежень для оборонних підприємств: що зміниться?