BETA — Сайт у режимі бета-тестування. Можливі помилки та зміни.
UK | EN |
LIVE
Розваги 🇺🇦 Україна

DeepSeek знову обіцяє революцію з новою моделлю на 1,6 трильйона параметрів

Розваги 24 24 Канал 4 переглядів 5 хв читання
DeepSeek знову обіцяє революцію з новою моделлю на 1,6 трильйона параметрів
Техно Штучний інтелект DeepSeek знову обіцяє революцію з новою моделлю на 1,6 трильйона параметрів 24 квітня, 14:00view counttime for reading5 хвЗберегтиDeepSeek знову обіцяє революцію з новою моделлю на 1,6 трильйона параметрів Олександр ГайдамашкоОсновні тези
  • DeepSeek випустила нову мовну модель V4 з двома версіями, Pro і Flash, які відрізняються кількістю параметрів і контекстним вікном до 1 мільйона токенів.
  • Модель V4 викликала занепокоєння через звинувачення у плагіаті і проблеми з конфіденційністю, оскільки дані зберігаються на китайських серверах, доступних для державних структур КНР.
DeepSeek V4 Pro – вийшла китайська нейромережа на 1,6 трильйона параметрівDeepSeek V4 змінює правила гри / Depositphotos

DeepSeek представила Preview-версію своєї нової великої мовної моделі V4, яка обіцяє значне зростання потужності та ефективності. Оновлення включає дві версії та демонструє амбіції китайських розробників у глобальних перегонах за лідерство у сфері штучного інтелекту.

Що пропонує DeepSeek V4?

Китайський стартап DeepSeek, який раніше вже спричинив справжній фурор на світових ринках, офіційно оголосив про запуск Preview-версії своєї нової флагманської моделі DeepSeek V4. Цей реліз став відповіддю на загострення конкуренції між Китаєм і США в галузі високих технологій. Нова серія представлена у двох варіантах: Pro та Flash, обидва з яких уже доступні користувачам на офіційному сайті компанії, пише Tech Xplore.

Дивіться також OpenAI запускає автономних "агентів робочого простору"

Технічні характеристики нової моделі, наведені в оголошенні DeepSeek, вражають своїм масштабом:

  • Версія Pro має загальну кількість параметрів, що сягає 1,6 трильйона, з яких 49 мільярдів є активними.
  • Своєю чергою, легша версія Flash працює на базі 284 мільярдів параметрів, де активними є 13 мільярдів.
  • Одним із найважливіших досягнень розробників стало розширення контекстного вікна до 1 мільйона токенів для обох варіантів. Це дозволяє нейромережі опрацьовувати та запам'ятовувати величезні масиви інформації за один раз, що є значним прогресом порівняно з попередньою моделлю V3, яка підтримувала лише 128 000 токенів.

Представники DeepSeek стверджують, що версія Pro демонструє виняткові здібності в логічному мисленні, математиці та програмуванні, випереджаючи всі моделі конкурентів із відкритим кодом, пише Neowin. За їхніми словами, у тестах на логіку V4 Pro Max показує кращі результати, ніж OpenAI GPT-5.2 та Gemini 3.0-Pro від Google, хоча й дещо поступається версіям GPT-5.4 та Gemini 3.1-Pro.

Окрему увагу приділено "агентським" можливостям – здатності системи автономно виконувати складні робочі процеси. У цьому аспекті китайська розробка може перевершити Claude Sonnet 4.5 та наблизитися до рівня Claude Opus 4.5.

Результати DeepSeek V4
Результати DeepSeek V4 / Фото Результати DeepSeek

Версія Flash подається як максимально вигідне рішення для розробників. Вона демонструє логічні здібності, що майже не поступаються версії Pro, і на рівних справляється з простими автономними завданнями.

  • Вартість використання API для Flash є дуже низькою: вхідні дані коштують від 0,028 до 0,14 долара, а вихідні – 0,28 долара.
  • Для моделі Pro ціни вищі: вхідні дані обійдуться у 0,145 – 1,74 долара, а вихідні – у 3,48 долара.

Пригальмуйте з використанням: у чому проблема DeepSeek

Украсти крадене

Попри технічні успіхи, вихід DeepSeek V4 супроводжується геополітичною напруженістю та звинуваченнями у плагіаті. Американські компанії Anthropic та OpenAI закидають китайському стартапу незаконне використання їхніх технологій. Зокрема, йдеться про метод дистиляції, коли менш потужна модель навчається на результатах роботи сильнішої системи.

Офіційні представники адміністрації США також висловили занепокоєння тим, що іноземні компанії експлуатують американські інновації. Натомість китайська сторона відкидає ці претензії, називаючи їх необґрунтованим тиском на бізнес.

Проблеми конфіденційності

Використання DeepSeek також супроводжується серйозними занепокоєннями щодо безпеки та конфіденційності, які стали об'єктом міжнародних розслідувань ще після першого релізу. Основна проблема полягає в тому, що компанія-розробник Hangzhou DeepSeek Artificial Intelligence базується в Китаї та прямо заявляє про зберігання даних на китайських серверах, що робить їх доступними для державних структур КНР.

Згідно з китайським законодавством (зокрема законами про національну безпеку та кібербезпеку), компанії зобов'язані надавати дані користувачів правоохоронним органам та державним структурам на вимогу. Дослідники з кібербезпеки виявили код, що дозволяє передавати дані безпосередньо через інфраструктуру державних компаній, таких як China Mobile.

Фахівці з нацбезпеки США та інших країн класифікують DeepSeek як потенційний інструмент для кібершпигунства та проведення операцій впливу.

Технічні прогалини

  • У січні 2025 року дослідники з Wiz Research виявили витік понад мільйона записів (історія чатів, API-ключі, внутрішні логи) через неправильно налаштовану хмарну базу даних, яка була доступна публічно.
  • Експерти компанії NowSecure зафіксували, що додаток DeepSeek для iOS примусово вимикав систему безпеки App Transport Security (ATS), яка призначена для шифрування даних під час передачі.
  • Тести Cisco показали, що модель R1 практично не блокує шкідливі запити (jailbreak attacks), що дозволяє використовувати її для написання шкідливого коду або генерації небезпечного контенту.

Тож якщо ви плануєте використовувати DeepSeek, не вказуйте персональні дані, корпоративні таємниці або конфіденційні документи. Найбезпечнішим варіантом для бізнесу вважається Self-hosting (локальне розгортання) відкритої моделі на власних серверах, щоб дані не залишали вашу інфраструктуру.

Поділитися

Схожі новини