BETA — Сайт у режимі бета-тестування. Можливі помилки та зміни.
UK | EN |
LIVE
Технології 🇺🇦 Україна

47 000 процессоров и ни одного GPU: Китай строит рекордный суперкомпьютер на 2 ExaFLOPS - верим?

ITC.ua Шадрін Андрій 2 переглядів 6 хв читання
47 000 процесорів і жодного GPU: Китай будує рекордний суперкомп'ютер на 2 ExaFLOPS - віримо?

Китай представил суперкомпьютер мощностью 2 ExaFLOPS, работающий исключительно на CPU: 47 000 процессоров в 92 вычислительных стойках в очередной попытке обогнать США. Без GPU. Система Lingsheng нацелена на два ExaFLOPS, используя исключительно центральные процессоры.


Китайский центр суперкомпьютерных вычислений объявил о планах по машине, которая достигнет двух ExaFLOPS, используя исключительно центральные процессоры. Система Lingsheng, представленная на конференции в Шэньчжэне в апреле 2026 года, разместит 47 000 процессоров в всего 92 вычислительных стойках. Лу Юйтун, директор Национального центра суперкомпьютерных вычислений в Шэньчжэне и главный разработчик системы, пояснил, что аппаратный и программный стек является «полностью независимо управляемым».

Принципиально другая архитектурная стратегия

Современные экзаскейл-машины в отрасли в значительной степени полагаются на GPU-акселераторы или специализированное оборудование. Это делает подход с использованием исключительно CPU существенным отходом от устоявшихся мировых тенденций. Система использует отечественные высокопроизводительные CPU  со встроенной памятью с высокой пропускной способностью и высокоскоростными сетями соединений. Она также включает 3D-вычисления с плавающей ортогональной точностью и полное жидкостное охлаждение для управления тепловыми показателями.

«Суперкомпьютер LineShine состоит из 20 480 вычислительных узлов. Каждый узел оснащен двумя процессорами LX2 на базе ARMv9. Каждый LX2 интегрирует два вычислительных кристалла (304 ядра в целом) и восемь стеков HBM на корпусе (32 ГБ, совокупная пропускная способность 4 ТБ/с). Узлы соединены через высокоскоростную сеть LingQi с двухуровневой многошинной топологией fat-tree, что обеспечивает пропускную способность 1,6 Тбит/с на узел», — пишут HPC Wire.

Согласно объявлению, платформа Lingsheng достигает прорывов в шести основных технических направлениях: архитектуре, производительности, энергопотреблении, программировании, масштабируемости и надежности. Система поддерживает экзаскейл-вычислительную мощность с экзаскейл-хранением и петаскейл-коммуникацией, а также использует то, что официальные лица описали как крупнейшую в мире централизованную технологию жидкостного охлаждения. Пилотная верификационная фаза использует 100 серверов Huawei Kunpeng на базе ARM-архитектуры Taishan cores с общим количеством 12 800 ядер.


«В 2023 году соучредитель TOP500 Джек Донгарра заявил, что в сфере экзаскейл-вычислений США, скорее всего, проиграют Китаю. Хотя когда-то Китай имел больше машин в списке, чем любая другая страна, из-за геополитических факторов — в частности торговых санкций — страна сократила количество поданных заявок, решив вместо этого публиковать собственную версию списка, состоящую исключительно из отечественных систем», — говорят Data Center Dynamics.

При масштабировании до полного производства одна и та же конструкция системы будет включать 1 580 блейд-серверов на базе x86 CPU со 101 120 ядрами и теоретическим пиковым показателем более 10 PetaFLOPS. Полная инфраструктура также включает 36 сетевых стоек, которые поддерживают межсоединение на миллион портов. Кроме того, предусмотрено 650 ПБ запланированного хранилища, распределенного между 428 узлами, и 67 стоек хранения с жидкостным охлаждением, обеспечивающих пропускную способность 10 ТБ/с.

«Заявления Китая по меньшей мере сомнительны. Если буквально читать объявления, Китай говорит, что сможет достичь 2+ экзаФЛОПС в какой-то момент в будущем», — пишет Tom’s Hardware.

Самый быстрый компьютер в мире на сегодняшний день — El Capitan Министерства энергетики США — работает на 44 544 APU AMD MI300A, интегрирующих кристаллы CPU и GPU в одном корпусе. Если устойчивая производительность Lingsheng в 2 ExaFLOPS будет достигнутый, он превзойдет показатель El Capitan по тесту Linpack — 1,809 ExaFLOPS. С другой стороны, показатель 2 ExaFLOPS для системы Lingsheng является теоретической величиной, тогда как El Capitan уже имеет теоретическое значение 2,79 ExaFLOPS. Таким образом, утверждение о превосходстве самого быстрого компьютера в мире кажется недостижимым при сравнении теоретических значений между собой.

Открытые вопросы и недоказанные возможности

По системе Lingsheng остается несколько ключевых вопросов без ответа — прежде всего потому, что для этой машины не существует никаких бенчмарочных данных. Хотя Китай утверждает, что система не будет опираться на поставщиков не из КНР, отечественные варианты x86 страны остаются ограниченными Zhaoxin и Hygon. Ни одна из этих отечественных альтернатив не продемонстрировала процессоров, способных конкурировать с современными разработками от Intel или AMD.

«El Capitan уже теоретически способен на 2,79 экзаФЛОПС, поэтому трудно понять, как китайский проект вообще сможет ‘установить новый ориентир для мировых суперкомпьютерных вычислений’, если вряд ли заработает даже через пять лет», — добавляют Tom’s Hardware.

В объявлении также не было названо конкретных поставщиков для производственной системы и не указано операционных сроков ее завершения. Относительно потенциальных применений, технология охватывает девять отраслей, среди которых дистанционное зондирование, материаловедение, биоинформатика, метеорология, фармацевтика, нефтеразведка, искусственный интеллект, науки о жизни и электромагнитное моделирование.

СпецпроектыБеріть участь у конкурсі авторських статей від Proove: вигравайте крутий електросамокат та інші призиRB24: що вміє застосунок РАДАБАНКу і чи варто його спробувати

«Во время тестирования системы на одном CPU была достигнута производительность 578 токенов в секунду при работе с моделью DeepSeek — а общая пропускная способность полностью собранной системы должна быть в 100 раз выше/ Примечательно, что официальные заявления о производительности Lingsheng не равнозначны валидированной записи в рейтинге TOP500, который использует конкретные бенчмарки вроде HPL. Если Китай не опубликует все технические детали или не согласится на сравнительное тестирование, влияние системы будет ощущаться внутри страны, но верифицировать его извне будет значительно сложнее», — сомневается Wccftech.

Одна исследовательская группа сообщила о достижении параллельной масштабируемости 81% для расчетов из первых принципов с привлечением 100 миллионов атомов. Другая группа заявила, что виртуальный скрининг соединений в триллионных масштабах может повысить эффективность в 1 000 раз благодаря сочетанию ИИ и обучения с подкреплением. Однако это остаются теоретическими утверждениями до тех пор, пока функционирующая машина не предоставит верифицированные бенчмарочные результаты.

Спасибо, кэп: китайские ученые решили проблему возгорания батарей — создали батарею, которая просто не может загореться

Источник: TechRadar

Поділитися

Схожі новини