Прорыв в ИИ: Модель GLM-5.2 от Z.ai на базе чипов Huawei занимает лидирующие позиции

22 часа назадAndroid

Китайская компания Z.ai представила новую модель искусственного интеллекта GLM-5.2, которая мгновенно заняла первое место в индексе Artificial Analysis. В условиях жестких санкций со стороны США, направленных на ограничение доступа к мощным моделям, Китай делает шаг вперёд, выпуская открытые решения, которые доступны для локального использования. В данной статье мы рассмотрим ключевые достижения модели GLM-5.2 и её влияние на рынок ИИ.

Технологические достижения GLM-5.2

Обучение на процессорах Huawei: Модель GLM-5.2 была создана исключительно с использованием процессоров Huawei Ascend 910B, что демонстрирует возможность эффективной работы без оборудования Nvidia.
Отличные результаты бенчмарков: GLM-5.2 показала впечатляющие результаты в разных тестах, заняв второе место в Code Arena и первое среди доступных моделей.

«На SWE-bench Pro GLM-5.2 опередила GPT-5.5 с результатом 62,1 баллов,» — отмечают эксперты.

Архитектура и особенности модели

Смесь экспертов (MoE): Модель использует архитектуру MoE с 744 миллиардами параметров, активируя только 40 миллиардов для каждого вывода.
Динамическое внимание: Интеграция механизма разрежённого внимания (DSA) позволяет модели обрабатывать большие контексты более эффективно.

«Это делает возможным использование контекстного окна в 1 миллион токенов,» — подчеркивают разработчики.

Экономические аспекты разработки

Снижение затрат на обучение: Обучение модели обошлось примерно в $25 миллионов, что значительно ниже аналогичных затрат на передовые модели в США благодаря дешевизне чипов Ascend и субсидиям от правительства.
Время вывода: Однако GLM-5.2 генерирует меньше токенов в секунду по сравнению с конкурентами на чипах Nvidia из-за накладных расходов на маршрутизацию MoE.

«Разница в производительности вызывает вопросы о сравнении эффективности,» — отмечают аналитики.

Будущее модели GLM-5.2 и рынок ИИ

Сравнение с американскими моделями: Несмотря на достигнутые успехи, китайские модели всё ещё уступают американским в сложных задачах логического мышления.
Перспективы развития: Если GLM-5.2 сможет продемонстрировать соответствие коммерческим возможностям западных моделей до конца 2026 года, это поставит под сомнение целесообразность экспортного контроля со стороны США.

«Модель быстро сокращает временной разрыв между собой и западными аналогами,» — заключает эксперт Epoch AI.

Таким образом, модель GLM-5.2 от Z.ai представляет собой значимый прорыв в области ИИ, демонстрируя потенциал китайских технологий даже в условиях международной изоляции и жестких санкций.

soft-hard Показать другие его статьи Подписаться на RSS