DeepSeek представляет мощные ИИ-модели: DeepSeek-V3.2 и V3.2-Speciale

Китайский стартап DeepSeek анонсировал выход двух новых открытых моделей, обладающих выдающимися возможностями рассуждения — DeepSeek-V3.2 и её усовершенствованная версия V3.2-Speciale. Эти разработки подчеркивают амбиции Китая в области искусственного интеллекта, позволяя ему конкурировать с такими гигантами, как OpenAI и Google. В данной статье мы рассмотрим, чем именно выделяются новые модели DeepSeek на фоне существующих решений, а также их достижения в различных тестах.

Проблема и достижения

Согласно результатам тестирования, новые модели DeepSeek демонстрируют уровень эффективности, сопоставимый с известными аналогами — GPT-5 и Gemini 3 Pro. Давайте подробнее рассмотрим результаты тестов.

  • Математические достижения:
    • Золото на международных олимпиадах: V3.2-Speciale завоевала высшие награды на Международной математической олимпиаде и других престижных конкурсах.
    • Результаты тестов: на Американском отборочном экзамене по математике модель показала 96%, что выше результатов GPT-5 и Gemini 3 Pro.
  • Программирование:
    • SWE Verified: DeepSeek-V3.2-Speciale набрала 73,1%, что делает её конкурентоспособной среди лучших моделей.
    • Высокая точность: Несмотря на небольшое отставание от GPT-5 High и Gemini 3 Pro, она продемонстрировала значительные способности в программировании.

Технологические достижения DeepSeek

DeepSeek V3.2, как утверждают разработчики, является первой моделью компании, специально созданной для работы в качестве ИИ-агента. Основные характеристики включают:

  • Производительность уровня GPT-5:
    • Общие задачи: Модель успешно справляется с рядом стандартных задач, демонстрируя выдающиеся результаты.
    • Cложные сценарии: V3.2-Speciale показывает способности к рассуждению на уровне Gemini 3 Pro.
  • Инновационные подходы:
    • Дообучение с подкреплением: Модели прошли масштабное дообучение на специально подготовленных сложных задачах.
    • Sparse Attention (DSA): Новый метод позволяет выделять наиболее важные токены для обработки.

Доступность и рынок ИИ

DeepSeek-V3.2 уже доступна через приложение и веб-сайт компании, а доступ к V3.2-Speciale осуществляется только через API для профессиональных пользователей.

  • Aнализ рынка:
    • Cкачивания новых моделей: Согласно исследованию MIT и Hugging Face, доля скачиваний китайских открытых моделей выросла до 17% по состоянию на август этого года.
    • Bыбор на стороне производительности: Китайские модели привлекают внимание за счёт быстрого обновления и эффективной работы на менее мощном оборудовании.
  • Pезультаты развития ИИ в Китае:

    Модели DeepSeek продолжают усиливать позиции Китая в глобальной гонке за лидерство в области искусственного интеллекта.

    Новые достижения DeepSeek являются важным шагом к укреплению позиций Китая в сфере высоких технологий.

Вам может быть интересно:

1
menu
menu