Alibaba представляет Qwen 3: семейство «гибридных» моделей ИИ с улучшенными возможностями рассуждений
Alibaba анонсировала Qwen 3, семейство моделей ИИ, которые, по утверждениям компании, превосходят лучшие модели от Google и OpenAI в некоторых аспектах.

Китайская технологическая компания Alibaba представила Qwen 3 — семейство моделей искусственного интеллекта, которые, как утверждается, не только соответствуют, но и в некоторых случаях превосходят лучшие модели от Google и OpenAI. Большинство из этих моделей уже доступны или скоро станут доступны для загрузки под «открытой» лицензией на платформах Hugging Face и GitHub. Размеры моделей варьируются от 0,6 миллиарда до 235 миллиардов параметров, что примерно соответствует их способности решать задачи.
Qwen 3 позиционируется как «гибридные» модели, способные как быстро отвечать на простые запросы, так и «рассуждать» над сложными проблемами, что повышает их точность, но увеличивает задержку. Модели поддерживают 119 языков и были обучены на наборе данных объёмом почти 36 триллионов токенов, включая учебники, пары вопрос-ответ, фрагменты кода и данные, сгенерированные ИИ.
Согласно внутренним тестам Alibaba, крупнейшая модель Qwen-3-235B-A22B превосходит модели OpenAI и Google на некоторых тестах, включая платформу программирования Codeforces и математический бенчмарк AIME. Однако эта модель пока не доступна для широкой публики. Самая большая общедоступная модель, Qwen3-32B, демонстрирует конкурентоспособные результаты по сравнению с другими открытыми и проприетарными моделями ИИ.
Эксперты отмечают, что такие модели, как Qwen 3, свидетельствуют о том, что открытые модели могут идти в ногу с закрытыми системами, несмотря на ограничения на экспорт чипов в Китай. Это подчёркивает растущую конкуренцию в области искусственного интеллекта и стремление компаний развивать собственные технологии.