GLM-4.7 : le modèle IA chinois qui rivalise avec les géants occidentaux pour 3$/mois

Zhipu AI (Z.ai), souvent surnommé « l’OpenAI chinois », a lancé GLM-4.7 le 22 décembre 2025. Ce modèle open-source rivalise avec les leaders occidentaux tout en coûtant une fraction du prix.

Spécifications techniques

  • Architecture : Mixture-of-Experts (MoE) avec 355 milliards de paramètres
  • Contexte : 200 000 tokens en entrée, 128 000 tokens en sortie maximum
  • Vitesse : 55 tokens par seconde

Innovation : Preserved Thinking

GLM-4.7 introduit le « Preserved Thinking » : la capacité de maintenir des chaînes de raisonnement à travers plusieurs échanges au lieu de réinitialiser. Cela apporte une cohérence supérieure dans les tâches longues et multi-étapes.

Benchmarks impressionnants

BenchmarkScoreNote
LiveCodeBench84.9%Devant Claude Sonnet 4.5
SWE-bench Verified73.8%Meilleur modèle open-source
AIME 2025 (maths)95.7%
Humanity’s Last Exam42.8%+41% vs prédécesseur

GLM-4.7-Flash pour le local

Lancé le 19 janvier 2026, GLM-4.7-Flash est optimisé pour tourner localement :

  • 30 milliards de paramètres (3 milliards actifs par token)
  • Fonctionne sur RTX 3090 et Apple Silicon
  • 82 tokens/seconde sur M4 Max

Tarification

3$/mois via la plateforme Z.ai ou OpenRouter. Gratuit si vous le faites tourner localement via Hugging Face.

Conclusion

GLM-4.7 prouve que la compétition dans l’IA ne vient plus uniquement des États-Unis. Avec des performances de pointe et un prix défiant toute concurrence, c’est une option sérieuse pour les développeurs.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.