GLM-4.7 : le modèle IA chinois qui rivalise avec les géants occidentaux pour 3$/mois

Zhipu AI (Z.ai), souvent surnommé « l’OpenAI chinois », a lancé GLM-4.7 le 22 décembre 2025. Ce modèle open-source rivalise avec les leaders occidentaux tout en coûtant une fraction du prix.

Spécifications techniques

Architecture : Mixture-of-Experts (MoE) avec 355 milliards de paramètres
Contexte : 200 000 tokens en entrée, 128 000 tokens en sortie maximum
Vitesse : 55 tokens par seconde

Innovation : Preserved Thinking

GLM-4.7 introduit le « Preserved Thinking » : la capacité de maintenir des chaînes de raisonnement à travers plusieurs échanges au lieu de réinitialiser. Cela apporte une cohérence supérieure dans les tâches longues et multi-étapes.

Benchmarks impressionnants

Benchmark	Score	Note
LiveCodeBench	84.9%	Devant Claude Sonnet 4.5
SWE-bench Verified	73.8%	Meilleur modèle open-source
AIME 2025 (maths)	95.7%	–
Humanity’s Last Exam	42.8%	+41% vs prédécesseur

GLM-4.7-Flash pour le local

Lancé le 19 janvier 2026, GLM-4.7-Flash est optimisé pour tourner localement :

30 milliards de paramètres (3 milliards actifs par token)
Fonctionne sur RTX 3090 et Apple Silicon
82 tokens/seconde sur M4 Max

Tarification

3$/mois via la plateforme Z.ai ou OpenRouter. Gratuit si vous le faites tourner localement via Hugging Face.

Conclusion

GLM-4.7 prouve que la compétition dans l’IA ne vient plus uniquement des États-Unis. Avec des performances de pointe et un prix défiant toute concurrence, c’est une option sérieuse pour les développeurs.

Laisser un commentaireAnnuler la réponse.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.