Zhipu AI (Z.ai), souvent surnommé « l’OpenAI chinois », a lancé GLM-4.7 le 22 décembre 2025. Ce modèle open-source rivalise avec les leaders occidentaux tout en coûtant une fraction du prix.
Spécifications techniques
- Architecture : Mixture-of-Experts (MoE) avec 355 milliards de paramètres
- Contexte : 200 000 tokens en entrée, 128 000 tokens en sortie maximum
- Vitesse : 55 tokens par seconde
Innovation : Preserved Thinking
GLM-4.7 introduit le « Preserved Thinking » : la capacité de maintenir des chaînes de raisonnement à travers plusieurs échanges au lieu de réinitialiser. Cela apporte une cohérence supérieure dans les tâches longues et multi-étapes.
Benchmarks impressionnants
| Benchmark | Score | Note |
|---|---|---|
| LiveCodeBench | 84.9% | Devant Claude Sonnet 4.5 |
| SWE-bench Verified | 73.8% | Meilleur modèle open-source |
| AIME 2025 (maths) | 95.7% | – |
| Humanity’s Last Exam | 42.8% | +41% vs prédécesseur |
GLM-4.7-Flash pour le local
Lancé le 19 janvier 2026, GLM-4.7-Flash est optimisé pour tourner localement :
- 30 milliards de paramètres (3 milliards actifs par token)
- Fonctionne sur RTX 3090 et Apple Silicon
- 82 tokens/seconde sur M4 Max
Tarification
3$/mois via la plateforme Z.ai ou OpenRouter. Gratuit si vous le faites tourner localement via Hugging Face.
Conclusion
GLM-4.7 prouve que la compétition dans l’IA ne vient plus uniquement des États-Unis. Avec des performances de pointe et un prix défiant toute concurrence, c’est une option sérieuse pour les développeurs.
