
GLM-5 de z.ai Réduit Son Taux d'Hallucination et Introduit la Technique RL
TL;DR
La startup chinoise z.ai a lancé son dernier modèle de langage, GLM-5, qui réduit les échecs d'information tout en offrant des fonctionnalités de génération de documents sophistiquées.
GLM-5 de z.ai présente des avancées significatives dans le modèle d'IA
La z.ai, une startup chinoise d'intelligence artificielle, a lancé son dernier modèle de langage, le GLM-5, qui se concentre sur la réduction des échecs dans la génération d'informations. Ce modèle open source, enregistré sous la licence MIT, est spécialement destiné aux usages commerciaux et a atteint un taux d'hallucination sans précédent de -1 dans le Indice d'intelligence de l'analyse artificielle v4.0.
Avec une amélioration de 35 points par rapport au GLM-4.5, le GLM-5 se distingue par sa capacité à reconnaître les situations où il doit s'abstenir de générer des informations inexactes. Cette approche se traduit par une plus grande fiabilité des connaissances, surpassant des concurrents comme Google, OpenAI et Anthropic.
De plus, le GLM-5 dispose de fonctionnalités natives en "Mode Agent", permettant l'élaboration directe de documents professionnels à partir de commandes ou de matériaux d'origine, générant des fichiers aux formats .docx, .pdf et .xlsx.
Modèle accessible pour le marché commercial
Avec un coût d'environ 0,80 $ pour un million de tokens d'entrée et 2,56 $ pour un million de tokens de sortie, le GLM-5 se positionne comme une option à faible coût par rapport à des modèles propriétaires, comme Claude Opus 4.6, qui coûte environ six fois plus.
Avancées technologiques et architecture du GLM-5
Le GLM-5 représente une avancée significative dans son architecture, passant de 355 milliards de paramètres du GLM-4.5 à 744 milliards de paramètres. Le modèle utilise une architecture de mélange d'experts (MoE), activant 40 milliards de paramètres par token et permettant le traitement d'un volume de données pré-entraînées de 28,5 trillions de tokens.
La z.ai a développé la technique du "slime" comme une infrastructure d'apprentissage par renforcement (RL) pour résoudre les inefficacités d'entraînement à grande échelle. Cette approche innovante permet la génération indépendante de trajectoires, améliorant l'itération pour des tâches complexes.
Le modèle inclut des optimisations telles que l'Activation de Rollings Partiels (APRIL), visant à réduire le temps normalement consommé dans l'entraînement de RL.
Capacités pratiques du GLM-5
En se positionnant comme un outil de bureau pour l'ère de l'intelligence artificielle générale (AGI), le GLM-5 est conçu pour générer des documents prêts à l'emploi, plutôt que de simples extraits de texte. Cette fonctionnalité permet de décomposer des objectifs de haut niveau en sous-tâches actionnables, optimisant le travail pour les organisations cherchant l'autonomie.
Performance supérieure par rapport aux modèles concurrents
Le GLM-5 est considéré comme le modèle open source le plus puissant actuellement, surpassant des concurrents chinois comme le Kimi K2.5. Le modèle a atteint un score de 77,8 sur le SWE-bench Vérifié, dépassant le Gemini 3 Pro (76,2) et se rapprochant du Claude Opus 4.6 (80,9).
Les entreprises de divers secteurs devraient envisager l'adoption du GLM-5, qui offre un niveau de flexibilité et d'accès à de l'intelligence de pointe, sans les restrictions imposées par les concurrents à code fermé. La possibilité d'hébergement de l'intelligence pourrait représenter un avantage stratégique décisif.
Implications et considérations de sécurité
Cependant, l'échelle du GLM-5, avec 744 milliards de paramètres, nécessite une infrastructure robuste, ce qui peut représenter un défi pour les petites entreprises. De plus, les préoccupations concernant l'origine du modèle, développé par un laboratoire en Chine, doivent être évaluées, surtout dans les secteurs régulés.
L'introduction d'agents autonomes soulève également des questions de gouvernance, avec des risques accrus d'erreurs à mesure que les IA effectuent des tâches sans supervision humaine. Par conséquent, il est essentiel que les organisations établissent des barrières de qualité appropriées avant l'implémentation du GLM-5.
Enfin, le GLM-5 représente non seulement une option économique, mais également un pari sur l'avenir, où les IA les plus précieuses seront celles capables d'exécuter des tâches de manière autonome, augmentant l'efficacité des processus organisationnels.
Contenu selectionne et edite avec assistance IA. Sources originales referencees ci-dessus.


