
GLM-5 da z.ai Reduz Sua Taxa de Alucinação e Introduz Técnica RL
TL;DR
A z.ai, uma startup chinesa de inteligência artificial, lançou seu mais recente modelo de linguagem grande, o GLM-5, com foco em reduzir falhas na geração de informações.
GLM-5 da z.ai apresenta avanços significativos em modelo de IA
A z.ai, uma startup chinesa de inteligência artificial, lançou seu mais recente modelo de linguagem grande, o GLM-5, com foco em reduzir falhas na geração de informações. O modelo open source, registrado sob a licença MIT, é especialmente destinado a usos empresariais e alcançou uma taxa de alucinação sem precedentes de -1 no Índice de Inteligência da Análise Artificial v4.0.
Com uma melhoria de 35 pontos em relação ao GLM-4.5, o GLM-5 se destaca por sua capacidade de reconhecer situações em que deve se abster de gerar informações imprecisas. Essa abordagem resulta em maior confiabilidade do conhecimento, superando concorrentes como Google, OpenAI e Anthropic.
Além disso, o GLM-5 possui funcionalidades nativas em "Modo Agente", permitindo a elaboração direta de documentos profissionais a partir de comandos ou materiais de origem, gerando arquivos nos formatos .docx, .pdf e .xlsx.
Modelo acessível para o mercado empresarial
Com um custo de cerca de $0,80 por um milhão de tokens de entrada e $2,56 por um milhão de tokens de saída, o GLM-5 se posiciona como uma opção de baixo custo em comparação a modelos proprietários, como o Claude Opus 4.6, que custa cerca de seis vezes mais.
Avanços tecnológicos e arquitetura do GLM-5
O GLM-5 representa um avanço significativo em sua arquitetura, aumentando de 355 bilhões de parâmetros do GLM-4.5 para 744 bilhões de parâmetros. O modelo utiliza uma arquitetura de Mistura de Especialistas (MoE), ativando 40 bilhões de parâmetros por token e permitindo o processamento de um volume de dados pré-treinados de 28,5 trilhões de tokens.
A z.ai desenvolveu a técnica de "slime" como uma infraestrutura de aprendizado por reforço (RL) para resolver ineficiências de treinamento em grande escala. Essa abordagem inovadora permite a geração independente de trajetórias, melhorando a iteração para tarefas complexas.
O modelo inclui otimizações como Ativação de Rolagens Parciais (APRIL), que visam reduzir o tempo normalmente consumido em treinamento de RL.
Capacidades práticas do GLM-5
Ao se posicionar como uma ferramenta de escritório para a era de Inteligência Artificial Geral (AGI), o GLM-5 é projetado para gerar documentos prontos para uso, em vez de apenas trechos de texto. Essa funcionalidade permite decompor metas de alto nível em subtarefas acionáveis, otimizando o trabalho para organizações que buscam autonomia.
Desempenho superior em comparação a modelos concorrentes
O GLM-5 é considerado o modelo open source mais potente atualmente, superando concorrentes chineses, como o Kimi K2.5. O modelo alcançou um score de 77,8 no SWE-bench Verified, superando o Gemini 3 Pro (76,2) e ficando próximo do Claude Opus 4.6 (80,9).
Empresas de diversos setores devem considerar a adoção do GLM-5, que oferece um nível de flexibilidade e acesso a inteligência de ponta, sem as restrições impostas por concorrentes de código fechado. A possibilidade de hospedagem própria da inteligência pode ser uma vantagem estratégica decisiva.
Implicações e considerações de segurança
Entretanto, a escala do GLM-5, com 744 bilhões de parâmetros, exige uma infraestrutura robusta, o que pode representar um desafio para empresas menores. Além disso, as preocupações sobre a origem do modelo, desenvolvido por um laboratório na China, devem ser avaliadas, especialmente em setores regulados.
A introdução de agentes autônomos também levanta questões de governança, com riscos ampliados de erros à medida que as IAs realizam tarefas sem supervisão humana. Portanto, é fundamental que as organizações estabeleçam barreiras de qualidade adequadas antes da implementação do GLM-5.
Finalmente, o GLM-5 representa não apenas uma opção econômica, mas também uma aposta no futuro, onde as IAs mais valiosas serão aquelas que podem executar tarefas de forma independente, aumentando a eficiência dos processos organizacionais.
Conteudo selecionado e editado com assistencia de IA. Fontes originais referenciadas acima.


