MiroThinker 1.5 entrega desempenho de trilhões com modelo de 30B
TL;DR
O MiroThinker 1.5, modelo da MiroMind com 30 bilhões de parâmetros, promete oferecer capacidades de pesquisa avançadas a um custo mais baixo do que modelos maiores.
O que é o MiroThinker 1.5?
No âmbito da inteligência artificial, a MiroMind lançou o MiroThinker 1.5, um modelo de apenas 30 bilhões de parâmetros que promete oferecer capacidades de pesquisa avançadas, comparáveis a modelos com trilhões de parâmetros, a um custo significativamente mais baixo. Esta inovação busca atender a uma demanda crescente por agentes de IA econômicos e eficientes.
Como o MiroThinker 1.5 se destaca?
O modelo se diferencia por seus capacidades de raciocínio que superam modelos como Kimi K2 com 1 trilhão de parâmetros, demonstrando uma redução significativa nos custos de inferência. Enquanto o Kimi K2 custa significativamente mais em chamadas de API, o MiroThinker 1.5 oferece inferência a apenas $0.07 por chamada.
Redução do risco de alucinações
Um dos grandes desafios no uso de modelos de IA é o fenômeno das alucinações, onde a IA fornece respostas incorretas com confiança. O MiroThinker 1.5 mitiga esse risco através do que é chamado de modo cientista, que envolve um ciclo de verificação e investigação. Isso permite que o modelo proponha hipóteses e busque evidências externas antes de chegar a conclusões.
Desempenho em benchmarks
O MiroThinker 1.5 se saiu bem em um benchmark denominado BrowseComp-ZH, superando seu competidor de 1 trilhão de parâmetros ao obter uma pontuação de 69.8. Este desempenho notável reflete a eficiência do modelo em tarefas de pesquisa em web.
Uso de ferramentas estendido
Com a capacidade de realizar até 400 chamadas de ferramentas por sessão e suportar um contexto de 256.000 tokens, o MiroThinker 1.5 se posiciona para execução de tarefas complexas. Essa funcionalidade permite a realização de fluxos de trabalho detalhados, como a coleta e síntese de informações.
Inovação no treinamento
Um outro detalhe inovador do MiroThinker 1.5 é seu Sandbox de Treinamento Sensível ao Tempo, que cria condições de treinamento mais realistas. O modelo só interage com dados disponíveis até um certo ponto no tempo, evitando que informações futuras afetem seu raciocínio.
Considerações práticas para a implementação
Para equipes de TI, o MiroThinker requer uma quantidade significativa de memória GPU, e ainda assim, garante compatibilidade. O modelo pode ser integrado facilmente a servidores vLLM com pontos de API compatíveis com o OpenAI.
Perspectivas para o futuro da IA
A chegada do MiroThinker 1.5 ressalta uma mudança no foco da indústria em direção a um entendimento mais interativo da IA, ao invés de apenas aumentar o número de parâmetros. A MiroMind aposta que a eficiência em interações de ferramentas pode ser mais vantajosa para aplicações práticas do que a mera escalabilidade por tamanho de modelo. Essa abordagem pode revolucionar como as empresas utilizam a IA, refugiando-se de custos elevados e complexidades.
Conteudo selecionado e editado com assistencia de IA. Fontes originais referenciadas acima.


