MiroThinker 1.5 offre des performances de trillions avec un modèle de 30B
TL;DR
Dans le domaine de l'intelligence artificielle, MiroMind a lancé MiroThinker 1.5, un modèle de seulement 30 milliards de paramètres qui promet des capacités de recherche avancées, comparables à celles des modèles de trillions de paramètres, à un coût nettement inférieur.
Qu'est-ce que MiroThinker 1.5 ?
Dans le domaine de l'intelligence artificielle, MiroMind a lancé le MiroThinker 1.5, un modèle de seulement 30 milliards de paramètres qui promet d'offrir des capacités de recherche avancées, comparables à celles des modèles de trillions de paramètres, à un coût nettement inférieur. Cette innovation vise à répondre à une demande croissante pour des agents d'IA économiques et efficaces.
Comment MiroThinker 1.5 se distingue-t-il ?
Le modèle se distingue par ses **capacités de raisonnement** qui surpassent des modèles tels que Kimi K2 avec 1 trillion de paramètres, montrant une réduction significative des coûts d'inférence. Alors que Kimi K2 coûte beaucoup plus cher par appel API, MiroThinker 1.5 offre l'inférence à seulement 0,07 $ par appel.
Réduction du risque d'hallucinations
Un des grands défis de l'utilisation des modèles d'IA est le phénomène des **hallucinations**, où l'IA fournit des réponses incorrectes avec confiance. MiroThinker 1.5 atténue ce risque grâce à ce qui est appelé le **mode scientifique**, qui implique un cycle de vérification et d'investigation. Cela permet au modèle de proposer des hypothèses et de rechercher des preuves externes avant d'arriver à des conclusions.
Performance sur benchmarks
MiroThinker 1.5 a bien performé sur un benchmark appelé **BrowseComp-ZH**, surpassant son concurrent de 1 trillion de paramètres en obtenant un score de 69,8. Cette performance remarquable reflète l'efficacité du modèle dans des tâches de recherche sur le web.
Utilisation de l'outil étendue
Avec la capacité d'effectuer jusqu'à **400 appels d'outils** par session et de supporter un contexte de 256 000 tokens, MiroThinker 1.5 se positionne pour l'exécution de tâches complexes. Cette fonctionnalité permet de réaliser des flux de travail détaillés, comme la collecte et la synthèse d'informations.
Innovation dans l'entraînement
Un autre détail innovant de MiroThinker 1.5 est son **Sandbox de formation sensible au temps**, qui crée des conditions d'entraînement plus réalistes. Le modèle n'interagit avec les données disponibles que jusqu'à un certain moment dans le temps, évitant que des informations futures n'affectent son raisonnement.
Considérations pratiques pour la mise en œuvre
Pour les équipes informatiques, MiroThinker nécessite une quantité significative de mémoire GPU, et malgré cela, il assure la compatibilité. Le modèle peut être intégré facilement à des serveurs vLLM avec des points d'API compatibles avec OpenAI.
Perspectives pour l'avenir de l'IA
L'arrivée de MiroThinker 1.5 souligne un changement de focalisation de l'industrie vers une compréhension plus interactive de l'IA, plutôt que de simplement augmenter le nombre de paramètres. MiroMind parie que l'efficacité dans les interactions d'outils peut être plus avantageuse pour des applications pratiques que la simple évolutivité par taille de modèle. Cette approche pourrait révolutionner la manière dont les entreprises utilisent l'IA, les protégeant des coûts élevés et des complexités.
Contenu selectionne et edite avec assistance IA. Sources originales referencees ci-dessus.


