
Alibaba lance Qwen 3.5 avec 397 milliards de paramètres
TL;DR
Alibaba a lancé le modèle d'IA Qwen 3.5 avec 397 milliards de paramètres. Il est plus économique et efficace que ses prédécesseurs.
Alibaba a annoncé le lancement du modèle d'intelligence artificielle Qwen 3.5, qui possède 397 milliards de paramètres, mais active seulement 17 milliards par token, le rendant plus économique et efficace. Ce modèle surpasse le précédent Qwen3-Max, qui comptait plus d'un trillion de paramètres, et a été conçu pour coïncider avec le Nouvel An Lunaire.
Le Qwen 3.5 est une évolution du modèle expérimental Qwen3-Next, présentant une architecture avec 512 spécialistes qui améliore considérablement la latence d'inférence. Avec une longueur de contexte de 256 000, le Qwen 3.5 décode jusqu'à 19 fois plus rapidement que le Qwen3-Max et 7,2 fois plus vite que le Qwen3 235B-A22B.
Économiquement, le nouveau modèle est 60 % moins cher à exploiter et peut gérer des charges de travail concurrentes huit fois plus importantes. Comparé au modèle Gemini 3 Pro de Google, le Qwen 3.5 coûte environ 1/18 du prix. Il intègre également une couverture multilingue étendue pour 201 langues, ce qui réduit encore les coûts d'inférence.
Le Qwen 3.5 est nativement multimodal, entraîné sur du texte, des images et de la vidéo, surpassant les modèles qui ajoutent des composants visuels par la suite. Pour les entreprises, la version ouverte du Qwen 3.5 est disponible sous licence Apache 2.0, permettant un usage commercial sans restrictions.
En conclusion, le Qwen 3.5 représente une option viable pour les entreprises cherchant des modèles d'IA de pointe, avec des capacités multimodales et une fenêtre de contexte de 1 million de tokens, sans besoin d'APIs propriétaires.
Contenu selectionne et edite avec assistance IA. Sources originales referencees ci-dessus.


