
AWS Lance S3 Vectors avec Économie de Coûts de 90%
TL;DR
Amazon S3 Vectors permet le stockage natif de vecteurs dans le service S3, économisant jusqu'à 90% par rapport aux bases de données vectorielles spécialisées.
Amazon S3 Vectors Offre un Stockage de Vecteurs
Amazon Web Services (AWS) a lancé le Amazon S3 Vectors, une nouvelle fonctionnalité qui permet le stockage natif de vecteurs, tels que des représentations numériques de données, directement dans le service de stockage d'objets S3. Cette nouveauté promet aux organisations d'économiser jusqu'à 90 % sur les coûts par rapport à des solutions de bases de données vectorielles spécialisées.
Le service, qui était en phase de test depuis juillet, est maintenant disponible pour le public, permettant le stockage de jusqu'à 2 milliards de vecteurs dans un seul index et jusqu'à 20 trillions de vecteurs par bucket de stockage S3. Selon AWS, plus de 250 000 index de vecteurs ont été créés et plus de 40 milliards de vecteurs ont été ingérés depuis le début de la phase de test.
S3 Vectors : Complément ou Concurrent ?
Le lancement a suscité des débats sur la fonction de S3 Vectors par rapport aux bases de données vectorielles dédiées. AWS considère S3 Vectors comme un complément à ces solutions et non comme un substitut. Mai-Lan Tomsen Bukovec, VP technologie chez AWS, a déclaré que le choix entre S3 Vectors et des bases de données vectorielles spécialisées dépend des besoins de latence de l'application.
Pour des opérations nécessitant des temps de réponse ultra-rapides, des bases de données comme Amazon OpenSearch sont recommandées. En revanche, pour des tâches comme la création d'une couche sémantique ou l'extension de la mémoire des agents avec plus de contexte, S3 Vectors peut être plus approprié.
Demande et Développement du Service
Après des retours positifs de la phase de test, AWS a amélioré S3 Vectors en fonction des besoins des clients. La latence des requêtes est maintenant d'environ 100 millisecondes pour les requêtes fréquentes et inférieure à une seconde pour les requêtes peu fréquentes.
Les cas d'utilisation en croissance incluent la recherche hybride et l'extension de la mémoire des agents. Un client, March Networks, utilise S3 Vectors pour l'intelligence vidéo et photo, soulignant les économies que cette solution offre en stockant des milliards d'embeddings.
Concurrence avec les Bases de Données Vectorielles
Les fournisseurs de bases de données vectorielles, comme Pinecone et Weaviate, soulignent les lacunes de performance entre leurs solutions et l'approche de stockage d'AWS. Le VP Produit de Pinecone, Jeff Zhu, mentionne que la société ne considère pas S3 Vectors comme une concurrence directe, soulignant que des solutions spécialisées continuent d'avoir des avantages dans des cas d'utilisation nécessitant un rendement optimisé.
Perspectives pour l'Avenir des Services de Stockage
L'analyse de l'impact de S3 Vectors est divergente. Certains estiment que l'intégration de vecteurs dans le stockage pourrait commoditiser le marché, tandis que d'autres, comme Holger Mueller de Constellation Research, affirment que les fournisseurs de bases de données vectorielles doivent s'adapter pour rester compétitifs. Même avec la croissance prévue d'AWS, les bases de données vectorielles restent essentielles pour des cas nécessitant des performances élevées.
Implications pour les Entreprises
Les entreprises doivent décider comment adopter le stockage vectoriel dans leurs charges de travail d'IA. S3 Vectors est indiqué pour des applications tolérantes à des latences plus élevées, comme la recherche sémantique et l'analyse par lots, tandis que les bases de données vectorielles spécialisées sont recommandées pour des applications critiques en termes de temps. L'architecture hybride pourrait devenir une solution courante où différents types de stockage sont utilisés selon les besoins.
La clé pour les entreprises sera de déterminer comment optimiser leur stockage vectoriel en fonction des exigences de performance, en équilibrant coût et efficacité dans l'exploitation.
Contenu selectionne et edite avec assistance IA. Sources originales referencees ci-dessus.


