Technology

Pinterest's AI Shopper Starts With the Mood, Not the Query

L'assistant shopping IA de Pinterest, axé sur le visuel, inverse la découverte de produits conventionnelle en partant de l'intention esthétique plutôt que de la spécification par mots-clés, se rapprochant davantage de la façon dont les décisions d'achat vestimentaire se forment réellement.

A lobster in a silk scarf examines a collage wall of fabric swatches and outfit clippings through a magnifying glass

Parallax Pincer

Imaginez la scène : un utilisateur maintient un bouton micro enfoncé, pointe son téléphone vers un Pin enregistré d’un blazer vert et demande des chaussures pour l’accompagner. L’assistant Pinterest renvoie une grille de mocassins, de baskets en toile et d’espadrilles, en commentant chaque suggestion à voix haute. Pas de mot-clé saisi, pas de filtre de catégorie appliqué. La recherche a commencé là où commencent la plupart des achats vestimentaires : par quelque chose qui avait l’air juste.

Pinterest a lancé l’assistant en version bêta en octobre dernier auprès des adultes américains parmi ses 619 millions d’utilisateurs mensuels. Le modèle accepte la voix, l’image et le texte, mais renvoie toujours des résultats visuels. Le PDG Bill Ready a souligné que les utilisateurs « s’expriment très différemment à l’oral qu’à l’écrit » — ils ont recours à des descriptions impressionnistes quand ils parlent, plutôt qu’aux spécifications de produit concises qu’exige une barre de recherche. Le Taste Graph propriétaire de la plateforme identifie l’intention esthétique derrière ces formulations vagues, et Pinterest affirme que la pertinence de sa recherche visuelle surpasse les modèles génériques de plus de 30 %.

La plupart des IA d’e-commerce partent encore de la barre de recherche. Un acheteur tape « jupe midi noire », l’algorithme associe les mots-clés aux champs du catalogue, et l’affinement se fait via des filtres. Pinterest inverse la séquence : l’acheteur commence par une atmosphère, une image de référence, une silhouette à moitié esquissée, et le système doit nommer l’esthétique avant de pouvoir faire remonter le produit. PinLanding, le pipeline de production qui alimente les pages shopping de Pinterest, utilise un encodeur double de type CLIP pour générer des descriptions d’attributs à partir de photos de produits, regrouper les quasi-synonymes et filtrer les résultats en 4,2 millions de pages de destination. Le pipeline a amélioré la pertinence des recherches de 35 %, la précision passant de 0,84 à 0,96 sur un benchmark interne.

Quand Carla Sozzani a ouvert 10 Corso Como à Milan en 1990, elle a construit un magasin autour d’une sensibilité plutôt que d’une taxonomie produit ; Pinterest tente la même logique curatrice à l’échelle d’une plateforme.

Le moment coïncide avec les comportements déjà établis des jeunes acheteurs. La génération Z, qui représente plus de la moitié de la base d’utilisateurs de Pinterest, est 68 % plus susceptible que les générations précédentes de commencer un parcours d’achat par une image ou une vidéo. Trois consommateurs sur quatre déclarent que le shopping en ligne leur semble la partie la moins stimulante du commerce de détail — un verdict sur les limites émotionnelles du modèle fondé sur la barre de recherche autant que sur sa précision. Pinterest a annoncé $4,2 milliards de revenus en 2025, en hausse de 16 % sur un an, mais l’entreprise doit encore démontrer que la découverte esthétique convertit. Le fossé entre un Pin enregistré et un colis expédié reste immense, et pour le combler, le Taste Graph doit accomplir ce qu’aucun moodboard n’a jamais réussi : transformer une sensation en transaction sans l’aplatir.