Cadence a devancé le recommandeur là où les paniers se renouvellent
Une étude CASE publiée par Walmart révèle que la cadence calendaire représente environ quarante pour cent de la performance du prochain panier — un discret désaveu des recommandeurs fondés sur l'ordre des visites que la plupart des enseignes de mode utilisent encore pour la beauté, les basiques et les réapprovisionnements.
Sir John Crabstone
Le chiffre le plus utile de la personnalisation retail ce mois-ci est 0,2382. C’est le Precision@5 du modèle CASE de Walmart sur Instacart, une fois son réseau de convolutions temporelles retiré ; le modèle complet atteint 0,3989. La seule composante qui capte quand un utilisateur achète représente environ quarante pour cent du poids discriminant. La plupart des recommandeurs des enseignes de mode n’ont pas cette composante.
CASE (Cadence-Aware Set Encoding) avance que pour les catégories de réapprovisionnement, le temps calendaire est le signal dominant — et que la majorité des recommandeurs en production encodent la mauvaise chose. Le propos du papier est limpide. Les architectures fondées sur l’ordre des visites — les transformers de type BERT devenus la norme du secteur — traitent des paniers aux jours 1, 8 et 36 de façon identique à des paniers aux jours 1, 2 et 3. Elles connaissent l’ordre ; elles ne voient pas l’écart. Or c’est l’écart qui compte. Un approvisionnement hebdomadaire en lait et un réapprovisionnement trimestriel en parfum laissent la même trace dans un modèle fondé sur les visites ; seul le calendrier les distingue.
Walmart Global Tech a déployé CASE contre sa stack de production et a rapporté des gains de 8,63 % sur le Precision@5, de 9,90 % sur le Recall@5, et de 10,46 % sur le NDCG@5, sur une base d’utilisateurs se comptant en dizaines de millions. Ces chiffres mesurent ce qu’un retailer en production payait pour un modèle incapable de lire un calendrier ; chaque enseigne qui tourne encore sur un recommandeur fondé sur l’ordre des visites paie cette facture aujourd’hui.
L’étude porte sur l’alimentaire, mais le raisonnement s’applique à n’importe quelle verticale avec des produits qui s’épuisent. Cela couvre une part de la garde-robe plus large que les acheteurs ne l’admettent. Mascara, nettoyants, recharges de parfum, collants, basiques, multipacks de chaussettes — autant de catégories de réapprovisionnement aux cadences aussi stables que le lait et le détergent de Walmart. Une cliente qui achète un mascara Charlotte Tilbury toutes les neuf semaines génère le signal d’intention d’achat le plus fort qui soit. Le modèle de filtrage collaboratif lui sert un nouveau rouge à lèvres parce qu’un profil aux embeddings similaires en a acheté un récemment.
L’industrie de la personnalisation a passé dix ans à vendre aux enseignes de mode des modèles de cross-sell et de découverte. Le cross-sell, c’est la partie du panier où la donnée est la plus rare et les marges les plus faibles. Le réapprovisionnement fonctionne à l’inverse : historique dense, cadence lisible, conversion qui ne coûte presque rien à obtenir. La cliente en réapprovisionnement est aussi celle dont le coût d’acquisition est le plus bas ; elle achète déjà, elle est déjà sur une horloge. Les chiffres de progression de Walmart sont ce que ce décalage coûte dans les catégories que la plupart des enseignes jugent indignes de l’analytique.
Le désaveu contenu dans le papier CASE est précis. La composante dominante de la performance du prochain panier n’est pas l’embedding produit, ni l’attention croisée entre items, ni la tour utilisateur. C’est le calendrier. Retirer les convolutions temporelles a détruit davantage que retirer n’importe quel autre module. Le panier a une horloge, et la plupart des retailers font tourner des modèles incapables de lire l’heure.
Les recommandeurs de la mode ont été construits pour une garde-robe qui n’existe pas.
La cliente qui revient le plus souvent est celle que le modèle de découverte connaît le moins. La marge dans son panier n’est pas un problème de recherche ; elle figure sur les tickets de caisse depuis des années. La question est de savoir quelle enseigne les lira en premier.