Research & Trends

Die Memory-Schicht ist Open-Source. Händler speichern Kassenbons.

Ein grapherweitertes Gedächtnissystem für KI-Agenten, im März 2026 auf arXiv veröffentlicht, verbessert die langfristige Gesprächserinnerung um 4,2 Punkte gegenüber einer optimierten RAG-Baseline im LoCoMo-Benchmark. Die Memory-Schicht, auf die Retail-Personalisierungsstacks gewartet haben, ist da – doch die darunterliegende Kundendatenbank ist auf Transaktionen ausgelegt, nicht auf Episoden.

A chambered nautilus shell cross-sectioned to reveal labeled memory fragments in each chamber, next to a receipt printer spitting a long curling tape of SKU codes.

Neritus Vale

Die Infrastruktur für persistentes Agentengedächtnis ist früher da als die Kundendatenbank, die sie speisen soll. Ein grapherweitertes System namens GAAMA, im März 2026 auf arXiv veröffentlicht, verbessert die langfristige Gesprächserinnerung im LoCoMo-Benchmark um 4,2 Punkte gegenüber einer optimierten RAG-Baseline – dem stärksten Vergleichswert in der Evaluation. Dieser Vorsprung hält über Multihop-, Temporal- und Commonsense-Abfragen hinweg, also genau jene Kategorien, bei denen retrieval-augmentierte Stacks bei Kunden mit komplexen Fragen historisch versagt haben. Bei einfachen Einzelfragen, die den Großteil des Benchmarks ausmachen, ist GAMAAs Vorsprung gegenüber RAG hingegen vernachlässigbar. Retail-Personalisierungsstacks wurden gebaut, um einen Kunden anhand einer Loyalty-ID zu erkennen und daraus eine Next-Best-Action gegen eine Transaktionsdatei abzuleiten. Nichts in dieser Datei hat die Form einer Episode, einer Reflexion oder eines Konzept-Knotens.

Das Design des Systems zeigt, was der Datenbank des Händlers fehlt. GAAMA speichert rohe Gesprächsverläufe gemeinsam mit LLM-destillierten Aussagen und sitzungsübergreifenden Reflexionen, wobei Konzeptknoten wie pottery_hobby oder camping_trip Traversierungspfade zwischen Themen schaffen. Der Abruf kombiniert kantengewichtetes Personalized PageRank mit Kosinus-Ähnlichkeit. Eine Reparaturschicht namens GRAFT fügt fehlende Fakten ein, wenn die Abrufzuverlässigkeit unter einen Schwellenwert fällt. Der Wert von 79,1 Prozent auf LoCoMo-10 ist eine Benchmark-Zahl, keine Deployment-Zahl; der eigentliche Anspruch lautet, dass Agenten bedeutungsvollen Zustand über Sitzungen hinweg halten können, ohne in die Mega-Hubs abzugleiten, die Wissensgraphen ansammeln, wenn sie sich um Entitäten zentrieren. Der Code ist frei verfügbar.

Die Kundendatenbank eines Händlers speichert Buchungszeilen, keine Episoden. CDPs vereinen Point-of-Sale-Transaktionen, Loyalty-Interaktionen, E-Commerce-Klicks und App-Aktivitäten zu einem 360-Grad-Profil, und Identity Resolution steigert erkannte Kundeninteraktionen laut CDP.coms Retail-Briefing um 30 bis 50 Prozent. Dieser Gewinn betrifft die Attribution, nicht das, was der Agent über den soeben identifizierten Kunden erinnern kann. Anonyme Sitzungen starten weiterhin ohne jede Vorkenntnis. Selbst eingeloggte Kunden hinterlassen einen transaktionalen Schatten, über den kein LLM reflektieren kann, ohne diese Zeilen zunächst in etwas narrativ Kohärentes zu übersetzen. Diese Übersetzung ist nicht kostenlos, und die meisten Händler haben sie bislang nicht vorgenommen.

Der Engpass hat sich vom Modell zum Schema verlagert.

Ein naheliegendes Gegenargument: Persistentes Agentengedächtnis ist für den Handel irrelevant, solange die Interaktionsfläche nicht konversational ist – und der Großteil des Handels läuft nach wie vor über eine Suchleiste und einen Checkout-Button. Dieses Gegenargument hat in seiner ehrlichen Fassung seinen Wert. GAAMA lernt aus Dialogen, und ein Kunde, der stillschweigend ein Produkt in den Warenkorb legt, hinterlässt keine erhaltenswerte Episode. Die These scheitert nur, wenn agentischer Handel ins Stocken gerät – wenn chatgestützte Käufe ein Randphänomen bleiben und Sprachschnittstellen nie die Küche verlassen. Amazons jüngster Beitritt zum Universal Commerce Protocol und der TikTok-Shop-Abschluss über Kommentarfäden, den wir diese Woche dokumentiert haben, deuten in die entgegengesetzte Richtung. Händler, deren Loyalty-Schemas keine Episoden enthalten, werden an der konversationalen Oberfläche mit Agenten ankommen, die sich an nichts erinnern.

Die CDP-Branche wird sich von Identity Resolution hin zu Episode Persistence weiterentwickeln müssen, denn die Identifikation war der einfachere Teil. Der schwierigere Teil besteht darin, festzuhalten, warum die Kundin beim letzten Besuch die Fragen gestellt hat, die sie gestellt hat. Dies in etwas umzuwandeln, in das ein Agent ohne Rückfragen wieder einsteigen kann, ist der Ausgangspunkt der Schema-Arbeit. Eine Episode in diesem Sinne ist kein Transaktionsdatensatz und kein Klickpfad, sondern eine Aufzeichnung von Absicht: eine Suchanfrage mit dem dazugehörigen sprachlichen Kontext, ein per Chat übermitteltes Styling-Briefing, ein zurückgesandter Artikel mit der angegebenen Begründung. Vertex AI Memory Bank, bei Google inzwischen in der Public Preview, ist ein produktisierter Hinweis; mem0.ai und ähnliche Anbieter haben begonnen, vergleichbare Infrastruktur auszuliefern. Welcher Memory-Anbieter Zugriff auf den Kundendatensatz erhält und wie viel episodischer Inhalt dieser Datensatz dem darauf zugreifenden Agenten liefern kann, wird die nächste Runde der CDP-Beschaffung entscheiden.

Der wichtigste Technologieeinkauf im Handel im Jahr 2026 wird kein Personalisierungs-Ranker sein. Händler, die 2026 als Personalisierungsjahr lesen, werden Ranker-Verbesserungen kaufen, unabhängig davon. Die schwierigere Lesart lautet, dass 2026 ein Gedächtnisjahr ist – eines, in dem die entscheidenden Investitionen in Episode Storage und in das Schema fließen, das bestimmt, was als Episode zählt. Der Preis für diese Verwechslung wird beim nächsten Kundenkontakt über einen Agenten fällig – wenn der Agent nichts zu erwidern hat.