B2B-Produktkatalog mit KI automatisieren: Beschreibungen in großem Maßstab

Produktkatalog-Raster auf dem Bildschirm — B2B-Katalogautomatisierung mit KI

Ein B2B-Distributor mit 2.000 aktiven SKUs, der Produktbeschreibungen manuell verfasst, hat gleichzeitig ein Katalog- und ein SEO-Problem. Die meisten Distributoren in dieser Lage haben eines von drei Problemen: keine Beschreibungen (nur nackte Spezifikationen), kopierte Lieferantentexte (Duplicate-Content-Penalty) oder einen 18-monatigen Rückstand unter dem Motto „Das erledigen wir noch.”

KI-Katalogautomatisierung löst dieses Problem zu Kosten und Geschwindigkeit, die das Problem in Tagen — nicht Quartalen — verschwinden lassen. Aber nur wenn die Quelldaten sauber genug sind. Eine schnelle Generierungspipeline mit schmutzigem Input produziert 2.000 falsche Beschreibungen schneller als jeder Mensch.

Dieser Artikel erklärt den Workflow von Anfang bis Ende: Was saubere Daten in der Praxis bedeuten, wie man Prompts für die Massenverarbeitung entwirft, wie mehrsprachige Generierung in EN/FA/DE/SR aussieht und wie man einen Qualitätsprüfungsschritt aufbaut, der Fehler erkennt, ohne dass jemand jede Ausgabe lesen muss.

Das Katalogproblem in Zahlen — Warum 2.000 manuelle Beschreibungen echte Kosten verursachen

Eine gute Produktbeschreibung für einen B2B-Katalog nimmt einem erfahrenen Texter 15–20 Minuten: Datenblatt lesen, relevante käuferbezogene Attribute extrahieren, eine 100–150 Wörter lange Beschreibung schreiben, prüfen, fertig. Bei 20 Minuten pro SKU sind 2.000 SKUs 667 Stunden Schreibaufwand. Bei internen Kosten von 25 € pro Stunde ergibt das 16.700 € — vor dem Lektorat, der Übersetzung oder dem Upload.

Die meisten Distributoren machen diese Rechnung nie explizit auf. Sie kommen schlicht nicht dazu.

Die Kosten enden nicht beim Schreibaufwand. Katalogseiten mit nackten Spezifikationen — Teilenummer, eine Maßtabelle, nichts sonst — sind für Suchmaschinen unsichtbar. Ein Einkäufer, der nach „lebensmittelechte Silikonscheibe 50mm DN50” sucht, findet Ihre Katalogseite nicht, wenn sie nur den Code und eine Spezifikationstabelle enthält. Google hat nichts zum Ranken. Wettbewerber, die Beschreibungen geschrieben haben — auch mittelmäßige — überholen Sie bei Suchanfragen, die eigentlich Ihnen gehören.

Lieferantentext-Kopieren ist noch schlechter. Wenn zwölf Distributoren dieselbe Herstellerbeschreibung verwenden, behandelt Google alle zwölf Seiten als Duplicate Content. Keine davon rankt gut. Die eigene Website des Herstellers — mit originalem Inhalt und Domain-Autorität — gewinnt.

Die tatsächlichen Kosten eines unbeschriebenen Katalogs sind unsichtbar, weil sie als ausbleibender Traffic erscheinen und nicht als Posten in einer GuV. Das macht Aufschub leicht. KI-Generierung beseitigt den Grund für den Aufschub.

Was KI-Katalogenerierung tatsächlich von Ihren Daten verlangt

Der Generierungsworkflow ist unkompliziert. Die Datenvorbereitung ist der Punkt, an dem die meisten Projekte ins Stocken geraten.

KI-Generierung benötigt strukturierten Input pro SKU. Das minimal funktionsfähige Eingabeset besteht aus:

Produktname und Kategorie — was das Produkt ist und wo es in Ihrer Hierarchie steht
Kernspezifikationen — die technischen Attribute, die das Produkt definieren (Abmessungen, Materialien, Zertifizierungen, kompatible Normen)
Anwendungsfall oder Einsatzbereich — wofür es verwendet wird, in welcher Branche oder welchem Prozess
Unterscheidungsmerkmale — alles, was diese SKU von benachbarten unterscheidet (Zertifizierungen, Temperaturbereich, chemische Verträglichkeit)

Was nicht benötigt wird: Lieferantencodes, interne Lager-IDs, Einkaufspreis oder Lieferantennamen. Diese Felder verschlechtern die Ausgabequalität aktiv, indem sie den Prompt mit irrelevanten Tokens überfüllen.

„Sauber genug” bedeutet: einheitliche Feldbezeichnungen über alle SKUs hinweg, keine abgeschnittenen oder beschädigten Werte, keine gemischtsprachigen Felder in derselben Spalte und Anwendungs-/Einsatzbereichsdaten für mindestens die Mehrheit der SKUs vorhanden.

Wenn Ihre Katalogdaten in einem ERP-Export vorliegen, ist vor der Generierung typischerweise ein Bereinigungsdurchgang erforderlich. Häufige Probleme: Spezifikationsfelder, die Einheiten vermischen („500mm / 50cm” in derselben Spalte), Kategoriebeschriftungen, die nicht widerspiegeln, was das Produkt tatsächlich ist, und Anwendungsdaten, die völlig fehlen, weil niemand sie je gepflegt hat. Ein Datenaudit vor der Generierung spart mehr Zeit als er kostet — ein Generierungslauf auf schmutzigem Input produziert Ausgaben, die mehr manuelle Korrekturen erfordern, als sie einsparen.

Bei einem 2.000-SKU-Katalog dauert diese Bereinigung in der Regel 8–15 Stunden konzentrierte Arbeit in einer Tabellenkalkulation, abhängig davon, wie konsistent der ursprüngliche ERP-Export ist.

Der Generierungsworkflow — Prompt-Design, Massenverarbeitung, Ausgabeprüfung

Sobald die Daten sauber sind, hat der Workflow drei Schritte: Prompt-Design, Massenlauf und Ausgabe-Sampling.

Prompt-Design ist der Punkt, an dem Qualität festgelegt wird. Ein schwacher Prompt produziert generische Beschreibungen. Ein gut strukturierter Prompt produziert Beschreibungen, die mit minimalem Bearbeitungsaufwand verwendbar sind. Der Prompt muss festlegen:

Zielgruppe (Einkaufsleiter in einem mittelgroßen Fertigungsunternehmen, kein Endverbraucher)
Ton (sachlich, direkt — keine Marketingsprache)
Länge (80–120 Wörter für Standard-SKUs, 150–200 für komplexe oder hochwertige Artikel)
Erforderliche Elemente (was das Produkt ist, Schlüsselspezifikationen, Hauptanwendung, relevante Normen oder Zertifizierungen)
Was auszuschließen ist (Preisangaben, Lieferzeit, Lieferantenidentität, vergleichende Behauptungen)

Ein funktionsfähiger Prompt für einen Massenlauf sieht so aus:

Schreiben Sie eine Produktbeschreibung für einen B2B-Distributorkatalog. Zielgruppe: Einkaufsleiter in der Fertigungs- oder Baubranche. Ton: sachlich und direkt. Länge: 100–120 Wörter. Enthalten: Produktname, Schlüsselspezifikationen, Hauptanwendung. Keine Preis-, Liefer- oder Produktvergleichsangaben. Produktdaten: [PRODUCT_NAME], [CATEGORY], [SPECS], [APPLICATION].

Massenverarbeitung verwendet ein Skript, das durch Ihre bereinigte Tabellenkalkulation iteriert, die API für jede Zeile aufruft und die Ausgabe zurückschreibt. Für einen 2.000-SKU-Katalog zu typischen API-Tarifen mit der Claude-API belaufen sich die Gesamtgenerierungskosten auf 15–40 € je nach Ausgabelänge und Modellebene. Die Verarbeitungszeit für 2.000 Beschreibungen bei einem Standard-Ratenlimit beträgt 2–4 Stunden ohne Aufsicht. Dies ist der Schritt, der die 667 Stunden manuellen Schreibens ersetzt hat.

Ausgabeprüfung bedeutet nicht, alle 2.000 Beschreibungen zu lesen. Es bedeutet, intelligent zu sampeln und auf systematische Fehler zu prüfen.

Mehrsprachiger Katalog — Was sich zwischen EN-, FA-, DE- und SR-Versionen ändert

Wenn Ihr Vertriebsbetrieb mehrere Märkte bedient — EU-Einkäufer auf Deutsch, serbische Händler, Einkäufer in persischsprachigen Märkten — ist die mehrsprachige Katalogenerierung derselbe Workflow, der pro Sprache erneut ausgeführt wird, mit Anpassungen.

Die relevanten Anpassungen:

Sprachspezifische Prompt-Kalibrierung. Formale deutsche Katalogsprache ist dichter und spezifikationsorientierter als Englisch. Persischer Katalogtext hat andere Registererkonventionen — die Erwartungen der Einkäufer an die Beschreibungsformalität unterscheiden sich. Für Englisch optimierte Prompts produzieren oft unbeholfene Ausgaben, wenn sie einfach an einen anderen Sprachmodell-Endpunkt weitergegeben werden. Jede Sprache profitiert von einem Prompt, der für die Konventionen dieser Sprache geschrieben wurde, nicht von einer Übersetzung des englischen Prompts.

Rechts-nach-links-Rendering. Persische (Farsi-) Beschreibungen erfordern RTL-Feldverarbeitung in jedem System, das den Katalog anzeigt. Den Text zu generieren ist unkompliziert; ihn korrekt in Ihrem ERP, Ihrer Website oder Ihrem PIM-System zu rendern, kann einen separaten Konfigurationsschritt erfordern. Identifizieren Sie dies vor dem Generierungslauf, nicht danach.

Übersetzung vs. Generierung. Für nicht-englische Beschreibungen haben Sie zwei Möglichkeiten: die englische Ausgabe übersetzen oder nativ aus den Quelldaten in der Zielsprache generieren. Native Generierung liefert bessere Ergebnisse für Einkäufer, erfordert aber eine sprachspezifische Qualitätsprüfung. Übersetzung aus dem Englischen ist schneller und günstiger, kann aber unbeholfene Konstruktionen übernehmen. Für hochwertige SKUs oder Märkte, in denen der Katalog ein primärer Verkaufskontaktpunkt ist, ist native Generierung den zusätzlichen Schritt wert. Für Long-Tail-SKUs in Sekundärmärkten ist Übersetzung aus dem Englischen in der Regel ausreichend.

Terminologiekonsistenz. Fachterminologie variiert je nach Sprachmarkt. Der deutsche Begriff für einen bestimmten Armaturenstandard unterscheidet sich vom englischen ISO-Namen. Ein Terminologieglossar pro Sprache — selbst ein kurzes, das 50–100 Schlüsselbegriffe abdeckt — verbessert die Ausgabekonsistenz über einen großen Lauf hinweg erheblich. Erstellen Sie dieses vor der Generierung, nicht als nachträglichen Korrekturschritt.

Für einen 2.000-SKU-Katalog in vier Sprachen bleiben die Gesamtgenerierungskosten über alle Sprachläufe hinweg unter 150 €. Der Zeitaufwand liegt hauptsächlich in der Prompt-Kalibrierung und dem Qualitätsprüfungsdurchgang, nicht in der Generierung selbst.

Der Qualitätsprüfungsprozess, der Fehler erkennt, ohne jeden Eintrag zu lesen

Eine 2.000-Beschreibungen-Ausgabe erfordert einen strukturierten Sampling-Ansatz, keine vollständige Lektüre. Drei Prüfebenen erkennen die relevanten Fehlerkategorien.

Ebene 1 — Automatisierte String-Prüfungen. Führen Sie Pattern-Matching auf der Ausgabedatei aus, bevor ein Mensch sie liest:

Beschreibungen unter 60 Wörtern oder über 200 Wörtern markieren (Prompt-Nichterfüllung)
Beschreibungen markieren, die den Produktcode oder Lieferantennamen enthalten (Anweisungsverletzung)
Beschreibungen markieren, die mit identischen Phrasen über mehrere SKUs in derselben Kategorie beginnen (Modell ist in ein Template verfallen — bedeutet meist, dass die Eingabedaten für diese Kategorie zu spärlich sind)
Beschreibungen markieren, die verbotene Phrasen enthalten, die Sie angegeben haben: „revolutionär”, „branchenführend”, „weltklasse”, Preissprache, Lieferversprechen

Dieser automatisierte Durchgang dauert Minuten und isoliert die Zeilen, die menschliche Überprüfung erfordern. Bei einem sauberen Datensatz werden typischerweise 3–7 % der Ausgaben markiert — 60–140 Zeilen statt 2.000.

Ebene 2 — Kategoriebasierte Stichprobenprüfung. Aus den nicht markierten Ausgaben eine nach Produktkategorie stratifizierte 5-%-Zufallsstichprobe ziehen. Diese lesen. Prüfen, ob die Beschreibung das Produkt korrekt wiedergibt, die richtige Terminologie für die Kategorie verwendet und sich wie etwas liest, das ein Einkaufsleiter nützlich finden würde. Wenn Sie einen systematischen Fehler in einer Kategorie finden — falsche Anwendungsbehauptung, falsche Spezifikationsrahmung — signalisiert das ein Datenqualitätsproblem in den Quelldaten für diese Kategorie. Quelle korrigieren, diese Kategorie erneut ausführen.

Ebene 3 — High-Value-SKU-Prüfung. Die Top-100-150 SKUs nach Umsatz oder strategischer Bedeutung identifizieren. Diese einzeln lesen. Dies sind die Beschreibungen, auf die Einkäufer am häufigsten treffen, und wo Fehler den größten Schaden anrichten. Pro SKU 2–3 Minuten für eine Faktengenauigkeitsprüfung gegen das Datenblatt einplanen.

Gesamte Qualitätsprüfungszeit für 2.000 Beschreibungen mit diesem Drei-Ebenen-Ansatz: 6–10 Stunden für eine Person. Im Vergleich zu 667 Stunden manuellem Schreiben ist das eine erhebliche Reduzierung, selbst wenn man die Bereinigung und Prompt-Kalibrierungsarbeit einrechnet.

Die Ausgabe am Ende dieses Prozesses ist eine Upload-fertige Beschreibungsdatei. Für einen Distributor mit einer bestehenden B2B-Website schließt sich das direkt an die Produktseitenvorlage an. Für einen Distributor, der SEO von einer niedrigen Basis aus aufbaut oder neu aufbaut, ist dies das Inhaltsfundament, das Suchsichtbarkeit für B2B-Dienste im Katalogmaßstab ermöglicht.

Was das kostet und wogegen es gemessen wird

Gesamtprojektkosten für eine 2.000-SKU-Katalogenerierung in einer Sprache, einschließlich Datenbereinigung, Prompt-Kalibrierung, Generierung und Qualitätsprüfung:

Datenbereinigung: 8–15 Stunden interne Zeit
Prompt-Design und Testlauf: 2–3 Stunden
API-Generierungskosten: 15–40 €
Qualitätsprüfung (drei Ebenen): 6–10 Stunden interne Zeit
Gesamte interne Zeit: 16–28 Stunden
Gesamte externe Kosten: unter 50 €

Das Marketing- oder Betriebsteam eines mittelgroßen Distributors kann dies in einer fokussierten Woche von Anfang bis Ende durchführen. Derselbe Umfang als manuelles Schreibprojekt würde 4–6 Monate Teilzeiteinsatz oder über 15.000 € Texterbudget erfordern.

Die ROI-Messung ist für KI-Betriebsprojekte mit Suchauswirkungen unkompliziert: Organischen Traffic zu Katalogseiten 60 und 90 Tage nach Veröffentlichung der Beschreibungen verfolgen, mit der 90-Tage-Baseline davor vergleichen. Bei einem Katalog, der zuvor keine Beschreibungen hatte, ist die Baseline null. Jeglicher organischer Traffic über null ist dem Inhalt zuzurechnen.

Für Distributoren, die Katalogautomatisierung als Teil einer umfassenderen Produktempfehlungsstrategie evaluieren: Dieselben sauberen Daten, die die Beschreibungsgenerierung speisen, speisen auch Empfehlungsmodelle — sie benötigen strukturierte Attributdaten pro SKU, um Substitute und Zubehör zu identifizieren. Beide Projekte aus einem einzigen Datenbereinigungsdurchgang zu betreiben, erhöht die Rendite auf die Vorbereitungsarbeit.

Eine externe Referenz ist erwähnenswert: Anthropics Claude-API-Automatisierungsdokumentation behandelt Massen-Texterstellungsworkflows in Unternehmensgröße, einschließlich Katalog- und Produktinhalt-Anwendungsfällen. Die hier genannten Kosten- und Durchsatzzahlen stimmen mit den Standard-API-Preisen zum Zeitpunkt der Abfassung überein; prüfen Sie die aktuelle Preisliste, bevor Sie einen großen Lauf budgetieren.

Ein korrekt aufgebauter KI-Katalogenerierungsworkflow ist eine einmalige Infrastrukturinvestition. Sobald die Datenpipeline, die Prompt-Bibliothek und der Qualitätsprüfungsprozess existieren, dauert das Hinzufügen von Beschreibungen für neue SKUs Minuten, nicht Wochen. Das Katalogproblem hört auf, ein Rückstand zu sein, und wird zur Routine.

AHoosh baut Katalogautomatisierungspipelines für B2B-Distributoren. ahoosh.ai/contact