KI unterstützt bei Pflanzenanfragen: Effizientere Angebotsprozesse für die Clasen Baumschulen
Die Johannes Clasen Baumschulen GmbH & Co. KG mit Sitz in Rellingen ist ein traditionsreiches Unternehmen, das sich auf die Produktion und den Vertrieb hochwertiger Pflanzen für den Garten- und Landschaftsbau spezialisiert hat. Täglich erreichen zahlreiche Anfragen die Baumschule. Jede einzelne muss sorgfältig geprüft und mit dem umfangreichen Sortiment abgeglichen werden, bevor ein individuelles Angebot erstellt werden kann. Ein Prozess, der bisher mit viel Handarbeit verbunden ist: Rund 50 Mitarbeitende sorgen dafür, dass die Anfragen und Bestellungen bearbeitet werden. Dies bindet wertvolle Personalressourcen und begrenzt die Effizienz des Betriebs.
Ziel: Automatisierte Analyse von PDF-Anfragen
Im Rahmen einer Machbarkeitsstudie wurde in Zusammenarbeit mit KI.SH untersucht, ob sich Künstliche Intelligenz dafür eignet, den Prozess der Angebotsvorbereitung weitgehend zu automatisieren. Das Ziel bestand darin, selbst unstrukturierte PDF-Anfragen auszulesen, die enthaltenen Pflanzennamen und Qualitätsmerkmale zu identifizieren und passende Artikel aus dem Datenbestand vorzuschlagen. Dadurch würde sich der Aufwand für die Mitarbeitenden deutlich reduzieren und die Zahl der bearbeitbaren Anfragen steigen.
Methode und eingesetzte KI-Modelle
Um die Vielfalt und Unstrukturiertheit der eingehenden PDF-Anfragen zu bewältigen, wurden verschiedene Methoden aus den Bereichen KI und Datenanalyse erprobt und kombiniert. Zunächst kamen OCR-Verfahren und reguläre Ausdrücke zum Einsatz, um die Inhalte der PDF-Dokumente maschinenlesbar zu machen. Anschließend wurden Ansätze auf Basis von Named-Entity-Recognition-(NER-)Modellen und Table-Transformer-Modellen getestet, um Pflanzennamen, Qualitätsmerkmale und Mengenangaben zu identifizieren. Diese Verfahren lieferten jedoch nur eingeschränkt zufriedenstellende Ergebnisse.
Als besonders effektiv erwies sich der Einsatz eines Large Language Models (LLM), das mittels eines gezielt entwickelten System-Prompts gesteuert wurde. Das Modell konnte auch komplexe oder unstrukturierte PDF-Inhalte zuverlässig auswerten. Ergänzend dazu wurde ein String-Distance-Abgleich genutzt, um Synonyme von Pflanzennamen mit den Artikeldaten der Baumschule abzugleichen. Regelbasierte Verfahren rundeten den Prozess ab und ermöglichten eine robuste, automatisierte Verarbeitung unterschiedlichster Anfrageformate.
OCR
Optical Character Recognition (OCR) ist ein Verfahren, mit dem gedruckter oder geschriebener Text in Bildern oder gescannten Dokumenten automatisch erkannt und in digitalen, bearbeitbaren Text umgewandelt wird. OCR-Software analysiert das Bild, erkennt Buchstaben und Zahlen und wandelt sie in ein Textformat um, das durchsucht und bearbeitet werden kann.
String-Distance-Abgleich
Beim String-Distance-Abgleich wird die Ähnlichkeit zwischen zwei Zeichenketten (Strings) berechnet. Hierzu wird ermittelt, wie viele einzelne Bearbeitungsschritte nötig sind, um einen String in den anderen zu überführen. Mithilfe dieser Methode lassen sich alternative Schreibweisen, Tippfehler oder Synonyme in Textdaten erkennen und abgleichen, beispielsweise bei der Suche nach Artikelnamen oder Dubletten in Datenbanken.
NER
Named Entity Recognition (NER) ist eine KI-Methode, die automatisch wichtige Begriffe in Texten erkennt und in Kategorien einsortiert. Dazu gehören zum Beispiel Namen von Pflanzen, Orten, Personen oder speziellen Produkten. Das Verfahren basiert auf Algorithmen, die mit Beispieldaten trainiert werden, um Begriffe zuverlässig zu identifizieren – auch wenn sie unterschiedlich geschrieben oder formuliert sind. So hilft NER, aus unstrukturierten Texten relevante Informationen schnell und präzise herauszufiltern.
Herausforderungen bei Daten und Modellen
Die größte Hürde bestand in der starken Varianz und Unstrukturiertheit der Anfragedokumente. Unterschiedliche Bezeichnungen und Qualitätsbeschreibungen erschwerten den direkten Abgleich. Zudem fehlt bislang ein umfassender Ground-Truth-Datensatz, sodass die erzielte Genauigkeit nicht abschließend bewertet werden konnte. Praxistests zeigen dennoch, dass KI-Lösungen einen Großteil der Fälle automatisiert und korrekt bearbeiten können.
Ergebnisse der Machbarkeitsstudie
Die eingesetzten KI- und Regelmodelle waren technisch erfolgreich: Pflanzennamen und Qualitätsmerkmale konnten zuverlässig erkannt, Alternativen ermittelt und die relevanten Angaben in tabellarischer Form ausgegeben werden. Die Umsetzung gelang sowohl mit einem lokalen KI-Modell als auch mit dem gehosteten Ansatz. Die gesamte Lösung ist äußerst effizient und unterstützt das Unternehmen bereits heute bei der Bearbeitung von Anfragen.
Fazit und Ausblick
Die Studie zeigt, dass KI-basierte Systeme auch in Unternehmen wie Clasen Baumschulen einen echten Mehrwert bieten. Durch die Automatisierung der Angebotsprüfung werden Prozesse nicht nur sicherer, sondern auch zeitsparender. Durch weitere Verbesserungen, etwa im Fine-Tuning der Modelle und der Analyse zusätzlicher Artikeldaten, kann die Lösung künftig noch leistungsfähiger werden. Auch andere Betriebe in Schleswig-Holstein, die ähnliche Herausforderungen im Umgang mit komplexen Kundendokumenten haben, können von den gewonnenen Erkenntnissen profitieren.
