Digitale Qualitätssicherung bei FSH Nobiskrug: KI liest Stahlzertifikate aus
Wie lässt sich die aufwändige manuelle Übertragung von Materialdaten in industrielle Planungssysteme automatisieren? Diese Frage untersuchten die FSG-Nobiskrug Design GmbH und KI.SH in einer gemeinsamen Machbarkeitsstudie. Ziel war es, zu prüfen, ob Künstliche Intelligenz in der Lage ist, Informationen aus Dokumenten automatisiert auszulesen und in digitale Systeme zu überführen – ein bislang fehleranfälliger und zeitintensiver Arbeitsschritt für viele Unternehmen, die vor ähnlichen Aufgaben stehen.
Weniger manuelle Arbeit, mehr Prozesssicherheit
Die FSG-Nobiskrug Design GmbH, ein Tochterunternehmen der FSG-Nobiskrug Holding GmbH, hat sich auf die Planung, Konstruktion und den Vertrieb von Schiffsbauwerken spezialisiert. In der Produktion ist die lückenlose Dokumentation der Materialherkunft ein zentraler Bestandteil der Qualitäts- und Nachweissicherung. Dafür müssen unter anderem Informationen aus Stahlzertifikaten, die meist im PDF-Format vorliegen, in das unternehmenseigene System übertragen werden. Bislang erfolgt dieser Schritt manuell, was einen fehleranfälligen und zeitintensiven Prozess darstellt, der wertvolle Personalressourcen bindet. Um diesen Aufwand zu reduzieren und die Prozesssicherheit zu erhöhen, prüften das Unternehmen und KI.SH den Einsatz eines KI-gestützten Lösungsansatzes.
Ziel: Praxistauglichkeit des KI-Modells nachweisen
Im Rahmen der Machbarkeitsstudie untersuchte das aus Daniel Mansfeldt, Marvin Kühl und Dirk Mönicke bestehende Projektteam, ob sich dieser Schritt durch den Einsatz eines vortrainierten KI-Modells automatisieren lässt. Ziel war es, zu prüfen, ob die relevanten Informationen aus den Zertifikaten zuverlässig ausgelesen und für nachgelagerte Systeme nutzbar gemacht werden können – ein Vorhaben mit erheblichem Potenzial für mehr Effizienz im Unternehmen.
Das Donut Model als technische Grundlage
Für die Machbarkeitsstudie kam das Donut Model (Document Understanding Transformer) zum Einsatz. Dieses vortrainierte Open-Source-Modell ist darauf ausgelegt, strukturierte Informationen aus dokumentenbasierten Bilddaten, wie beispielsweise gescannten PDF-Seiten, zu extrahieren. Die FSG-Nobiskrug Design GmbH stellte hierfür rund 200 Stahlzertifikate als PNG-Dateien sowie strukturierte JSON-Dateien, die die Zielwerte enthielten, zur Verfügung. Nach einer sorgfältigen Datenbereinigung – etwa durch Standardisierung der Bildgrößen und Entfernung fehlerhafter JSON-Einträge – wurde das Modell auf diesen spezifischen Datensatz nachtrainiert.
Donut Model
Das Donut Model (Document Understanding Transformer) ist ein Open-Source-KI-Modell zur Extraktion strukturierter Informationen aus Dokumenten. Es arbeitet bildbasiert, d.h. direkt auf Scans oder PDF-Seiten, und kann Inhalte kontextabhängig interpretieren, ohne auf klassische Texterkennung angewiesen zu sein.
Herausforderungen im Datensatz
Die große Vielfalt in Layout und Aufbau der Stahlzertifikate stellte eine zentrale Herausforderung dar. Aufgrund unterschiedlicher Formatierungen, Sprachen und Darstellungsformen war eine gezielte Auswahl und Aufbereitung der Trainingsdaten erforderlich. Zusätzlich war der verfügbare Datensatz für ein Machine-Learning-Vorhaben dieser Art vergleichsweise klein. Zwar war dadurch auch der Trainingsaufwand für das Modell entsprechend gering, jedoch war die Validierung der Ergebnisse auch mit Unsicherheiten verbunden.
Ergebnisse der Machbarkeitsstudie
Die Testphase des nachtrainierten Modells lieferte dennoch vielversprechende Ergebnisse. Auf einem separaten Datensatz erreichte das Modell eine Gesamtgenauigkeit von rund 90 Prozent bei der Extraktion der gewünschten Einträge. Damit lässt sich der notwendige manuelle Korrekturaufwand auf ein Maß reduzieren, das den Einsatz des Modells als produktive Unterstützung sinnvoll erscheinen lässt.
Technische Integration und langfristige Optimierung
Damit das Modell tatsächlich in den Unternehmensalltag integriert werden kann, sind verschiedene technische Schritte erforderlich. Zunächst müssen die PDF-Dokumente automatisiert in einzelne Seiten aufgeteilt und in Bildformate konvertiert werden, die sich vom Modell verarbeiten lassen. Anschließend ist eine benutzerfreundliche Schnittstelle zu entwickeln, über die die erkannten Werte überprüft und bei Bedarf korrigiert werden können, bevor sie ins ERM-System übernommen werden.
Darüber hinaus lässt sich das Modell langfristig optimieren, indem manuell überprüfte Ausgaben zur Erweiterung des Trainingsdatensatzes genutzt werden. So kann das Modell kontinuierlich nachtrainiert werden, beispielsweise um auf sich ändernde Zertifikatslayouts zu reagieren oder die Gesamterkennungsleistung zu verbessern.
Potenzial über den Schiffbau hinaus
Auch wenn die Studie im spezifischen Kontext des Schiffbaus durchgeführt wurde, lassen sich ihre Ergebnisse auf andere Branchen und Dokumententypen übertragen. Viele Unternehmen sehen sich mit ähnlichen Herausforderungen konfrontiert, wenn es um die digitale Verarbeitung von Lieferdokumenten, Prüfzertifikaten oder Formularen geht. Die Kombination aus strukturierter Datenaufbereitung, domänenspezifischem Nachtraining und robustem Modellansatz stellt eine übertragbare Grundlage für weitere Anwendungsfälle im Bereich der KI-gestützten Dokumentenverarbeitung dar.
Fazit
Die Machbarkeitsstudie der FSG-Nobiskrug zeigt, dass KI-gestützte Systeme nicht nur im Innovationslabor funktionieren, sondern auch unter realen Bedingungen produktionsnahe Prozesse sinnvoll unterstützen können. Auch wenn die vollständige Integration in bestehende Systeme noch bevorsteht, ist die technische Grundlage dafür bereits gelegt. Die Erkenntnisse aus der Studie sind somit ein wichtiger Schritt auf dem Weg zu digitaleren und effizienteren Abläufen – nicht nur im Schiffbau, sondern auch in anderen datenintensiven Industriebereichen.
