Extraktion technischer Daten aus Dokumenten: Herausforderungen, Erfahrungen und Methoden
- Fachvortrag
- Intelligente Bereitstellung von Nutzerinformation
-
07. November
-
09:00
- 09:45
AM
(MEZ)
-
C6.1
Inhalt
Wie können technische Daten aus Dokumenten für die intelligente Informationsnutzung extrahiert werden? Für viele moderne Anwendungsfälle wie Product Information Management, Content Delivery oder die Verwaltungsschale werden digitale Produktinformationen und technische Daten in strukturierter Form benötigt. Wenn die Daten nicht digital oder strukturiert vorliegen, gibt es mehrere Methoden, diese zu gewinnen.
In diesem Vortrag werden Herausforderungen, Erfahrungen und bewährte Methoden zur Extraktion von technischen Daten aus der Praxis beleuchtet. Es werden die folgenden intelligenten Methoden vorgestellt und ihre Chancen und Grenzen eingeordnet: kontextabhängige Extraktoren, Analyse von Seitenbereichen, Large-Language-Modelle sowie semantische Tabelleninterpretation.
Das lernen Sie
Methoden, Beispiele, Erfahrungen und Herausforderungen aus der Praxis der Datenextraktion aus Dokumenten.
Vorkenntnisse
Grundkenntnisse: Technische Dokumentation, strukturiertes Informationsmanagement und Metadatenkonzepte
Referent:innen
Biografie
Daniel Nägele (M. Sc.) ist Berater bei der plusmeta GmbH. Der studierte Technische Redakteur unterstützt Kunden bei der Einführung von KI-Software und Standardaustauschformaten wie VDI 2770 und iiRDS. Seine Schwerpunkte sind die Extraktion technischer Daten sowie der Einsatz von Künstlicher Intelligenz in der Technischen Kommunikation.
Biografie
Calvin Smyk (M. Sc.) ist AI & Digital Twin Research Scientist bei der plusmeta GmbH. Sein Studium der Elektrotechnik und Elektronik an der Hochschule Esslingen führte ihn zur Florida State University und zur Technischen Universität München, wo er sich auf Robotik, Kognition und Intelligenz spezialisiert. Mit Leidenschaft für künstliche Intelligenz und Deep Learning, hat er umfassende Erfahrung in der Entwicklung von Algorithmen und in der Optimierung digitaler Zwillinge durch NLP und Computer Vision.