Natural Language Processing zur Keyword Extraktion

Extraktion von Fachbegriffen aus technischen Texten

Herausforderung

Zur Kategorisierung und Einordnung einer großen Menge von technischen Texten verwendet unser Kunde bisher einen manuellen, von Experten getriebenen Prozess.
Durch den Einsatz von Verfahren aus dem Maschinellen Lernen und dem Natural Language Processing (NLP) soll dieser Prozess weitgehend automatisiert werden.

Lösung

Auf Basis von Algorithmen und Heuristiken entwickeln wir ein Verfahren, das vollautomatisch Fachbegriffe aus technische Texten extrahieren kann. Durch den Einsatz von Techniken aus dem Unsupervised Learning kann das Verfahren eingesetzt werden, ohne vorab speziell auf einer neuen Datenbasis trainiert zu werden.
Technologisch setzen wir auf Python und spaCy. Weiterhin betten den Algorithmus in eine REST-API basierend auf Flask ein. Dadurch erreichen wir ein einfaches Deployment und eine leichte Integration in die bestehende IT-Landschaft des Kunden.

Ergebnis

Das von uns entwickelte NLP-Verfahren extrahiert effizient und mit hoher Genauigkeit Fachbegriffe aus technischen Texten. In Zukunft wird der bisher manuelle Prozess durch die Keyword-Vorschläge des von uns entwickelten Verfahrens unterstützt und beschleunigt.

Nutzen

Daten

Technologien