Automatische Erweiterung von Stellenbeschreibungen durch Knowledge-Graphen
Zusammenfassung
Stellenausschreibungen enthalten in der Regel die für die Ausübung der ausgeschriebenen Tätigkeit erforderlichen Fähigkeiten als unstrukturierten Text. Mehrere verschiedene Begriffe können verwendet werden, um eine Reihe ähnlicher Fähigkeiten zu beschreiben. Dies erschwert die Suche nach Stellen, die mit einer bestimmten Qualifikation übereinstimmen, da die Suchbegriffe genau mit den textuellen Qualifikationsbeschreibungen übereinstimmen müssen. Dies gilt auch für die Suche nach Bewerbern, die ihre Fähigkeiten in einem textbasierten Lebenslauf beschreiben. Für Jobplattformen und Personaldienstleister ist dies eine verpasste Chance: Mögliche Übereinstimmungen zwischen Kandidaten und Positionen werden nicht gefunden, weil die textuellen Beschreibungen sehr ähnlicher Fähigkeiten nicht identisch formuliert sind.
brox IT-Solutions hat eine Lösung implementiert, die hilft, Fähigkeiten automatisch zu identifizieren und sie mit strukturierten Daten zu verknüpfen. Dadurch wird es einem Knowledge Graph ermöglicht, dieses Problem zu lösen. Die Skills werden mit Hilfe von NLP-Technologien automatisch mit einem Linked-Open-Data-Datensatz verknüpft. Diese Verknüpfung erlaubt es Bewerber schneller offenen Stellen zuzuweisen, was zu höheren Einnahmen für Personaldienstleister und Jobportale führt.
Zielsetzung
Die vorhandenen Stellenausschreibungen sind unstrukturiert. Ziel ist es, die Stellenanzeigen nach Arbeitsbereichen und den für die jeweilige Stelle erforderlichen Fähigkeiten zu kategorisieren. Dies macht es für Arbeitssuchende einfacher, sich auf dem Arbeitsmarkt zurechtzufinden, neue Berufe zu finden und zu verstehen, welche Fähigkeiten zu welchen Berufen gehören, um zu wissen, welche Fähigkeiten für die gewünschten Berufe benötigt werden. Auch Personalvermittlungsfirmen können so leichter Bewerber mit Stellen in Verbindung bringen.
Herausforderungen
Für die Umsetzung einer Lösung mussten mehrere Herausforderungen bewältigt werden: Erstens sind die verfügbaren Jobdaten unstrukturiert und stammen aus verschiedenen Quellen. Knowledge-Graphen helfen bei der Integration der Daten. Da die Daten aus verschiedenen Bereichen stammen, kann das Problem auftreten, dass die verschiedenen Autoren unterschiedliche Bezeichnungen für dieselben Fähigkeiten verwenden. Außerdem sind die Daten nicht mit den verfügbaren öffentlichen Datenbanken zu diesen Fähigkeiten verbunden.
Lösung
Die Kernbestandteile der Lösung wurden in zwei Komponenten aufgeteilt: Verarbeitung von unstrukturiertem Text aus Stellenbeschreibungen und Erstellung eines integrierten Wissensgraphen, der Fähigkeiten und Stellenausschreibungen enthält.
Die Verarbeitung der Textuellen Job-Beschreibungen umfasste die folgenden Schritte:
- Extrahieren des Textinhalts der Stellenausschreibungen aus den jeweiligen Stellenportalen mit Hilfe von Web Scraping Tools.
- Anwendung von Pre-Processing- und Datenbereinigungstechniken, um nur die Informationen zu extrahieren, die für die erforderlichen Fähigkeiten für eine Stelle relevant sind.
Die Erstellung der Wissensgraphen, die alle Informationen zusammenführen umfasst die folgenden Komponenten:
- Verarbeitung des extrahierten und bereinigten Textes mit der wikifier API, die benannte Entitäten und ihre Wikipedia-ID erkennt.
- Annotation der Stellenausschreibungen mit den zugehörigen DBPedia-Entitäten aus wikifier. Ein Beispiel für eine solche Annotation ist in der folgenden Abbildung dargestellt.
- Speicherung der Ergebnisse (Stellenausschreibungen, Fähigkeiten, verknüpfte DBPedia-Entitäten) in einem Wissensgraphen.
Geschäftlicher Nutzen
Von der beschriebenen Lösung können mehrere Geschäftsbereiche profitieren:
- Für Jobplattformen und Personaldienstleister ermöglicht es die Erweiterung von Stellenbeschreibungen, mehr Kandidaten für offene Stellen zu finden, was den Umsatz erhöht.
- Die strukturierte Speicherung von Stellenbeschreibungen ermöglicht eine automatische Zuordnung von Positionen und Kandidaten, was den manuellen Arbeitsaufwand reduziert und die Kosten senkt.
- Die extrahierten Daten können auch für eine zuverlässigere Analyse von Markttrends verwendet werden, da Synonyme für Fähigkeiten berücksichtigt werden.
- Für Unternehmen die auf Jobplattformen inserieren, werden die Stellen schneller besetzt, was die Einnahmen erhöht und die Einstellungskosten senkt. Darüber hinaus wird das Risiko verringert, nicht rechtzeitig gute Kandidaten zu finden.
- Jobplattformen die einen größeren Mehrwert bei der Inserierung bieten, locken mehr Kunden an, welche gleichzeitig bereit sind einen höheren Preis zu zahlen.
- Für Arbeitsuchende würde eine strukturierte Darstellung von Stellenanzeigen eine bessere Abfrage und die Einrichtung speziellerer Benachrichtigungen ermöglichen. Dies würde mehr Arbeitssuchende auf eine Plattform locken die diese Technologien nutzt, was wiederum zu höheren Einnahmen führen würde.
Dr. Matthias Jurisch
Autor
Manager Information Management Unit