Wissensgraphen machen Informationen einfacher zugänglich

KI Service - Industrie 4.0

Dr. Corina Dima, Wissenschaftliche Mitarbeiterin, Analytic Computing, IPVS, Universität Stuttgart

Informationen müssen im Daten-Ökosystem eines Unternehmens einfach zugänglich sein – ein Ziel, das gerade im Zeitalter von Big Data wichtiger wird. Welchen Herausforderungen Anwender:innen lösen müssen. Und welche Technologien ihnen heute dabei helfen.

Wissen spielt eine zentrale Rolle im Entwurf von KI-Systemen.” (Pan 2017). Firmen, die Vorteile aus künstlich intelligenten (KI) Anwendungen ziehen möchten, müssen diesen Daten bereitstellen, auf deren Basis KI-Algorithmen lernen können. Daten können dabei in unterschiedlichen Formen und Formaten vorliegen – von unstrukturierten Daten, etwa in Form reiner Textdaten, wie zum Beispiel Produkthandbüchern oder Beschreibungen von Servicetickets, bis zu voll-strukturierten Daten, etwa aus einer Datenbank. In letzter Zeit wird der Einsatz von sogenannten Wissensgraphen (Knowledge Graphs) immer beliebter. Nicht nur, um Daten in Form eines Graph-basierten Datenmodells zu organisieren, sondern insbesondere auch, um KI-Systemen Firmenwissen zugänglich zu machen.

Was sind Wissensgraphen?

Hogan et al., 2021, definieren Wissensgraphen als „Datenformate basierend auf mathematischen Graphen, die zur Sammlung und Vermittlung von Wissen über die reale Welt gedacht sind, und in denen Knoten relevante Entitäten beschreiben und Kanten potenziell unterschiedliche Beziehungen zwischen diesen Entitäten abbilden.” Wissensgraphen bestehen also aus sogenannten Entitäten (zum Beispiel ein Unternehmen, Produkt, Mitarbeiter, Ort oder Auftrag) und Beziehungen (beispielsweise, ein Unternehmen fertigt ein Produkt, ein Mitarbeiter arbeitet für eine Firma oder ein Kunde bestellt ein bestimmtes Produkt). Jede Entität lässt sich durch Merkmale weiter beschreiben (mögliche Produktmerkmale sind etwa Namen, Seriennummern, Produktions- oder gegebenenfalls auch Mindesthaltbarkeitsdaten) und ist zudem eindeutig identifizierbar. Die jeweiligen Typen von Entitäten und Beziehungen lassen sich über OWL (W3C Web Ontology Language) definieren und über das RDF-Datenmodell (Resource Description Framework) beschreiben.

Warum sollten Unternehmen Wissensgraphen einsetzen?

Wissensgraphen verschaffen Unternehmen Wettbewerbsvorteile. Zu den bekanntesten Vertretern gehören beispielsweise Google Knowledge Graph, Amazons Produkt Knowledge Graph, Facebook Graph API, Microsoft Satori und der LinkedIn Knowledge Graph (vgl. Noy et al., 2019 und Hogan et al., 2021 für weitere Beispiele).

Darüber hinaus gibt es offene Allzweck-Wissensgraphen, die in kollaborativen Verfahren gepflegt werden und die frei zugänglich sind: zum Beispiel Wikidata, DBpedia und Freebase. Für Spezialgebiete stehen Wissensgraphen wie etwa UMLS (Unified Medical Language System) mit Fokus auf den biomedizinischen Bereich bereit.

Wer das Daten-Ökosystem eines Unternehmens über Wissensgraphen modelliert, kann zudem Informationen aus unterschiedlichen internen Quellen (wie etwa aus der Produktions-, Forschungs- oder Personalabteilung) mit externen integrieren (wie beispielsweise Informationen über Kund:innen oder Lieferant:innen).

Darüber hinaus lassen sich auch Daten modellieren, die nur für das eigene Unternehmen und seine Produkte relevant sind. Beispiele dafür sind Google Knowledge Graph and Microsoft Satori: Beide Wissensgraphen modellieren Allgemeinwissen nur für die jeweilige Suchmaschine.

In vielen Fällen bauen Wissensgraphen auch aufeinander auf. Egal, ob in Geschäftsbranchen[1] oder Forschungsbereichen[2] – vorhandene, bereits existierende Modelle lassen sich dann etwa mit spezifischen Informationen anreichern und weiterentwickeln.

Wissensgraphen in Arbeitsprozesse integrieren: Zwei Herausforderungen

  • Unterschiedliche Datenquellen zu einem kohärenten Wissensspeicher zusammenfügen. Anwender:innen müssen Informationen nicht nur in Wissensgraphen importieren und modellieren, sondern auch kontinuierlich aktualisieren, verwalten und pflegen. Neue KI-gestützte Verfahren erleichtern diese Aufgaben, indem sie Informationen direkt aus bestehenden relationalen Datenbanken einbinden (Stoica et al., 2020) und strukturierte Informationen aus unstrukturierten Texten ableiten können (Martinez-Rodriguez et al., 2020).
  • Informationen aus Wissensgraphen einfach zugänglich machen. Damit Nutzer:innen täglich produktiv mit den Systemen arbeiten, sollte das notwendige technische Vorwissen möglichst gering sein. So lassen sich Information neuerdings auch mittels Fragen in natürlicher Sprache aus Wissensgraphen abrufen (siehe Lan et al., 2021 für einen Überblick). Zum einen beantworten die Systeme einfache Fragen, bei denen es nur um eine bestimmte Information geht (z.B. Wer ist unser:e Ansprechpartner:in in der Firma WerkTeile?). Zum anderen lassen sich auch komplexere Anliegen klären, in dem das System unterschiedliche Informationen finden und kombinieren muss, um zu einer genauen Antwort zu gelangen (z.B. Welche Kund:innen haben im November 2020 Ersatzteile der Firma WerkTeile von uns erhalten?).

Frage-Antwort-Systeme über Wissensgraphen

Frage-Antwort-Systeme über Wissensgraphen (Question answering systems over knowledge graphs (KGQA)) wurden dafür entwickelt, um natürlichsprachliche Anfragen zu in Wissensgraphen enthaltenen Informationen zu beantworten. Haben Unternehmen ihre Daten bereits entsprechend modelliert, müssen die Frage-Antwort-Systeme lernen, wie sie Informationen aus den Wissensgraphen ableiten. So müssen die Systeme beispielsweise – bei einer einfachen Frage – erkennen, welche Entität „X“ in Beziehung „Kontakt_Person“ zu einer anderen Entität „WerkTeile“ gesucht ist. Um komplexere Aufgaben zu lösen, müssen die Systeme identifizieren können, in welche mögliche Kette von Beziehungen die Entitäten, die in der Frage gennant wurden, verbinden. Was das herausfordernd macht: Die Systeme müssen erkennen, was die Nutzer:innen eigentlich meinen, wenn sie ihnen geläufige Begriffe benutzen, die sich lexikalisch nicht in den Entitäten und Beziehungen widerspiegeln. Ein Beispiel: So kann „WerkTeile“ auch als „WerkTeile GmbH“ hinterlegt sein. Oder gebräuchliche Bezeichnungen wie „Ansprechpartner“, „Kontakt“ oder „Kontaktperson“ meinen für Menschen das Gleiche, was der Wissensgraph als Beziehung „Kontakt_Person“ bestimmt.

Das Frage-Antwort-System muss lernen, wie es Anfragen richtig auf den Wissensgraphen bezieht. Ein Prozess, der über maschinelles Lernen gelöst wird und daher große Menge an Trainingsdaten erforderlich macht, um Algorithmen mithilfe Beispielfragen und richtige Antworten zu trainieren. Die dafür notwendigen Datensätze lassen sich in vielen Fällen halb-automatisch über Fragevorlagen mit dem Wissensgraphen erzeugen (vgl. als Beispiele die Datensätze von Lan et al., 2021).

Einfach, schnell und unkompliziert auf Wissen zugreifen können – das Zusammenspiel von Frage-Antwort-Systemen und Wissensgraphen verspricht Unternehmen einen zentralen Zugang zu allen Informationen. Firmen, die die Chancen für sich nutzen möchten, sollten auf offene und standardisierte Wissensgraphen setzen, um Entitäten und Beziehungen für ihre Bereiche und Anwendungen zu beschreiben.

Quelle

Hogan, A., Blomqvist, E., Cochez, M., D’amato, C., Melo, G. D., Gutierrez, C., Kirrane, S., Gayo, J. E. L., Navigli, R., Neumaier, S., Ngomo, A.-C. N., Polleres, A., Rashid, S. M., Rula, A., Schmelzeisen, L., Sequeda, J., Staab, S., & Zimmermann, A. (2021). Knowledge Graphs. ACM Computing Surveys, 54(4), 71:1-71:37. https://doi.org/10.1145/3447772

Lan, Y., He, G., Jiang, J., Jiang, J., Zhao, W. X., & Wen, J.-R. (2021). A Survey on Complex Knowledge Base Question Answering: Methods, Challenges and Solutions. Proceedings of the Thirtieth International Joint Conference on Artificial Intelligence, 4483–4491. https://doi.org/10.24963/ijcai.2021/611

Martinez-Rodriguez, J. L., Hogan, A., & Lopez-Arevalo, I. (2020). Information extraction meets the Semantic Web: A survey. Semantic Web, 11(2), 255–335. https://doi.org/10.3233/SW-180333

Noy, N., Gao, Y., Jain, A., Narayanan, A., Patterson, A., & Taylor, J. (2019). Industry-scale knowledge graphs: Lessons and challenges. Communications of the ACM, 62(8), 36–43. https://doi.org/10.1145/3331166

Pan, J. Z., Vetere, G., Gomez-Perez, J. M., & Wu, H. (Eds.). (2017). Exploiting Linked Data and Knowledge Graphs in Large Organisations. Springer International Publishing. https://doi.org/10.1007/978-3-319-45654-6

Stoica, R., Fletcher, G., & Sequeda, J. F. (2020). On Directly Mapping Relational Databases to Property Graphs. 4. http://ceur-ws.org/Vol-2369/short06.pdf


Bildquelle: iStock-1249359794-1200