NLP Meetup: Best Practice Sharing und Open-Source Tools aus Stanford

KI Service - Industrie 4.0

Meetup Demo

Von Fabian Pelzl, KNOWRON

Knowron, assoziierter Partner von Servicemeister lädt zum NLP Meetup am 9. Dezember um 19.00 ein. Die Veranstaltung wird durch die Impulsvorträge von Giovanni Campagna (Lead Developer Almond, Stanford University) mit dem Thema: „Genie, An Open-Source Toolkit for High Quality, Affordable Virtual Assistants“ und von Ivan Bilan (Lead NLP Data Scientist, TrustYou) mit dem Thema „In Search of Best Practices for NLP Project“ eröffnet.

Ob bei der Verarbeitung großer Datenmengen (e.g. Servicetickets), bei Suchanfragen, oder in der Interaktion mit Chatbots – Natural Language Processing (NLP) ermöglicht viele unterschiedliche Anwendungen.

Gerade im technischen Service fällt eine Vielzahl an Textdaten in Form von Reparaturdokumentationen, Servicedokumenten oder Support-Tickets an, die sowohl bei der Erstellung als auch in der Bearbeitung mühsam sind. Genau hier können NLP-Algorithmen in ihren unterschiedlichen Formen helfen. Wenn viele Textdaten vorliegen, werden je nach Anwendungsfall NLP-Algorithmen in Form von Neuronalen Netzen trainiert. Aber auch wenn weniger Textdaten vorliegen, gibt es Möglichkeiten relevante Informationen zu extrahieren. Genau vor dieser Herausforderung stehen auch einige Schnellbot-Projekte von Servicemeister.


<h3 class=Prototyping mit NLP

In der Theorie klingt es sehr vielversprechend, in der Praxis stehen die Datenanalysten jedoch schnell vor großen Herausforderungen: Unterschiedliche Datenstrukturen, fehlende Daten, und teilweise auch falsche Daten. Gerade bei selbstlernenden Algorithmen ist dies ein großes Problem. „Garbage in, garbage out“ – hört man dann oft als Erklärung dafür, wenn Ergebnisse die hohen Erwartungshaltungen nicht erfüllen. Um hohe sunk costs in der NLP-Produktentwicklung zu vermeiden, macht eine iterative Prototypenentwicklung daher sehr viel Sinn.

Eine iterative Entwicklung von Prototypen managet nicht nur die Erwartungen, sondern zeigt auch die Möglichkeiten eines Datensatzes auf. Je nach Anwendungsfall müssen die Daten nämlich unterschiedlich aufbereitet und aus verschiedenen Perspektiven analysiert werden. Ivan Bilan hat schon einige dieser Projekte bearbeitet und auch geleitet. Er widmet sich in seinem Vortrag folgenden Fragen: Wie entwickelt man am besten einen NLP-Prototyp? Braucht man wirklich Continuous Integration (CI) für NLP-Projekte? Was muss das Team wissen, um an NLP-Projekten arbeiten zu können?

Virtuelle Assistenten auch bald im Service?

Zuhause haben sich virtuelle Assistenten wie Google Assistant und Amazon Alexa mit einer enormen Geschwindigkeit durchgesetzt. Werden sich diese Assistenten nun ähnlich schnell in der Arbeitswelt durchsetzen? Gerade im technischen Service, wo heute das meiste Wissen noch auf zwei Beinen herumläuft, entsteht so die Möglichkeit dieses Wissen systematisch zu erfassen. So merkt sich dann der Assistent, welche Probleme besonders häufig an dieser Maschine auftreten und kann dieses Wissen auch anderen Kollegen zur Verfügung zu stellen.

An einer Alternative zu den virtuellen Assistenten der Tech-Giganten arbeitet Giovanni Campagna im Online Virtual Assistant Lab (OVAL) an der Stanford University. Im Mittelpunkt der Forschung steht dabei kein Geschäftsmodel, sondern vor allem die Privatsphäre der Nutzer. Dies führt zu neuen Herausforderungen, für deren Lösung schon mehrere Open Source Tools entstanden sind. Diese Tools ermöglichen nicht nur die Entwicklung eines eigenen virtuellen Assistenten, sondern haben auch das Potential die Abhängigkeit von den Tech-Giganten zu verringern.

9.12 um 19.00 – Anmeldung ist jetzt schon möglich:

Melden Sie sich hier an, um teilzunehmen: https://www.meetup.com/nlp-meetup-series/events/274901904/

Wir möchten dieses Meetup so vielen Menschen wie möglich zugänglich zu machen. Daher ist unsere Veranstaltung kostenlos, online und wird auf Englisch durchgeführt.