IBM positioniert die Watson Produktlinie als „AI for Business“. Dabei steht „Watson“ weder für ein einheitliches System, noch für eine gemeinsame Basis-Technologie. Vielmehr handelt es sich bei Watson um eine Marke für verschiedene, meist Cloud-basierte Services und Produkte mit einem mehr oder weniger hohen Anteil von auf künstlicher Intelligenz beruhenden Funktionen. IBM spricht in diesem Zusammenhang auch von Cognitive Computing und der Ära des Cognitive Business.
IBM Watson – Geschichte
Ursprünglich handelte es sich bei Watson tatsächlich um „ein“ System, nämlich um den Supercomputer, der im Jahr 2011 die US Gameshow „Jeopardy“ gegen die besten Jeopardy Spieler aller Zeiten gewann und damit große internationale Aufmerksamkeit und Bekanntheit erlangte. Bei Jeopardy müssen die Kandidaten möglichst schnell Fragen aus verschiedenen Wissenskategorien beantworten, indem sie mit der korrekten Frage nach dem gesuchten Begriff antworten (z.B. „Wer war Abraham Lincoln.“).
Ein großer Teil der Schwierigkeit besteht dabei darin, die oft kompliziert und bewusst irreführenden Fragen im ersten Schritt überhaupt zu verstehen, bevor dann eine Antwort gesucht wird. Watson wurde speziell auf diese Aufgabenstellung trainiert und hatte anders als oft angenommen während der Show keinen Zugriff auf das Internet, d.h. die komplette Wissensbasis war lokal gespeichert. Vor dem Gewinn der Show waren einige frühere Versuche gescheitert, aber während der erfolgreichen Show dominierte Watson schließlich seine menschlichen Kontrahenten.
In der Folge investierte IBM enorm viele Ressourcen in den Aufbau der neuen Geschäftssparte und kaufte diverse Technologien hinzu. Diese wurden teilweise integriert, teilweise als eigenständige Produkte positioniert, und die neuen Funktionen und Features wurden zunehmend auch in klassische IBM Produkte integriert z.B. in der Analytics Sparte, im Bereich Marketing/Commerce und bei den Collaboration Solutions. Die entsprechenden Produkte erhalten heute dann teilweise den Zusatz „Watson“ im Produktnamen (z.B. „Watson Customer Engagement“), selbst wenn der Anteil an tatsächlichen kognitiven Funktionen eher gering ist und/oder unter der Haube teilweise eher klassische Machine Learning Algorithmen arbeiten.
Mit Watson im engeren Sinne werden daher üblicherweise die über die IBM Cloudplattform Bluemix verfügbaren Watson APIs bezeichnet, welche die kognitiven Watson Kernfunktionen über Schnittstellen für externe Anwendungen zur Verfügung stellen.
Nach wie vor ist dabei die Verarbeitung von Texten und Sprache eine der Haupt-Stärken der Watson Produkte.
IBM Watson Produkte
Bei den IBM Watson Produkten und Services muss vor allem zwischen den Core-APIs auf Bluemix und fertigen Software Produkten unterschieden werden, die von IBM mit dem Markennamen Watson vertrieben werden. Die Zahl der verschiedenen APIs und Produkte verändert sich stetig, so dass im Rahmen dieses Artikels nur der aktuelle Stand von August 2017 wiedergegeben werden kann.
Nicht alle IBM Watson Produkte sind auf Deutsch verfügbar. Details: IBM Watson – Verfügbare Sprachen
Watson Services auf Bluemix
Bluemix ist die Cloud Computing Plattform von IBM und ähnlich positioniert, wie Amazons Pendant AWS. IBM legt jedoch Wert auf den „Data First“ Ansatz von Bluemix, während andere Plattformen ihren Hauptfokus eher auf Computing Power legen würden.
Auf der IBM Bluemix Plattform sind auch die Watson Services verfügbar, d.h. um die Watson APIs nutzen zu können, muss zunächst ein Bluemix Account angelegt werden. Dies impliziert natürlich auch, dass alle Daten, die mit den Watson Services verarbeitet werden, mindestens durch die IBM Cloud geroutet oder aber auch dort gespeichert werden.
Die Daten und die mit den eigenen Daten trainierten Modelle „gehören“ jedoch ausdrücklich dem Kunden und werden laut IBM in keinster Weise weiterverwendet.
Neuerdings sind vereinzelte Watson Services auch über andere Plattformen wie AWS, Microsoft Azure oder die Google Cloud zugänglich und auch der Einsatz on premises ist möglich. Dies gilt aktuell für folgende Services:
- Assistant
- OpenScale
Watson Natural Language Understanding (NLU)
Watson NLU ist einer der wichtigsten Services und fasst inzwischen die Funktionen von diversen ehemals separaten Schnittstellen in einer API zusammen (z.B. Alchemy Language).
Was IBM NLU nennt läuft bei anderen Anbietern unter dem Namen NLP (Natural Language Processing)
Mit Watson Natural Language Understanding lassen sich …
- Texte in verschiedenen Sprachen analysieren,
- Entities, Relationen und Keywords automatisch erkennen und zuordnen,
- Emotionen und Sentiment analysieren und
- Kategorien, semantische Rollen und Konzepte können erfassen.
Die Ergebnisse werden als Annotationen in den Metadaten des Textes gespeichert und können dann weiter verarbeitet werden, z.B. von Chatbots oder Retrieve and Rank Systemen.
Nicht alle Funktionen von Watson NLU sind in allen Sprachen verfügbar.
Der aktuelle Stand hinsichtlich der Unterstützung für die deutsche Sprache ist hier übersichtlich aufgeführt.
Die Ergebnisse von Watson NLU basieren auf vortrainierten Standard-Modellen. Um gute Ergebnisse für einen spezifischen Themen-Bereich zu erhalten, müssen auf der Basis des Standard Modells eigene Modelle trainiert werden. Dieses Business Domain spezifische Training besteht vor allem darin, die vorhandenen eigenen Daten und Texte von Spezialisten für den jeweiligen Bereich manuell annotieren zu lassen und diese annotierten Texte dann als Trainingsdaten für Watson NLU zur Verfügung zu stellen.
Für das Erfassen von Annotationen und für das Management der damit zusammenhängenden Aufgaben wird üblicherweise die Web-basierte Software Watson Knowledge Studio verwendet.
Das so trainierte „Custom Model“ kann dann über eine entsprechende ID bei der Anfrage an die Watson NLU API angesteuert werden.
Watson Language Translator
Mit dem Watson Language Translator können Texte aus einer Sprache in eine andere übersetzt werden. Eine Besonderheit des Dienstes ist die Möglichkeit, für die Übersetzungen ebenfalls eigene Modelle zu trainieren, um zum Beispiel den speziellen Jargon eines bestimmten Fachgebietes abbilden zu können. Der Watson Language Translator bietet bei der Übersetzung darauf basierend die Optionen „forced glossary“, „parallel phrases“ und „corpus level customization“.
Watson Natural Language Classifier
Die Natural Language Classifier Schnittstelle ist darauf spezialisiert, kurze Sätze oder Phrasen zuverlässig bestimmten Kategorien zuzuordnen. Diese Kategorien können vortrainierte Klassen sein, oder anhand von eigenen Daten trainierte individuelle Modelle abbilden. Mit dem Watson Natural Language Classifier können dann z.B. Customer Service Center Anfragen kategorisiert werden, und der Dienst kann auch als Basis für die Erstellung von Chatbots verwendet werden, indem die Erkennung der Intents (Absichten) des Users mit Hilfe dieses Classifiers abgebildet wird. Alles in allem handelt es sich also um eine spezialisierte Variante von Watson NLU, die durch den schlankeren Funktionsumfang für bestimmte Zwecke einfacher und gezielter zu trainieren ist.
Es gibt keine Informationen darüber, ob hinter diesem Service eine Version von Watson NLU steht oder eine andere Technologie verwendet wird.
Watson Retrieve and Rank
Watson Retrieve and Rank ist eine Kombination aus der Apache Solr Suche und Machine Learning Methoden, um die Ergebnisse von komplexen Suchanfragen deutlich zu verbessern. Dafür wird eine Solr Instanz mit der entsprechenden Datensammlung gefüttert und es werden von den jeweiligen Fachexperten zusammengestellte Frage-Antwort-Kombinationen erstellt, mit denen ein Machine Learning Modell trainiert wird. Die Ergebnisse von Suchanfragen an die Schnittstelle werden dann aus einer Kombination der Solr Suchergebnisse mit den Vorhersagen des Machine Learning Modells gebildet und haben dadurch eine höhere Genauigkeit und Relevanz.
Watson Discovery
Mit Watson Discovery lassen sich vorhandene Dokumente aus verschiedenen Ausgangsformaten (z.B. PDF, Word, HTML etc.) automatisiert in von Watson Natural Language verarbeitbare JSON Daten umwandeln, dann mit Watson NLU annotieren und als über die API durchsuchbaren Index speichern.
Die Annotation der Daten kann wie bei NLU über die Standard-Modelle oder über selbst trainierte Custom Modelle erfolgen. Watson Discovery ist eine Kombination von verschiedenen Watson Services: Die Umwandlung und Normalisierung der Dokumente und Daten erfolgt über Watson Document Conversion, die Annotation über Watson NLU und das Training von Custom Models über das Watson Knowledge Studio.
Watson Discovery fasst die Document Conversion API und die NLU API in einer Schnittstelle zusammen und bietet verschiedene Tools, um die Daten und Formate vor der eigentlichen Verarbeitung anzupassen. Die Speicherung des Suchindexes mit allen Annotationen in Bluemix sowie die eigentliche Search-Engine sind ebenfalls enthalten.
Watson Discovery News
Watson Discovery News ist ein bereits annotierter Katalog von täglich mehr als 300.000 News Artiklen aus mehr als 100.000 Quellen. Diese Nachrichten wurden also bereits mit Watson NLU verarbeitet und der aus den Ergebnissen erstellte Index kann über die Watson Discovery News API durchsucht werden.
Aktuell (Stand: August 2017) ist der Service leider nur auf Englisch verfügbar.
Watson Knowledge Studio
Watson Knowledge Studio (WKS) ist ein browser-basiertes Tool für die manuelle Annotation von Texten und Daten durch Spezialisten der jeweiligen Business Domäne.
Mit WKS lassen sich Wörter und Textpassagen markieren und vorher definierten Kategorien und Typen zuordnen. Außerdem kann man Relationen zwischen Wörtern und Phrasen definieren und verschiedene Arten von Wörterbüchern und Machine Learning Modellen verwenden, um die manuelle Annotation zu erleichtern und eine eigene Datenbasis für die Spracherkennung aufzubauen (Corpus).
Watson Knowledge Studio kümmert sich auch um das Management der Annotations-Aufgaben und vergleicht die Ergebnisse verschiedener menschlicher Annotatoren für die gleichen Texte, um eine hohe Datenqualität sicherzustellen. Mit den fertig annotierten Daten lassen sich dann auf Knopfdruck die sogenannten Custom Models trainieren, auf die dann z.B. bei der Verwendung von Watson NLU und Watson Language Translation zugegriffen werden kann.
Watson Document Conversion
Der Watson Document Conversion Service wandelt Dokumente im PDF, Microsoft Word oder HTML Format automatisch in ein standardisiertes JSON Format, reinen Text oder HTML um, damit sie dann in anderen Watson Services weiter verwendet werden können. Die automatisierte Umwandlung kann dabei für beliebige Dokumentenklassen mit Hilfe von Templates so angepasst werden, dass auch sehr unterschiedliche Ausgangsformate in ein einheitliches, weiterverarbeitbares Endformat konvertiert werden können.
Watson Conversation
„Chatbots made easy“ ist der Anspruch von Watson Conversation. Entsprechend handelt es sich beim Watson Conversation Service nicht nur um eine API, sondern um ein komplettes browser-basiertes Toolset, mit dem Intents, Entities, Konversations-Verläufe, Kontext-Variablen etc. angelegt und gemanaged werden können. Enthalten ist auch eine Oberfläche zur Kontrolle der Chatverläufe und zur Anpassung von falsch erkannten Intents und Entities, die dann automatisch nachtrainiert werden können. Der Chat-Service selber kann dann über die API angesprochen und verwendet werden.
Watson Virtual Agent
Beim Watson Virtual Agent handelt es sich um eine vortrainierte Version von Watson Conversation mit einer vereinfachten Oberfläche und mehr als 100 fertigen Intents aus dem Bereich Customer Service für verschiedene Branchen. Diese Standard-Texte können natürlich mit eigenen Daten erweitert und individuell angepasst werden. Virtual Agent Instanzen lassen sich auch mit Watson Conversation kombinieren. So können z.B. einfache Standard-Anfragen ohne größeren Aufwand mit den vortrainierten Modellen des Virtual Agent abgebildet werden und komplexere Themengebiete können maßgeschneidert über Watson Conversation hinzugefügt werden.
Watson Visual Recognition
Visual Recognition ist die umfangreiche Bilderkennungs-API von IBM Watson. Mit Watson Visual Recognition lassen sich Bilder aller Art in nahezu jeder erdenklichen Form auswerten: Über das Content-tagging und die Erkennung von Objekten bis hin zur Gesichtserkennung lassen sich verschiedenste Funktionen und Anwendungen mit Visual Recognition einfach umsetzen.
Natürlich ist es auch möglich, das vorhandene Basis-Modell mit eigenen Daten individuell weiter zu trainieren und so auch für hoch spezialisierte Einsatzbereiche zu verwenden, z.B. bei der Analyse von Röntgenbildern, Scans etc.
Watson Speech to Text
Dies ist die Spracherkennugs-API von Watson. Mit Watson Speech to Text lassen sich Audio-Daten und gesprochene Sätze in Text umwandeln, um sie dann weiter zu verarbeiten. Watson Speech to Text kann individuell angepasst werden, um z.B. Produktnamen, sensible Themen und die Stimmen von bestimmten Sprechern automatisch zu erkennen. Neben der schnellen Verarbeitung von Real-Time Daten kann Watson Text to Speech z.B. auch für die Analyse und Auswertung kompletter Call-Center Daten verwendet werden.
Watson Text to Speech
Mit Watson Text to Speech lassen sich Text in Audio-Daten umwandeln, d.h. Watson Text to Speech kann Text in verschiedenen Sprachen vorlesen. Dafür stehen verschiedene Sprecher-Stimmen bereit, und auch die Art und Weise der Aussprache und Betonung kann individuell angepasst werden.
Watson Personality Insights
Mit Watson Personality Insights lassen sich anhand von Social Media Quellen wie Facebook und Twitter analysieren, um auf dieser Basis Persönlichkeitsmerkmale, Bedürfnisse und Werte der Autoren vorherzusagen. Watson Personality Insights kann dann z.B. für Marketing-Zwecke eingesetzt werden, und im HR Bereich die Persönlichkeit und die Werte von Bewerbern vorhersagen.
Das Modell ist aktuell (Stand: August 2017) nicht für deutsche Texte verfügbar.
Watson Tone Analyzer
Mit dem Watson Tone Analyzer können kurze Texte bezüglich des enthaltenen Sentiments, der verwendeten Tonalität und der vermittelten Emotionen analysiert werden. Diese Ergebnisse können dann z.B. verwendet werden, um bei der Kommunikation mit Kunden besser und individueller reagieren zu können oder z.B. bei Chatbots rechtzeitig zu erkennen, wenn eine Konversation aus dem Ruder läuft. Der Watson Tone Analyzer gibt für alle Emotionen und Sentiments eine Wahrscheinlichkeit dafür an, dass diese jeweils im analysierten Textsegment enthalten ist.
Der Service ist aktuell nicht für deutsche Texte verfügbar (Stand: August 2017). Mit Hilfe von automatischen Übersetzungen von kurzen Texten ins Englische vor der Weitergabe an den Tone Analyzer können allerdings oft schon brauchbare Ergebnisse erzielt werden.
Watson Assistant
Watson Assistant ist eine Plattform zum einfachen Erstellen von Chatbots bzw. Conversational Interfaces. Nutzer können Konversationsschnittstellen per Drag & Drop strukturieren, mit verschiedensten Datenquellen und System verbinden und schlussendlich zur Verfügung stellen. Auch die Übergabe an einen Agent (Hand-Over bzw. Hand-Off) ist möglich.
Watson OpenScale
Bei Watson OpenScale handelt es sich um eine Plattform, mit dem KI-Modelle einfacher erstellt, bereitgestellt und verwaltet werden können. Derzeit unterstützt OpenScale die Frameworks TensorFlow, Keras, SparkML, Seldon, AWS SageMaker, AzureML und einige mehr.
Inhaltsverzeichnis
- IBM Watson – Geschichte
- IBM Watson Produkte
Watson Services auf Bluemix
Watson Natural Language Understanding (NLU)
Watson Language Translator
Watson Natural Language Classifier
Watson Retrieve and Rank
Watson Discovery
Watson Discovery News
Watson Knowledge Studio
Watson Document Conversion
Watson Conversation
Watson Virtual Agent
Watson Visual Recognition
Watson Speech to Text
Watson Text to Speech
Watson Virtual Agent
Watson Personality Insights
Watson Tone Analyzer
Watson Assistant
Watson OpenScale