Interview mit Urs Widmer, CEO Digital Learning, CREALOGIX

„Video is the new text“ lautete das Credo von Koemei. Wir haben die Artificial Intelligence (AI) -Technologie des Schweizer Start-ups und Spin-offs des Forschungsinstituts IDIAP (Partner der Eidgenössischen Technischen Hochschule Lausanne EPFL) übernommen. Was Artificial Intelligence heute schon fürs Lernen tun kann und wo Zukunftspotenzial liegt, habe ich Urs Widmer, den CEO des Bereichs Digital Learning, gefragt.

Urs Widmer, CEO Digital Learning CREALOGIX


Jasmin Epp (JE):
Artificial Intelligence, Machine Learning, Deep Learning – die Begriffe begegnen uns heute überall. Was ist dran an den Buzzwords und worin unterscheiden sie sich eigentlich?

Urs Widmer (UW): Es stimmt, künstliche Intelligenz in all ihren Ausprägungen ist nicht nur unter „Nerds“ (was für mich übrigens ein positiver Begriff ist), sondern auch in der Wirtschaftswelt gerade schwer angesagt. Mit gutem Grund: Entwickler von Anwendungen, die auf Artificial Intelligence basieren, machen sich menschliches Lernverhalten zunutze, um so Abläufe zu automatisieren und optimieren. Jedes Computerprogramm, das sich aus menschlicher Sicht intelligent verhält, verfügt über Artificial Intelligence.

Grob vereinfacht, gibt es zwei Möglichkeiten, um Software das Denken beizubringen: Entweder das System befolgt Regeln und lernt, diese auf das Datenmaterial immer besser anzuwenden, oder es wird mit einer immensen Menge „guter Entscheidungen“ gefüttert und erkennt nach dem Prinzip von Versuch und Irrtum, wie eine bestimmte Aufgabe am besten zu lösen ist. Dieses „trial and error“-Prinzip nennen wir Machine Learning. Es ist also ein Teil der Artificial Intelligence.

Eine Teilmenge des Machine Learning wiederum ist das Deep Learning:
Ein sehr aufwändiges, datenintensives Verfahren, mit dem neuronale Netze menschliche Entscheidungen simulieren. Die neuronalen Netze sind Recheneinheiten mit künstlichen Nervenzellen, die miteinander zu Schaltkreisen verbunden sind. Diese „Nervenzellen“ schicken dem Rechner erst ein Signal ab, wenn die Summe des Inputs einen gewissen Schwellenwert überschreitet. Um es an einem Beispiel zu verdeutlichen: Man benötigt unglaublich grosse Datenmengen, damit künstliche Intelligenz das Bild eines Hundes von dem eines Wolfes oder eines Fuchses sicher zu unterscheiden lernt. Das lohnt sich also nur, wenn der Nutzen auf der Business-Seite entsprechend gross ist.

JE: Wir haben jetzt eine Technologie, die auf einer automatisierten Spracherkennung basiert. Das Verfahren (Machine Learning) mit neuronalen Netzwerken und Natural Language Processing (NLP) wurde mit enormem Aufwand entwickelt. Acht Jahre Forschungsarbeit und Investitionen in Höhe von etwa 20 Millionen Schweizer Franken. Was „kann“ die Technologie?

UW: Wir integrieren mit dieser AI-Technologie ein richtiges Filetstück in unsere Produkte. Die Lösung umfasst mehrere AI Elemente: erstens ASR (Automated Speech Recognition): Damit werden Video- und Audioaufzeichnungen in Text übertragen. Siri, ihre Android-Schwester, Google Now, und andere Programme können das auch, aber unsere Software überragt die Spracherkennungsqualität. Zweitens NLP (Natural Language Processing): Damit werden die Texte inhaltlich analysiert und Schlüsselbegriffe erkannt und indexiert. Und drittens deep learning mittels neuronaler Netzwerke: Damit können die Texte aufgrund der inhaltlichen Analyse sog. Konzepten zugeordnet werden. Im Gegensatz zu Google und den anderen Grossen bringen wir diese Lösung in die Unternehmen hinein. Für vertrauliche Anwendungen gibt es für Firmen die on premise Lösung.

JE: Wenn wir uns im gesamten deutschsprachigen Raum bewegen, hören wir eine Vielzahl von Dialekten. Besonders auch in der Schweiz.

UW: Das ist in jedem Sprachraum die grösste Herausforderung, doch auch in dieser Hinsicht ist unsere Machine-Learning-Lösung sehr weit. Der Sprecher ist nicht auf die Verwendung eines bestimmten Wortschatzes festgelegt. Die Standardlösung umfasst ca. 80‘000 Wörter, die Advanced Lösung wird um unternehmensspezifische Lexika erweitert. Mittels Deep Learning wird der Wortschatz und die Taxonomie laufend erweitert.

JE: „Video is the new text.“ Wir sprechen allerdings von Audiodateien. Warum?

UW: Dieser Unterschied spielt keine Rolle. Die Software behandelt Videodateien wie Audiodateien. Cineasten mögen es mir verzeihen: Wir gehen davon aus, dass der Sinn eines Videos über die Tonspur vermittelt wird. Besonders bei Lerninhalten.

Die Idee, Aufnahmesequenzen wie Text zu behandeln, besitzt eine enorme Sprengkraft. Mit der automatisierten Spracherkennung entstehen Texte, die dann mit Artificial Intelligence Tools und Natural Language Processing analysiert und getaggt werden. So wird es möglich, das Prinzip der Google-Suche auf Videos und Audios zu übertragen.

Mit diesem Verfahren hat die Universität Genf mehr als 5.000 Stunden Vorlesung benutzerfreundlich aufbereitet. Wenn die Studierenden den Content der Uni beispielsweise nach prüfungsrelevanten Inhalten durchsuchen, werden ihnen Texte sowie Audio- und Videodateien gleichermassen angezeigt. Der Clou: Sie erfahren auf die Sekunde genau, an welcher Stelle der Vorlesung das Thema behandelt wird, nach dem sie gesucht haben, und können direkt dorthin springen.

JE: Wäre diese Technologie doch bloss zu meinen Unizeiten vorhanden gewesen … Damit wird das Lernen zweifellos sehr viel komfortabler und Recherchen lassen sich gezielt durchführen, aber rechnet es sich auch im Bereich Digital Learning?

Bildungseinrichtungen können ihre eigenen Inhalte nachhaltig nutzen, indem sie beispielsweise für die Vorbereitung einer neuen Unterrichtseinheit gezielt den Content recherchieren, der dazu bereits vorliegt. Auch das Nutzerverhalten lässt sich analysieren. Das Angebot kann so viel besser an die Lernenden angepasst werden. Wenn also beispielsweise in einem Unternehmen sehr häufig danach gesucht wird, wie sich eine bestimmte Funktion in Excel anlegen lässt, bietet es sich an, dazu eine Schulung anzubieten.

JE: Damit spannst du den Bogen von Bildungseinrichtungen zum Digital Learning im Allgemeinen. Fallen dir weitere Anwendungen ein?

UW: Eine weitere Hauptanwendung sehen wir in der betrieblichen Aus- und Weiterbildung. Für unsere Firmenkunden werden wir diese Funktionalitäten in die bestehende Lösung des Swiss Learning Hubs integrieren.

Auch für das Digital Banking (Beitrag folgt in Kürze hier im Blog) sehe ich grosses Potenzial. Z.B. können aufgezeichnete Telefonate von Kundenberatern automatisch auf die Einhaltung von Compliance Regeln geprüft werden. Oder recherchiert ein Kunde online nach Details zu einem bestimmten Anlageprodukt, würde ihm die passende Sequenz im Erklärvideo angezeigt.

JE: Apropos Markt: Wie geht es mit der Technologie nun weiter?

UW: Indem wir Artificial Intelligence sowohl ins Digital Learning als auch ins Digital Banking integrieren, verfügen wir über eine Schlüsseltechnologie für die nächste Generation von Lösungen. Wir bauen mit unseren Spezialisten derzeit ein eigenes Team auf, das die Lösung weiterentwickelt. Wir werden sie on premise und cloudbasiert nach dem Software as a Service(SaaS)-Modell anbieten. Wie für unser gesamtes Produktspektrum garantieren wir auch für das AI-basierte Produkt absolute Datensicherheit.

JE: Ein bisschen haben wir nun „um den heissen Brei herumgeredet“. Unter welchem Namen bieten wir das Artificial Intelligence Tool an?

UW: Wir haben das Produkt SPEXIAN auf unserem diesjährigen Education Forum am 19. September 2017 im Trafo Baden vorgestellt. Übrigens können Interessenten und Du Euch für einen Demo-Account anmelden, um ein Gefühl für die Funktionsweise zu bekommen.

JE: Es bleibt also spannend – und spannend war es auch, sich mit dir über das Potenzial von Artificial Intelligence zu unterhalten. Ich danke dir für das Gespräch!