Visual

Beyond

Big Data Analytics: größer, schneller, besser

Foto: Alex Krizhevsky

im Juli 2017
von Christine Steinhart

Big Data und maschinelles Lernen wird alles verändern – das haben wir mittlerweile tausendfach gehört. Nicht nur in der Theorie, sondern in jedem einzelnen Lebensbereich, sagen Experten. Googles autonomes Fahren, die Gesichtserkennung bei Facebook, IBM Watson und Microsoft Cortana sind prominente Beispiele für unzählige Anwendungsmöglichkeiten im Finanzsektor, in Vertrieb und Marketing, Produktion und Logistik oder auch in der Medizin- und Biotechnologie. Dass davon in vielen Lebensbereichen wenig zu spüren ist, liegt an der technischen Komplexität dieser Technologie. Früher oder später ist der Einsatz von Big Data aber kein wirtschaftlicher Vorteil mehr, sondern schlichtweg Standard.

Den Gamern sei Dank

Mit Big Data sind nicht einfach nur riesige Datenmengen gemeint – es geht um die gewinnbringende Analyse der Daten mithilfe maschineller Lernverfahren. Es werden Wahrscheinlichkeiten berechnet und Vorhersagen getroffen, die als Grundlage zur Entscheidungsfindung dienen. Das allein ist nicht neu und ist noch kein Anlass, von einer Revolution zu sprechen: Marktforschungsinstitute, Unternehmen, Wirtschaftsverbände und andere Institutionen erfassen seit jeher Informationen und werten sie zur Entscheidungsfindung aus. Neu ist, dass Vorhersagen nicht mehr anhand von Stichproben getroffen werden müssen – es können schlichtweg alle vorhandenen Daten ausgewertet werden. Das erlaubt eine völlig neue Exaktheit, die bisher undenkbar war. Die Verarbeitung solch großer Datenmengen wurde durch eine neue Generation von Grafikkarten möglich – den Computerspielern auf dieser Welt sei Dank. Sie sind bereit, viel Geld für leistungsstarke Grafikkarten auszugeben und haben so die Entwicklung immer schnellerer Karten vorangetrieben.

Ein Beispiel aus dem Bereich Social Network Analysis

Als die App »Candy Crush Saga« das meistgenutzte Spiel auf Facebook wurde, stieg der Unternehmenswert von King Digital Entertainment rapide an. Mittlerweile ist das Interesse an Candy Crush abgeflacht, neue Spielentwicklungen konnten die Erfolgsgeschichte von Candy Crush kaum reproduzieren – das zeigt auch die Unternehmensbilanz von King. Das Ranking einer App vorhersagen zu können, ist nicht nur für Kapitalgeber, sondern auch für interne Unternehmensentscheidungen Gold wert.

Wie funktioniert der Blick in die Big-Data-Glaskugel?

Der Durchbruch einer App kann auf der Grundlage von Nutzerinteraktionen in Facebook mit einem Fehler von 16% vorhergesagt werden. Hierzu wird eine Stimmungsanalyse durchgeführt: Zunächst werden alle Posts in Facebook zu Candy Crush erfasst. Die Posts werden als positiv oder negativ kategorisiert und gewichtet. Zur Verarbeitung natürlicher Sprache kommen linguistische Analysemethoden zum Einsatz. Das natürlichsprachliche Lexikon wird mit Emoticons ergänzt, die ebenfalls positive oder negative Aussagekraft besitzen. Worte, die nicht aus dem Lexikon stammen wie »I luvv this« werden gesondert behandelt.

In einem nächsten Schritt, dem maschinellen Lernen, werden die Zusammenhänge zwischen der Stimmung im sozialen Netzwerk und dem Ranking der App trainiert: Ein maschineller Lernalgorithmus erstellt ein Vorhersagemodell, das die Zusammenhänge zwischen den kategorisierten Posts und dem Ranking der App möglichst exakt beschreibt. Dieser Algorithmus wird immer weiter optimiert: Der Fehler zwischen Vorhersage und dem tatsächlichen Wert der Zielgröße wird Schritt für Schritt minimiert. Das ist möglich, weil der Fehler zwischen Vorhersage und dem tatsächlichen Wert in dieser Trainingsphase bekannt ist. Außerdem identifiziert der Algorithmus die Parameter, die sich als besonders zuverlässige Vorhersageindikatoren entpuppen.

Eine neue Methode, die die aufwendige Merkmalsextraktion durch menschliche Expertise überflüssig macht, sind tiefe Ende-zu-Ende-Netze, sogenannte Deep-learning-Methoden.

Mit dem dem Algorithmus wird ein Vorhersagemodell erstellt, das jetzt auf einen neuen Datensatz angewandt werden kann, zum Beispiel auf Facebook-Posts zu Candy Crush der letzten zwei Tage. Das Vorhersagemodell wird dann auf Grundlage der erlernten Zusammenhänge das zukünftige Ranking der App vorhersagen.

Diese Art der Datenanalyse wird menschliche Expertise in vielen Punkten überflüssig machen. Sie ist schnell und zuverlässig – Voraussetzung dafür ist eine ausreichend große Datenbasis, um alle Eventualitäten zu trainieren. Hoffen wir, dass Google den Algorithmus für autonomes Fahren mit ausreichend vielen Daten gefüttert hat, bevor uns unser autonomes Auto durch den Gotthardtunnel chauffiert!

Mehr zum Thema:

Wo ist der schönste Platz der Welt – Der Paradies-Generator nutzt Big Data, um es herauszufinden:

Geben Sie es weiter: Save, Share, Like, Tweet

Teilen und kommentieren Sie diesen Artikel: Wir freuen uns über Ihre Meinung, Ihr Feedback und den Austausch mit Ihnen.

Diskussion

B2B Content Marketing Insights

Impulse für B2B-Marketing- & Strategie, -Konzept und -Technologie direkt ins Postfach