Was kann Big Data?
Big Data ist ein Buzz-Wort, ein Hype sagen Kritiker. Es geistert seit Monaten durch die Medien, aber es gibt keine Anwendungen. Doch das stimmt nicht. Die folgenden Beispiele zeigen, dass Big Data inzwischen unser aller Leben betrifft – und immer mehr an Fahrt gewinnt. Ein Profiteur ist US-Präsident Barack Obama. Und auch die Sicherheitsdebatte um PRISM bekommt mit den Möglichkeiten der Big-Data-Analyse zusätzliche Nahrung.
Warum hat Obama die letzte Wahl zum US-Präsidenten gewonnen? Wegen Big Data – und weil sein Datenverarbeitungsteam gut arbeitete. Das mag etwas übertrieben klingen, aber in der Tendenz trifft es tatsächlich zu: Danach hat Obama unter massivem Einsatz von Technologien zur Speicherung und Verarbeitung riesiger Datenmassen – im Fachjargon Predictive Analytics – seine Wahlkampfaktionen bis ins Detail geplant und vorbereitet.
Ob das wirklich der entscheidende Faktor für den Wahlerfolg war, weiss man nicht sicher, aber Big Data hat zumindest maßgeblich dazu beigetragen. Die Datenanalysten haben es gut verstanden, vorhandene Informationen zu analysieren und für den Wahlkampf zu nutzen. Schon im Vorfeld betonte Wahlkampf-Manager Jim Messina ganz offiziell, dass man im Zuge dieser Wahl alles messen und analysieren würde, was irgendwie relevant erscheint.
Ein Beispiel: Datenanalysen haben ergeben, dass gut betuchte Damen mittleren Alters besonders George Clooney und Jessica Parker bewundern. Auf diese Erkenntnis folgte eine von Obamas Team organisierte Verlosung eines Dinners mit den beiden – und Spendengelder in Millionenhöhe.
Insgesamt soll Obama es geschafft haben, mit Hilfe von Data Analytics eine Milliarde US-Dollar einzusammeln und auf Basis der Zahlen gezielte TV- und Social-Media-Kampagnen zu starten. Auch auf die Nutzung von Social Media wie Facebook wurde großer Wert gelegt. Obamas Team war klar, dass politische Ansichten und die Motivation zum Wählen besser funktionieren, wenn sie von bekannten oder befreundeten Personen weiter transportiert werden. Das wurde dann auch leidlich ausgenutzt.
Versicherungen: Maßgeschneiderte Produkte bereitstellen
Den monetär höchsten Nutzen bringt Big Data freilich nicht der Politik, sondern vor allem Wirtschaftsunternehmen wie dem Einzelhandel, Banken und Versicherungen. Diese Branchen werden derzeit von Big Data regelrecht umgewälzt.
CIO Ralf Schneider von der Allianz Gruppe wettet beispielsweise, dass Big Data und Analytics in zehn Jahren die Spielregeln des gesamten Geschäfts radikal verändern werden. An Daten zu gelangen sei inzwischen keine Schwierigkeit mehr, sagt Schneider in der Online-Ausgabe von CIO.de. Immer mehr Quellen liefern Input, Social Media, Weblogs, Kontextinformationen, Ortsinformationen und vieles mehr.
Doch Daten allein sind nutzlos. Das Kunststück ist, strukturierte wie unstrukturierte lose Daten zu Information zu verknüpfen, sie also mit Bedeutung aufzuladen, in Sekundenschnelle zu analysieren, zu interpretieren und damit nutzbar zu machen. Das alles könne Analytics, und besonders Realtime Analytics leisten. Dabei werden Kundendaten, Umweltdaten, ein aktueller Anlass und natürlich wirtschaftliche Faktoren des Unternehmens in Sekundenbruchteilen verknüpft und ein individuelles Angebot erstellt. „Für Kunden können wir besser als je zuvor maßgeschneiderte Produkte liefern“, so Schneider.
Unter Vertriebs- und Marketing-Leuten gilt Customer Analytics als die „Erfolgswaffe der Zukunft“. Analytics-basierte Prognosen helfen Unternehmen, ihre Kunden individuell und detailliert zu analysieren und bedarfsgerechte Angebote zu machen. Das führt zu steigendem Umsatz und Gewinn, heißt es in der Forrester-Studie „Predictive Analytics gibt neue Impulse“. So stieg bei einem Online-Händler der Umsatz bezogen auf eine einzelne Kampagne um 30 Prozent.
Einzelhandel: Kaufverhalten analysieren
Ein simples Analytics-Beispiel ist die Analyse von Warenkorbdaten. Hierbei wird eine Menge an Warenkörben daraufhin untersucht, ob Zusammenhänge (Regeln) zwischen den gekauften Produkten bestehen, also konkret: Welche Produkte haben Kunden bei einem Kauf gemeinsam erworben. Eine über eine Warenkorbanalyse gefundene Regel könnte etwa lauten, dass „in 40 Prozent der Transaktionen, in denen Milch, Brot und Butter gekauft wurde, auch Kaffee gekauft wurde“.
Hat man durch eine Warenkorbanalyse Gruppen von häufig zusammen verkauften Produkten herausgefunden, lässt sich das Sortiment im Laden oder auf der Website optimieren und konsumgerecht platzieren. Ordern Käufer von Madonna-CDs auch häufig solche von Britney Spears, werden beide zusammen angeboten.
Auch schwerwiegende wirtschaftliche Entscheidungen lassen sich mit analytischen Datenverfahren treffen. Um den besten Platz für ihre Windenergie-Projekte zu finden wertete beispielsweise das dänische Unternehmen Vestas Wind Systems, Hersteller von Windkraftkonvertern, alle relevanten Daten aus – von Windstärke und -richtung über Wetterberichte und Gezeiteninformationen bis hin zu Sonneneinstrahlung und Geländehöhe. Dabei fielen Datenmengen im Petabyte-Bereich an.
Die Analyse dieser Daten half, den richtigen Standort zu finden, die Windräder effizienter auszurichten und so einen maximalen Energie-Output erzielen. Um die Berechnungen, die früher oft mehrere Wochen dauerten, zu beschleunigen, hat Vestas eine Big-Data-Lösung eingeführt. Mit spezieller Analyse-Software und dem IBM-Supercomputer Firestorm, der an die komplexen Anforderungen von Vestas angepasst wurde, dauern die Brechnungen heute nur noch knapp eine Stunde.
Mit einer „Wind Library“ kann Vestas nun an jedem in Aussicht genommenen Standort – in Verbindung zu anderen Informationen wie Zugang zu Hochspannungsnetzen oder Naturschutzauflagen – die aktuellen Bedingungen für einen Windpark quantitativ absichern. Dieses Youtube-Video berichtet ausführlicher darüber.
Astronomie: Jeden Tag 14 Exabyte
Große Datenmengen gibt es nicht nur in der Wirtschaft, sondern auch in der Physik und der Astronomie. Auch dort verantwortet Big Data gerade eine kleine Revolution. So ist zum Beispiel die Entdeckung des Higgs-Teilchens am CERN-Forschungszentrum nicht ohne Big Data möglich gewesen. Einer der CERN-Detektoren verursacht beispielsweise jedes Jahr ein Datenaufkommen von rund 10 Petabyte, bestehend aus echten, simulierten und Metadaten.
In der Astronomie sind große Datenmengen schon lange an der Tagesordnung. Big-Data-Technologien sollen hier helfen, mehr wissenschaftliche Erkenntnisse aus den Daten zu ziehen. Beispielsweise soll das größte und empfindlichsten Radioteleskop der Welt, das im Rahmen des SKA-Projekt (Square Kilometer Array) bis 2024 gebaut wird, die Geschichte unseres Universums erforschen. Die Antennen des SKA-Teleskops werden jeden Tag rund 14 Exabyte an Signalen aus dem All empfangen und davon etwa ein Petabyte speichern.
Um diese Aufgabe zu meisten müssen die Forscher grundlegende Computing-Fortschritte erzielen – Fortschritte, die weit über das SKA-Projekt hinaus wirken und eine neue Computing-Ära einleiten sollen. Zur Lösung dieser Aufgabe rief das niederländische Institut für Radioastronomie mit dem Projekt DOME eine öffentlich-private Zusammenarbeit ins Leben.
„Im Rahmen der DOME-Zusammenarbeit entsteht ein einmaliges und kongeniales Team aus Wissenschaftlern und Ingenieuren von öffentlichen und privaten Institutionen. Dieses Projekt legt für die wissenschaftliche Gemeinschaft den Grundstein zur Lösung weiterer Big-Data-Herausforderungen, wie z.B. die Erforschung des Klimawandels, genetischer Informationen und personalisierter Medizin,“ erklärt Simon Ratcliffe, der technische Koordinator von DOME-Südafrika. Mehr dazu erfahren Sie in diesem Youtube-Video.
Sicherheit: Automatisierte Echtzeitüberwachung
Auf längere Sicht wird Big Data auch Sicherheitslösungen wie Anti-Malware, Data Loss Prevention und Firewalls beeinflussen. Laut dem Security Brief „Big Data Fuels Intelligence-Driven Security“ von RSA werden Big-Data-Analysen bis 2015 Sicherheitslösungen, Netzwerküberwachung, Nutzerauthentifizierung und –autorisierung, Identitätsmanagement, Betrugsermittlung sowie Regierungs-, Risiko- und Compliance-Systeme maßgeblich verändern. In den nächsten drei bis fünf Jahren werden Tools zur Datenanalyse zudem weitere Prognosemöglichkeiten und automatisierte Echtzeitüberwachung bieten, heißt es.
Die Autoren des Security Briefs gehen davon aus, dass bereits dieses Jahr führende Sicherheitsorganisationen auf kommerzielle Big-Data-Standardlösungen setzen werden. Dieser Trend wird die Herangehensweise an das Thema Sicherheit, Lösungen und Ausgaben in den kommenden Jahren prägen.
Bildung: Big Data auf dem Campus
Und last but not least bleibt auch das Bildungswesen nicht außen vor. Laut der EDUCAUSE-Studie 2012 „Analytics in Higher Education“ gewinnt die Datenanalyse auch an Bildungsinstituten an Bedeutung. Dort hat man festgestellt, dass durch Analytics die Verweildauer, die Abschlüsse, die Noten und das Engagement von Studenten positiv beeinflusst werden. Viele Universitäten und andere Bildungseinrichtungen sehen sich deshalb veranlasst, auch auf ihrem eigenen Campus eine datenbasierte Entscheidungskultur voranzutreiben.
Am meisten Potenzial sehen die Befragten in Bezug auf das Verständnis von Studienverläufen und Verhalten von Studierenden, die Optimierung des Ressourceneinsatzes an den Hochschulen sowie die Anwerbung neuer Studierender. Vor allem auch Studenten profitieren davon.
Ein Beispiel schildert Jacqueline Bichsel, Senior Research Analyst, in einem Interview mit dem Portal Checkpoint E-Learning: „Forscher der Universität Wisconsin haben studentische Lösungsansätze in einem Kurs Management System und andere Informationen analysiert. Dabei fanden sie heraus, dass eine bestimmte Art von Instruktion bessere akademische Ergebnisse förderte. Das Paul Smith College hat demographische Daten und Analysen benutzt, um bereits vor Semesterbeginn Risiko-Studenten zu identifizieren und um sie frühzeitig zu unterstützen. Mit dieser Maßnahme wurde die Zahl der Studienabbrecher gesenkt und positiv Einfluss auf die Noten genommen.“
Unsere Big-Data-Serie im Überblick:
- Big Data: Was dahinter steckt
- Was kann Big Data?
- Revolution oder Evolution: Wie Big Data die IT verändert
- Big Data: Teile und herrsche mit Hadoop