Publiziert am: 09.05.2014

Neue Datenwissenschaft

DATA SCIENCE – «Datenwissenschaft» bringt verschiedene wissenschaftliche Methoden wie Statistik, Mathematik und IT mit Fachwissen zusammen. Welche Möglichkeiten haben somit KMU?

Nehmen wir an, Sie haben einen Veloverleih in einer Schweizer Stadt. Ihre Kunden sind zum einen Touristen, welche die Stadt mit dem Velo erkunden wollen, und zum anderen auch Werktätige, die zur Abwechslung statt mit dem Tram mal mit dem Velo zur Arbeit fahren wollen.

Nun interessiert Sie, an welchen Tagen zu welchen Uhrzeiten sie wie viele Velos verleihen, um beispielsweise den Velobestand zwischen verschiedenen Standorten passend umverteilen zu können. Wovon hängt die Verleihquote ab? Vom Wetter? Sicherlich. Werktag oder Wochenende? Sicher auch, aber vielleicht nur an gewissen Standorten. Von was noch?

Gewiss hat man als Inhaber eines Veloverleihs über die Jahre ein intuitives Wissen gewonnen und kann in etwa prognostizieren, wie der heutige Tag verlaufen wird: Man sieht auf den Kalender und in die Wettervorhersage und kennt die Stadt.

Ein Haufen von Daten

Wenn wir jedoch dieses einfache Beispiel verlassen, kann es sehr schnell schwierig werden, die richtigen Einflussgrössen auf das eigene Geschäft verlässlich einzuschätzen. Die heutzutage gesammelten Daten reichen von den einfachen Kundendaten wie Wohnort und Alter über Verkaufszahlen bis hin zu Datenquellen wie Bevölkerungsstatistiken. Ihre Anzahl kann fast unerschöpflich sein und führt dazu, dass die Zusammenhänge schwierig einzuschätzen oder nachzuvollziehen sind.

Um aus diesem Wust an Daten noch sinnvolle Ergebnisse zu bekommen, haben sich Firmen wie die Bytepocket auf das sogenannte Data Science spezialisiert. Data Science – in etwa «Datenwissenschaft» – bringt dabei verschiedene wissenschaftliche Methoden wie Statistik, Mathematik und IT mit Fachwissen zusammen, um Daten zu analysieren, Prognosen für den weiteren Verlauf abzugeben sowie die bestehenden Prozesse zu optimieren.

Die Ansätze hierfür gibt es schon seit über 30 Jahren, aber erst seit einigen Jahren hat sich Data Science als eigene Disziplin herauskristallisiert, was sehr viel damit zu tun hat, dass dank neuester IT-Technologie immer mehr Daten gesammelt werden können.

IT, Statistik und Fach-Know-how

Was passiert nun, wenn ein Data Scientist bei Ihnen vorbeikommt? Um gute Resultate zu bekommen, benötigt es drei Disziplinen, die zusammen können müssen: IT, Statistik und Fach-Know-how. Die ersten beiden kann eine Firma wie Bytepocket abdecken, letzteres muss immer aus dem entsprechenden Fachbereich der Firma kommen. Der Fachspezialist der Firma ist dabei ein wichtiger Ansprechpartner für das Verstehen der vorhandenen Daten sowie für die Beurteilung der Ergebnisse. Mit Hilfe statistischer Methoden sowie Machine-Learning-Ansätzen (wie beispielsweise die Neuronalen Netzwerke, durch die IT-Systeme in der Lage sind zu lernen) können Muster in den Daten gefunden werden: unter anderem, welche Zusammenhänge es gibt und welche Daten irrelevant sind.

Um auf unser Veloverleih-Beispiel zurückzukommen: Das Wetter hat sicher einen nachweisbaren Einfluss auf den Verleih, aber auch Daten, an die man weniger denkt, wie die erwartete Belegung von SBB-Zügen. Diese sind öffentlich verfügbar. Eine Bevölkerungsstatistik hingegen eher weniger. Hat man Muster gefunden, ist man in der Lage, Prognosen für den weiteren Verlauf abzugeben. In unserem Fall könnte anhand der Analyse nachgewiesen werden, ob und wie, abhängig vom Wochentag, die Velos zwischen den Standorten umverteilt werden müssen. Gewisse Standorte ziehen mehr Touristen, andere mehr Berufstätige an.

Ein wichtiger Punkt hierbei ist, dass die Fragestellung im Vorfeld richtig definiert wird. Einfach nur in Daten zu suchen, ob man irgendetwas findet, scheitert meist. Christopher Frank, Autor des Buches «Drinking from the Fire Hose: Making Smarter Decisions Without Drowning in Data», nennt dies das Alice-im-Wunderland-Problem. Alice trifft hier auf die Grinsekatze und fragt sie nach dem Weg. Diese fragt wiederum Alice, wo sie denn hin will. Als Alice sagt, dass sie das nicht weiss, antwortet die Grinsekatze, dass es dann auch keine Rolle spielt, in welche Richtung sie geht.

Gemäss Umfragen der britischen Zeitschrift «The Economist» benutzt im Schnitt nur circa ein Drittel der Firmen ihre Daten regelmässig, um wichtige Entscheidungen zu treffen. Diese Zahl dürfte bei KMU eher noch wesentlich niedriger liegen. Dabei kann durch eine gute Analyse der Daten und dementsprechende Prognosen eine wichtige Basis für Geschäftsentscheidungen gelegt werden kann, um einen Vorteil im Wettbewerb zu erlangen.

Markus Schrüfer

Managing Partner

BytePocket GmbH

Für Vorteile
im Wettbewerb

Data Science

Viele Firmen sammeln schon heute viele Daten, verwenden sie aber nicht strukturiert. Eine sinnvolle Verwendung dieser Daten mit herkömmlichen Methoden ist bei grossen Mengen schwierig und nur auf den Ist-Zustand ausgerichtet. Mit Data Science können Muster gefunden und Prognosen für die Zukunft erstellt werden. Die Ergebnisse können einen wichtige Grundlage sein, um Wettbewerbsvorteile zu erreichen und neue Geschäftsideen zu validieren.