Publié le: 9 mai 2014

Science des données, la nouvelle discipline

DATA SCIENCE – « La science des données exploite différents éléments de mathématiques, ­statistiques et d’informatique. Quelles possibilités offrent cette nouvelle science aux PME ?

Admettons que vous louez des vélos dans plusieurs stations de la ville ! Le gros de votre clientèle se compose de touristes ainsi que de citadins se rendant occasionnellement au travail en deux-roues pour casser la routine des transports en commun.

Ce qui vous intéresse, c’est d’optimiser la location en sachant quels jours, à quelles heures et combien de vélos répartir dans les différentes stations de la ville. Deux facteurs sont déjà indiscutables : météo et jour de semaine ou jour de weekend. La fréquentation dépend peut-être aussi du lieu de la station. Et de quoi encore ?

En tant que loueur de vélos depuis des années, vous avez acquis de l’intuition, aidée par le calendrier, les prévisions météo et une bonne connaissance du terrain pour prédire : «aujourd’hui, ça marchera ! »

Montagne de données

Si l’exemple est simple, les choses peuvent vite se compliquer s’il faut évaluer de manière fiable une multitude de paramètres influents. Les données récoltées aujourd’hui provien­nent de données simples de clients telle que l’adresse, l’âge, les statistiques de vente et de population. Mais les paramètres peuvent se multiplier, rendant les tenants et aboutissants difficiles à relier voire à comprendre.

Pour que cette montagne de données n’accouche pas d’une souris, des entreprises telle que Bytepocket se sont spécialisées dans une nouvelle discipline appelée « Data science ». La science de données recourt à différentes méthodes scientifiques – statistique, mathématique, informatique – mêlées aux connaissances du secteur pour analyser les données, pronostiquer les déroulements futurs et optimiser les processus actuels.

Des méthodes pour y parvenir, il en existe une panoplie depuis plus de trente ans, mais le fait que la science des données s’est élevée au rang de discipline tient beaucoup au fait que, grâce aux nouvelles technologies de l’information, on recueille toujours plus de données.

Informatique, statistique et ... 
un spécialiste

Que faire si des « data scientists » passent par chez vous ? Pour obtenir de bons résultats, il faut pouvoir marier trois disciplines : informatique, statistique et expérience du domaine. Si les deux premières peuvent être couvertes par une entreprise comme Bytepocket, la dernière doit obligatoirement provenir d’un spécialiste de l’entreprise. Son expérience en fait un important interlocuteur pour la compréhension des données disponibles ainsi que pour l’analyse des résultats. Avec l’aide des méthodes statistiques ainsi que la mise en action d’une « machine learning » (apprentissage automatique de l’in­telligence artificielle), on peut parvenir à un modèle, notamment pour trouver une concordance et définir quelles données ne sont pas pertinentes.

Pour revenir à notre exemple de location de vélos : les conditions météo ont sûrement une influence démon­trable sur la location, mais également des données auxquelles on pense moins, comme le taux d’occupation des trains CFF, une donnée disponi­ble. En revanche, la statistique de population l’est beaucoup moins. Et lorsqu’on a trouvé un modèle, on est en mesure de livrer des pronostics. Dans notre cas, en s’appuyant sur l’analyse, on pourrait démontrer comment les vélos doivent être répartis entre les différentes stations dépendamment du jour de la semaine. Certains lieux attirent plus de touristes, d’autres plus de citadins.

Mais à ce stade, une question importante se pose : la question initiale était-elle définie avec pertinence ? Chercher uniquement à travers les données pour trouver quelque chose mène souvent à l’échec. Pour Christopher Frank, auteur du livre « Drinking from the Fire Hose: Making Smarter Decisions With­out Drowning in Data », c’est le syndrome « Alice au pays des merveilles ». Lorsque Alice rencontre le chat du Cheshire et lui demande son chemin, celui-ci lui lance : « Cela dépend largement de là où vous voulez aller. » Comme Alice ne sait pas, le chat lui répond : « Alors, le chemin que vous aller pren­dre n’a pas d’importance. »

Selon un sondage du magazine an­glais The Economist, un tiers des entreprises en moyenne exploitent régulièrement leurs données pour prendre de grandes décisions. Dans le cas des PME, le taux est certainement bien plus bas encore. Or seule une bonne analyse des données et un pronostic adéquat représentent une base importante pour prendre des décisions commerciales offrant un avantage sur la concurrence.

Markus Schrüfer

Managing Partner

BytePocket GmbH

Für Vorteile
im Wettbewerb

Data Science

Viele Firmen sammeln schon heute viele Daten, verwenden sie aber nicht strukturiert. Eine sinnvolle Verwendung dieser Daten mit herkömmlichen Methoden ist bei grossen Mengen schwierig und nur auf den Ist-Zustand ausgerichtet. Mit Data Science können Muster gefunden und Prognosen für die Zukunft erstellt werden. Die Ergebnisse können einen wichtige Grundlage sein, um Wettbewerbsvorteile zu erreichen und neue Geschäftsideen zu validieren.

Avantageux
en concurrence

Data science

Si d‘innombrables entreprises collectent des données de toutes sortes, l‘utilisation qu‘elles en font n‘est pas toujours très structurée. Pour que cela fasse sens et que des contenus intelligents puissent être extraits des données, il faut sortir des méthodes traditionnelles. Les contenus tirés de ces données diverses doivent permettre de faire de réaliser des modèles prédictifs, sur lesquels une stratégie d‘entreprises sera déterminée, valable dans un contexte concurrentiel.

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Articles approfondis

Les plus consultés