Was ist eigentlich Data Science?

Data Analytics, Machine Learning, Artificial Intelligence, Business Intelligence – viele Begriffe werden synonym verwendet, obwohl sie sich teilweise klar voneinander unterscheiden. Je nach Sprachraum und Branche unterscheiden sich allerdings schon die “allgemeinen” Definitionen, sodass es nicht verwundert, dass manch einer den Durchblick verliert. Auch wir können nicht die ultimative Definition liefern, aber dennoch eine Beschreibung dessen geben, was wir darunter verstehen und warum es wichtig ist, die Bereiche abzugrenzen. Denn nur mit einer Abgrenzung ist es möglich den Mehrwert zu erkennen, wenn die Disziplinen miteinander kombiniert werden. Denn genau das ist es, was in der Praxis tatsächlich passiert – und dann wird es erst richtig spannend.

 

Data Science ist ein umfassender Begriff für die Wissenschaft, die sich mit Daten beschäftigt. Ein Data Scientist beschäftigt sich vorwiegend mit der Disziplin des Maschine Learnings. Hier geht es darum aus Daten noch mehr zu machen, als sie “nur” zu analysieren. Im ersten Schritt werden die Daten aufbereitet (Data Preparation and Cleanup). Machine Learning beinhaltet diverse Techniken, die zum Beispiel dazu verwendet werden können, basierend auf den bekannten Daten Voraussagen  für die Zukunft zu machen, auch wenn künftige Daten noch völlig unbekannt sind. Des Weiteren kann mittels Clustering herausgefunden werden, wie ähnlich sich Daten sind und somit Korrelationen festzustellen, die im ersten Moment nicht ersichtlich sind. Das ist nun der “künstlich intelligente” Teil im Prozess, noch ganz ohne Roboter und selbst denkenden Maschinen. Ein Data Scientist arbeitet dabei oft ohne konkrete Fragestellung, da noch gar nicht bekannt ist, was überhaupt gesucht oder gefragt ist. 

 

Data Analytics ist eine weitere wichtige Teildisziplin innerhalb von Data Science, welche dazu dient Erkenntnisse und Muster in historischen Daten herauszufinden. Ein Data Analyst arbeitet dabei vorwiegend mit strukturierten oder vom Scientist aufbereiteten Daten , um Datasets so zu kombinieren, dass daraus Korrelationen und wichtige Insights gewonnen werden können.

 

Den Bogen zum eigentlichen Geschäft ist nun über die Business Intelligence zu schlagen. BI-Spezialisten nutzen die aufbereiteten Daten, um Business-relevante Schlussfolgerungen zu ziehen, zu präsentieren und daraus resultierende Aktionen einzuleiten. Hier geht es um die Erstellung von Reports und Dashboards für jenes Publikum, welches schlussendlich an den relevanten Erkenntnissen interessiert ist und Entscheidungen für das Unternehmen treffen kann.

DataScience Roles
Date Science und ihre Rollen

Die Zusammenarbeit dieser unterschiedlichen Rollen ist insofern wichtig, dass sie sich gegenseitig unterstützen und dienen. So kann ein BI-Spezialist seine Arbeit nicht machen, wenn die Daten nicht aufbereitet, gesäubert und aggregiert worden sind. Ein Data Scientist, normalerweise ein Statistiker, Mathematiker oder Informatiker, benötigt auf der anderen Seite Domain-Wissen, welches ihm bei der Bewältigung komplexer Datenset helfen soll.

 

Mit den Services von lutra analytics unterstützen wir Sie gerne in Ihren Prozessen in der Welt der Data Science.