Schlüsseldisziplin für Wissenschaft und Wirtschaft

Ein Expertenbeitrag von Prof. Dr. Ulf Brefeld, Plattform Lernende Systeme

Der Bedarf an Data Scientists, die große Datenmengen generieren und analysieren können, steigt. Welche Kompetenzen gefragt sind, wie diese Fähigkeiten an Hochschulen zu vermitteln sind und warum dabei von ganz unterschiedlichen Zielgruppen auszugehen ist.

Ulf Brefeld (© Leuphana Universität Lüneburg)

Daten sind heute ein zentraler Rohstoff in Wissenschaft und Praxis. So ermöglicht etwa die zweckorientierte Analyse großer Datenmengen – unter anderem mit Methoden der künstlichen Intelligenz (KI) und des maschinellen Lernens – neue Erkenntnisse, bietet Entscheidungshilfen und Wettbewerbsvorteile. Das relativ neue Wissenschaftsfeld Data Science, das an der Schnittstelle zwischen den verschiedenen wissenschaftlichen Disziplinen und konkreten Anwendungsbereichen angesiedelt ist, gilt daher sowohl in den (angewandten) Wissenschaften als auch in der Wirtschaft als eine der Schlüsseldisziplinen unserer Zeit. So werden Data Scientists, die große Datenmengen erheben, verarbeiten und analysieren, in Wissenschaft und Unternehmen dringend gesucht. Künftig soll Data Science daher vor allem in den Hochschulen zu einem zentralen Wissenschaftsfeld ausgebaut werden.

Bedeutung des Berufsbildes und steigender Bedarf

Data Science ist ein Sammelbegriff für die Arbeit mit Daten. Diese reicht von effizienten Datenbanken und -strukturen, Vorverarbeitungen und Merkmalsextraktion über (KI-basierte) Datenanalyse bis hin zu Visualisierung und Interpretationen der Ergebnisse. Als interdisziplinäres Wissenschaftsfeld ermöglicht Data Science durch die Verwendung wissenschaftlich fundierter Methoden, Prozesse, Algorithmen und Systeme die Ableitung von Erkenntnissen und Mustern aus strukturierten und unstrukturierten Daten.

In der Wissenschaft beschäftigt sich Data Science mit unterschiedlichen Teilbereichen und kann daher vor dem Hintergrund verschiedener akademischer Disziplinen betrieben werden, etwa Informatik, Statistik, Mathematik, Natur- oder Wirtschaftswissenschaften. Dazu gehören auch das maschinelle Lernen, statistisches Lernen, Programmierung, Datentechnik, Mustererkennung, Prognostik sowie die Modellierung von Unsicherheiten und Datenspeicherung. Dabei nimmt Data Science nicht die Daten selbst in den Fokus, sondern die Art und Weise, wie diese verarbeitet, aufbereitet und analysiert werden.

Die Bedeutung des Berufsbildes „Data Scientist“ hängt vor allem mit der weiter fortschreitenden digitalen Transformation unserer Gesellschaft und verbesserten Methoden der künstlichen Intelligenz zusammen: Es werden täglich unvorstellbar große Mengen an neuen Daten generiert – angefangen von Satellitenbildern, die zur Erde gefunkt werden, bis hin zu Urlaubsfotos auf Social-Media-Plattformen. Die Möglichkeiten, aus diesen (heterogenen) Daten Mehrwerte zu schaffen, sind riesig. Zum Beispiel haben sich Straßenkarten durch die Aggregation von weiteren Datenquellen zu Navigationssystemen und Restaurantführern weiterentwickelt. Die Kompetenzen zur Verarbeitung großer Datenmengen müssen an Universitäten und Hochschulen auch über eiterbildungsangebote vermittelt werden. Der schnelle Ausbau von Aus- und Weiterbildungsangeboten ist dringend nötig, denn ein Blick in die Stellenbörsen verdeutlicht, dass Data Scientists in allen wissenschaftlichen Disziplinen und wirtschaftlichen Unternehmen gebraucht werden, die Daten erheben und analysieren.

Kompetenzen passend zu konkreten Aufgaben vermitteln

Inzwischen existieren zwar national und international einige Data-Science-Studiengänge auf Bachelor- und Master-Niveau. Der aktuelle Bedarf kann aber allein dadurch nicht gedeckt werden. Wichtig sind insbesondere dedizierte Weiterbildungsprogramme, damit sich Beschäftigte in Unternehmen und Arbeitssuchende entsprechend weiterqualifizieren können.

Welche Kompetenzen im Einzelnen zu stärken sind und welche verschiedenen Zielgruppen dabei adressiert werden sollten, hat die Gesellschaft für Informatik e.V. (GI) in einer interdisziplinären Arbeitsgruppe unter Mitwirkung der Plattform Lernende Systeme erarbeitet. Innerhalb der Studie formulieren wir verschiedene Kompetenzfelder als Lern- und Ausbildungsinhalte: Grundlagen der Mathematik und Statistik, fortgeschrittene Mathematik und Statistik, Grundlagen der Informatik, fortgeschrittene Informatik, Kryptografie und Sicherheit, Datenethik und Data Privacy, Data Governance, Datenintegration, Datenvisualisierung, Data Mining, maschinelles Lernen, Deep Learning, Business Intelligence, domänenspezifische Anwendungen sowie Kommunikation mit Fachexperten und Implementierung von Data Science in der Organisation. Solide Kenntnisse in Mathematik, Statistik und Informatik bilden immer die Grundlage eines Data Scientists, darauf bauen dann weiterführende Themen wie Datenbanken, künstliche Intelligenz und maschinelles Lernen auf.

Verschiedene Zielgruppen identifizieren und adressieren

In welcher Tiefe die Inhalte der einzelnen Kompetenzfelder vermittelt werden müssen sowie die richtige Mischung der einzelnen Komponenten hängt von den jeweiligen Zielgruppen und der fachlichen Ausrichtung der Studierenden ab. So bringen etwa Studierende sozial- oder ingenieurswissenschaftlicher Studiengänge unterschiedliche Voraussetzungen in ein aufbauendes Data-Science-Studium mit – und werden nach ihrem Studium auch an sehr unterschiedlichen Fragestellungen und mit verschiedenen Datentypen arbeiten. Diese Differenzierungen sollten in einem Data-Science-Studium berücksichtigt werden, um genau die Spezialisten auszubilden, die benötigt werden.

In der Studie „Data Science: Lern- und Ausbildungsinhalte“ definieren wir dafür drei verschiedene Personengruppen, die stellvertretend für die unterschiedlichen Voraussetzungen und Aspekte in der akademischen Ausbildung stehen und denen jeweils konkrete Lerninhalte zugeschrieben werden. Diese drei Personas repräsentieren verschiedene Zielgruppen mit unterschiedlichen Bildungsbiografien:

  • Persona A besitzt beispielsweise einen Bachelor in Informatik, Mathematik/Statistik oder Data Science und verfügt damit über nachweisbare Kenntnisse in Statistik, Information Engineering oder zu künstlicher Intelligenz. Sie strebt einen Master in Data Science an, um später als Data Scientist in der Forschung oder Entwicklung zu arbeiten.
  • Persona B verfügt dagegen über einen Bachelor in einer Domänenwissenschaft – sei es in einem technischen, naturwissenschaftlichen oder auch geisteswissenschaftlichen Fach – und möchte Data-Science-Kompetenzen für diese Domäne erwerben.
  • Persona C steht anders als die beiden ersten Personengruppen mitten im Beruf und kann einschlägige informatische Kenntnisse nachweisen. Ihr Ziel ist es, Data-Science-Kompetenzen für die praktische Anwendung im Job zu erwerben.

Am interessantesten erscheint die zweite Personengruppe, die über ein fachspezifisches Grundstudium außerhalb der grundlegenden Data-Science-Disziplinen verfügt. Eine Person mit einem nicht technischen BA-Studium könnte die Ausbildung zum Beispiel mit einem anschließenden Data-Science-Masterstudium ergänzen. Durch den Bachelor bringt die Person fachspezifische Grundlagen mit, durch den Data-Science-Master auch methodisch-technische Fähigkeiten. Personen mit beiden Kompetenzen haben eine Schnittstellenfunktion, da sie quasi beide Sprachen sprechen und den Transfer neuer datengetriebener Techniken und Methoden in das Fach leisten. Problematisch ist für die Hochschulen und Universitäten jedoch, dass diese Personen durch die unterschiedlichen BA-Studiengänge auch sehr unterschiedliche Grundlagenkenntnisse mitbringen. Die Heterogenität der Studierenden muss bereits bei der Konzeption des Data-Science-Masters berücksichtigt werden, etwa durch Zulassungstests oder begleitende Data-Literacy-Veranstaltungen im Grundstudium.

Data-Science-Kompetenzen in Weiterbildungsprogramme integrieren

Aktuell ist der Bedarf an Data Scientists so hoch, dass er nicht allein durch die Hochschulausbildung gedeckt werden kann. Daher sind Weiterbildungsprogramme wichtig, mit denen sich Beschäftigte in Unternehmen und Arbeitssuchende entsprechend qualifizieren können. Diese Zielgruppe hat jedoch wieder ein anderes Profil als die vorherigen Personas: Durch eine Tätigkeit in der Praxis sind vielleicht die theoretischen Grundlagen etwas verloren gegangen und durch langjährige Expertise in praktischer Softwareentwicklung ersetzt worden. Obwohl die Karriere der Data-Science-Disziplin erst am Anfang steht, sind die Anforderungen an Datenwissenschaftlerinnen und -wissenschaftler heute schon sehr vielfältig. Und sie werden in Zukunft an Komplexität und Spezifizierung noch zunehmen – unabhängig davon, dass viele der aktuellen Tätigkeiten eines Data Scientists voraussichtlich eine weitere softwarebasierte Automatisierung erfahren werden. Gleichzeitig wird die Bedeutung von Data Science in den unterschiedlichen Anwendungsfeldern durch die fortschreitende Digitalisierung aller Lebensbereiche und verbesserte Methoden der künstlichen Intelligenz wachsen und zu einem weiter steigenden Bedarf an Expertise in diesem Bereich führen.

Um dem Bedarf an Data Scientists entgegenzutreten und das volle Potenzial freizusetzen – insbesondere für nicht technische Fächer – müssen alle Universitäten und Hochschulen Data-Science-Studiengänge einführen.

Gastbeitrag erschienen in:

DUZ - Magazin für Wissenschaft und Gesellschaft
Ausgabe 3/2020

Zurück