Zum Hauptinhalt springen
Bosch in Österreich
#TalkNerdyToMe

Alina Godun über Data Science bei Bosch

Junge Frau zeigt nach oben

Mit der Serie #TalkNerdyToMe stellen wir euch Fachleute aus verschiedenen Bereichen vor und geben einen Einblick in ihre Arbeit. Diesmal sprechen wir mit Alina Godun, Expertin für Data Science bei Bosch.

Hallo, Alina! Wir haben dich ausgewählt, weil du eine unserer Expert*innen bei Bosch im Entwicklungsbereich bist. Erzähl uns doch mehr zu dem Thema Data Science.

Der Bereich Data Science ist grundsätzlich eine sehr breit gefächerte Disziplin. Data Science ist ein Feld, das Statistik und Informationstechnologie verbindet, mit dem Ziel, Daten, die in verschiedensten Lebensbereichen produziert werden, zu extrahieren und einen übergeordneten Nutzen zu erzielen. Die Disziplin Data Science unterteilt sich in viele Subdisziplinen. Drei davon sind Machine Learning, Visualisierung und Data Engineering. Bei Machine Learning geht es beispielsweise um die verschiedenen Formen des automatisierten Lernens von Computeralgorithmen, die mithilfe von Modellierung unterschiedliche Bereiche der Welt abbilden. Machine Learning unterteilt sich wiederum in „supervised Learning” und „unsupervised Learning“.

Beim „supervised Learning“ gibt es einen bereits verarbeiteten und beschrifteten Datensatz (z.B. Tierfotos), bei dem jedes Element bereits kategorisiert ist (z.B. nach Tierart). Das Modell lernt, basierend auf diesen Informationen, die Unterschiede zwischen den Kategorien kennen und ist dadurch in der Lage, neue Daten zu kategorisieren. Der Nachteil bei diesem Verfahren ist, dass das Datenset vorab durch menschliche Arbeit bearbeitet werden muss. Da das Trainieren eines Modells auf einen Datensatz in der Regel mehrere Tausend Abgleichungsinstanzen braucht, beansprucht dieser Vorgang einen sehr hohen zeitlichen Aufwand.

Beim „unsupervised Learning“ haben wir unbeschriftete und nicht kategorisierte Datenmaterialien. Hier würde das Modell unterschiedliche Tierarten in unterschiedliche Cluster aufteilen. Erst die Analyse dieser Cluster würde ergeben, wie das Modell diese Tierarten kategorisiert hat – das kann auch manchmal sehr zufällig sein. Zum Beispiel kann es sein, dass das Modell Katzen und Hunde kategorisiert, es kann aber auch sein, dass das Modell schwarze Tiere kategorisiert, unabhängig von der Tierart.

Du hast uns jetzt den Begriff Data Science erklärt, kannst du uns sagen, warum das für die Zukunft wichtig ist?

Data Science birgt sehr hohes Potenzial für die Zukunft – vor allem im Zeitalter von „Big Data“. Wir produzieren als Gesellschaft Unmengen an Daten, die bislang nur unzureichend genutzt wurden. Die Analyse und Verarbeitung dieser Daten ermöglichen es jedoch, dass Prozesse optimiert werden und Ressourcen effizient eingesetzt werden können. Wenn man das auf das Unternehmen überträgt, bedeutet das, dass mithilfe von Data Sciene Probleme gelöst, Zusammenhänge erkannt und Prozesse verbessert werden können, die bisher nur durch manuelle Arbeit in aufwendigen Laborverfahren gemacht werden konnten. Durch Einsatz von Data Science werden Ressourcen des Menschen für Aufgaben reserviert, für die es tatsächlich eine menschliche Verständnistiefe benötigt. Dies ist nicht nur ressourcenschonend, sondern auch prozessoptimierend, weil Menschen dann für das Herausarbeiten von neuen Lösungen eingesetzt werden können. Data Science birgt viele Potentiale in Bezug auf Effizienzsteigerung und Prozessoptimierung mit sich. Nichtsdestotrotz haben Algorithmen und traditionelle Computersysteme ihre Grenzen und brauchen, um effektiv genutzt werden zu können, menschliche Bedienung. Metaphorisch gesprochen, hilft selbst das beste Werkzeug ohne einen erfahrenen Handwerker nichts. Daher: Menschen füttern Modelle mit entsprechenden Datensets und entscheiden, was mit den Analyseoutcomes in weiterer Folge passiert.

Was fasziniert dich an dem Thema am meisten?

Das klingt etwas nerdy, aber ich muss sagen, dass ich es sehr schön finde, wie gut selbst unstrukturierte Daten die Welt beschreiben und Data Science bei dem Verständnis der Daten und damit auch der Welt unterstützen kann. Die Welt scheint auf den ersten Blick sehr chaotisch und unvorhersehbar. Beginnt man jedoch diese zu analysieren, erkennt man, dass hinter diesen großen Datenmengen Regelmäßigkeiten stecken, die auf den ersten Blick nicht erkennbar sind. Ich spreche in diesem Zusammenhang gerne von versteckten Mustern, die aufzeigen, dass hinter den vermeintlich unbrauchbaren und chaotischen Daten eine Sinnhaftigkeit steht.

Was macht Bosch in dem Bereich?

Bosch beschäftigt sich sehr intensiv mit diesem Bereich. Data Science wird sowohl intern als auch extern genutzt, wobei unterschiedliche Richtungen wie Machine Learning und statistische Datenanalyse angewandt werden. Aus meiner Arbeit weiß ich, dass bestehende Daten aus Testverfahren auf Motorsteuergeräten verwendet werden, um sich einschleichende Fehler auszumerzen. Dadurch sollen Produkte und Lösungen optimiert werden. Beispielsweise werden Daten aus Tests auf Motorsteuergeräten mit Data Science analysiert, um die Qualität der Softwarelösungen zu verbessern und stärker am Kundennutzen auszurichten.

Was ich konkret mache, ist, Daten, die während Testfahrten mit dem Auto gesammelt wurden, anhand von explorativer Datenanalyse zu analysieren. Ich versuche dabei jene Daten zusammenzuführen und zu visualisieren, die darauf hinweisen, dass ein latentes Problem in der Software existiert. Ich arbeite momentan an einem Projekt mit, bei dem ein neuronales Netz entwickelt werden soll, das automatisiert Probleme in der Software erkennen kann. Neuronale Netze bestehen aus Algorithmen, die dem menschlichen Gehirn nachempfunden sind. Das abstrahierte Modell von millionenfach miteinander verbundenen Neuronen, ermöglicht es, komplexe Problemstellungen und Aufgaben aus dem Bereich Statistik, Informatik und Wirtschaft zu lösen. Konkret sollen in unserem Projekt neuronale Netzwerke dazu eingesetzt werden, um Anomalien auf den einzelnen Software-Komponenten der Steuergeräte zu erkennen. Ein möglicher Ansatz wäre es, das Verhalten einer spezifischen Software zu simulieren und mit dem tatsächlichen Software-Verhalten abzugleichen. Stellen wir Abweichungen fest, kann man von Softwarefehlern ausgehen.

Was muss man für deinen Job können?

Man benötigt technisches Know-how, vor allem gute Programmierkenntnisse. Für meinen Job brauche ich meist Python – dabei kommen verschiedene Data Science Frameworks zum Einsatz. Wichtig ist außerdem ein gutes Verständnis für Mathematik und Statistik: Wenn man nicht genau versteht, worauf die Datenanalyse aufbaut, dann kann man zwar oft fertige Lösungen nutzen, aber es geht mit Abstrichen in der Qualität der Lösungen einher.

Wir arbeiten viel im Team, das heißt, gute Kommunikationsfähigkeiten sind sehr wichtig. Oft muss man auch seine Ergebnisse an Stakeholder kommunizieren können, die nicht so tief im Thema sind, wie man selbst. Und eines kann ich noch mitgeben: Durchhaltevermögen ist essenziell. Manchmal ergeben die Daten auf den ersten Blick keinen Sinn, und man muss sich lange und intensiv damit beschäftigen, in den Austausch mit anderen gehen und neugierig bleiben. Mein Motto ist mittlerweile „stay curious and persistent“.

Welches Buzzword kannst du nicht mehr hören?

Das für mich persönlich nervigste Buzzword ist „künstliche Intelligenz“, weil es zwar gerne verwendet wird, es aber in den seltensten Fällen zu einer differenzierten Auseinandersetzung mit dem Thema kommt. Oft wird der Begriff „Neuronale Netzwerke“ statt „Machine Learning“ verwendet, was nicht ganz korrekt ist, da Neuronale Netwerke nur ein Teil von Machine Learning sind. Neuronale Netzwerke in Zusammenspiel mit Machine Learning werden oftmals als ,,magic man‘‘ wahrgenommen. Diese Teilaspekte künstlicher Intelligenz sind keine Blackbox, in die man Daten hineinwirft, um einen beliebigen Output zu erhalten. Hinter diesen Systemen stecken komplizierte Lernprozesse, die auf das Erreichen von vorab festgelegten Zielen ausgerichtet sind.

Erzähl uns eine Anekdote aus deiner Bosch-Zeit!

Als ich bei Bosch begonnen habe, war ich sehr schüchtern und nicht unbedingt das kommunikativste Teammitglied. Der Austausch mit den Kolleg*innen war eher formell, was wohl daran lag, dass ich mir damals noch eher unsicher in der deutschen Sprache war. Ein Kollege war aber sehr darauf bedacht, mich in das Team zu integrieren und hat mich immer wieder mit Witzen aus der Reserve gelockt. Das Highlight war für uns die „Oachkatzlschwoaf“-Challenge [Eichhörnchenschwanz-Challenge], in der ich gelernt habe, diesen Ausdruck fehlerfrei im österreichischen Dialekt auszusprechen.

Wer ist als Nächstes dran und mit welchem Thema?

Als nächstes wird Hubert Baumgartner über zukunfts- und kundenorientierte Softwareentwicklung berichten.

Teile diese Seite auf

Eine diverse Gruppe hält Schals in die Luft mit der Aufschrift „Join the Team“. Eine Person winkt die Betrachtenden hin zur Gruppe.

Work #LikeABosch – Jetzt bewerben