›   Demo-PYx: Machine Learning mit Python

Machine Learning-Modelle und Algorithmen haben im weitesten Sinne das Ziel, aus Input-Daten sinnvolle Zusammenhänge zu erkennen und daraus Regeln abzuleiten. Z.B. Vorhersagen treffen, Trends erkennen, Daten nach bestimmten Kriterien gruppieren. Anwendungsgebiete sind die Vorausschauende Wartung: Fällt Maschine aus oder nicht?, Mobile Assistenten (Siri, Alexa, Cortana, Bixby, …), Betrugsaufdeckung: Ist E-Mail Spam oder nicht? oder Clusteranalysen im Rahmen des gezielten Marketings.

Die Demo- und Tutorial-Reihe rund um das Thema Machine Learning mit Python zeigt den Einstieg in Modelle und Algorithmen des Machine Learnings mit Hilfe der Programmiersprache Python und der Python-Pakete für Datenanalyse und Maschinelles Lernen.

Demo-PY1: Python-Tutorial bietet einen Einstieg in die Programmiersprache Python (Version 3.x). Nach einer kurzen Motivation folgt die Schritt-für-Schritt-Anleitung zur Installation von Python-Entwicklungsumgebungen und die ersten Codezeilen in Python.

Demo-PY1: Jupyter Notebook verwenden zeigt, wie man interaktive Jupyter Notebook-Skripte mit Markdown-Zellen und Codezellen erstellt. Jupyter Notebook ist eine webbasierte Umgebung, die das Erstellen, Dokumentieren und Teilen von Python- und R-Demonstratoren im Umfeld des Maschinellen Lernens unterstützt. Wir verwenden in dieser Tutorial-Reihe Jupyter Notebook, da die Machine Learning-Modellierung in einfache Schritte mit sichtbaren Zwischenergebnissen heruntergebrochen werden kann.

Demo-PY1: Jupyter Notebook Widgets erstellen zeigt, wie man in ein Jupyter Notebook-Skript Widgets einbaut, entweder explizit als Steuerelemente mit Eventhandling, oder implizit als Steuerelemente, die durch die interact()-Funktionalität mit einer benutzerdefinierten Funktion generiert werden.

Demo-PY2: Datenverwaltung und - Visualisierung mit Pandas zeigt am Beispiel eines Open Power System-Datensatzes wie die Datenstrukturen und Funktionen der Python-Bibliotheken Pandas und Matplotlib zur Datenaufbereitung und graphischen Darstellung großer Zeitreihen-Daten verwendet werden.

Demo-PY3: Clusteranalyse mit scikit-learn zeigt am Beispiel eines Mini-Datensatzes mit Raumklima-Messungen, wie eine Clusteranalyse mit Hilfe der Python-Bibliothek scikit-learn für maschinelles Lernen durchgeführt wird.

Demo-PY4: Predictive Maintenance mit scikit-learn zeigt, wie eine Ausfall-Prognose im Rahmen eines Predictive Maintenance-Szenarios mit Hilfe des Entscheidungsbaum-Verfahrens der Python-Bibliothek scikit-learn für maschinelles Lernen durchgeführt wird. Wir verwenden denselben Automobildatensatz, der in den Demos des Predictive Maintenance-Zyklus verwendet wird: eine csv-Datei automotive_data.csv mit 136 Beobachtungen. Die Fragestellung lautet: "Bei welcher Kombination von Merkmalen tritt ein Ausfall ein?".

Demo-PY5: Machine Learning-Modellierung mit Keras und Tensorflow zeigt die Erstellung und Verwendung eines Künstlichen Neuronalen Netzwerks für die Zeitreihenprognose von Stromverbrauchsdaten mit Hilfe der Python-Bibliotheken Keras und Tensorflow.

Autoren, Tools und Quellen

Mit Beiträgen von:
 Prof. Dr. Eva Maria Kiss
 M. Sc. Anke Welz
Tools:
Keras, Pandas, Tensorflow, Scikit-Learn, Python, Jupyter Notebook
Quellen und weiterführende Links
  Hochreiter, Sepp & Schmidhuber, Jürgen. (1997). Long Short-term Memory. Neural computation. 9. 1735-80.
  McKinney, Wes (2019): Datenanalyse mit Python. Auswertung von Daten mit Pandas, NumPy und IPython.
  Pouhela, Franc. (2020). Bachelorarbeit: Datenanalyse und Vorhersage mit Python und Keras für Open Power System-Daten.
  Russell, Stuart J., Norvig, Peter (2014) Artificial intelligence. A modern approach.