Abschnitt Name Beschreibung
Part 1: Introduction to Data Science for Humanities Datei Notebook: Python-Basics (HTML-Version)
Datei Kick-off slides
Part 2: (Re-)introduction to Python Datei Notebook: Basics 2 (HTML-Version)
Part 3: Data modeling for data science Datei Notebook: Numpy (HTML-Version)
Datei Solution: Bag-of-words
Datei Solution: Python basics
Part 4: Data Acquisition and Preparation Datei Notebook: Acquistion and Preprocessing (HTML-Version)
Datei Dataset: Olympics
Part 5: Explorative Analysis 1 – Descriptive Analysis and visualization Datei Notebook: Descriptive Statistics (HTML-Version)
Datei Notebook: Deep-dive into Seaborn (HTML-Version)
Part 6: Explorative Analysis 2 – Clustering and distance functions Datei Notebook: Clustering and Distance Functions (HTML)
Datei Notebook: Clustering and distance function (.ipynb)
Part 7: Predictive Analysis (A Gentle Introduction to Machine Learning) Datei Notebook: Classification (.ipynb)
Datei Data: reviews_train.csv
Datei Data: reviews_text.csv
Datei Text Classification and Clustering: Slides
Part 8: Text and Language I (Computational Linguistics) Datei Notebook: Text Processing
Datei Slides: Lexical Semantics
Datei Slides: Text Representations
Datei Slides: Information Extraction
Datei Data: Unlabeled Reviews