Sección Nombre Descripción
Part 1: Introduction to Data Science for Humanities Archivo Notebook: Python-Basics (HTML-Version)
Archivo Kick-off slides
Part 2: (Re-)introduction to Python Archivo Notebook: Basics 2 (HTML-Version)
Part 3: Data modeling for data science Archivo Notebook: Numpy (HTML-Version)
Archivo Solution: Bag-of-words
Archivo Solution: Python basics
Part 4: Data Acquisition and Preparation Archivo Notebook: Acquistion and Preprocessing (HTML-Version)
Archivo Dataset: Olympics
Part 5: Explorative Analysis 1 – Descriptive Analysis and visualization Archivo Notebook: Descriptive Statistics (HTML-Version)
Archivo Notebook: Deep-dive into Seaborn (HTML-Version)
Part 6: Explorative Analysis 2 – Clustering and distance functions Archivo Notebook: Clustering and Distance Functions (HTML)
Archivo Notebook: Clustering and distance function (.ipynb)
Part 7: Predictive Analysis (A Gentle Introduction to Machine Learning) Archivo Notebook: Classification (.ipynb)
Archivo Data: reviews_train.csv
Archivo Data: reviews_text.csv
Archivo Text Classification and Clustering: Slides
Part 8: Text and Language I (Computational Linguistics) Archivo Notebook: Text Processing
Archivo Slides: Lexical Semantics
Archivo Slides: Text Representations
Archivo Slides: Information Extraction
Archivo Data: Unlabeled Reviews