Bölüm: Part 4: Data Acquisition and Preparation | WS25:Data Science for Digital Humanities | WueCampus

Takvim Useful links Course request

Bölüm anahatları

- Lecture content: Data collection and data acquisit... etkinliğini seçin
  
  Lecture content: Data collection and data acquisition: designing data collection surveys,
  collecting publicly available data from the web (scraping, public APIs), crowdsourcing;
  Types of data: structured, semi-structured, unstructured; Data preparation, preprocessing, and cleaning: error correction, deduplication, normalization, handling missing values;
  Data privacy and intellectual property rights.
  Tutorial content: Scraping and extracting public content from the Web (Python libraries: scrapy and tweepy); Data loading, organization, preparation, formatting, and manipulation (Python libraries: pandas);
  Homework: Usage scenario – Correction of object character recognition (OCR) errors
- Notebook: Acquistion and Preprocessing (HTML-Version) etkinliğini seçin
  
  Notebook: Acquistion and Preprocessing (HTML-Version) Dosya
- Dataset: Olympics etkinliğini seçin
  
  Dataset: Olympics Dosya

Impressum | Kontakt | Datenschutzerklärung - WueCampus | Erklärung zur Barrierefreiheit | Bildnachweise

Navigationsleiste - WueStudy: University icons created by justicon - Flaticon
Navigationsleiste - Rechenzentrum: Data center icons created by Eucalyp - Flaticon
Navigationsleiste - Website Support: Consultant icons created by Vitaly Gorbachev - Flaticon
Navigationsleiste - Häufige Fragen: Files and folders icons created by Freepik - Flaticon
Navigationsleiste - Lehre Digital: Training icons created by vectorspoint - Flaticon
Navigationsleiste - Forschung Digital: Research icons created by Eucalyp - Flaticon
Navigationsleiste - Lecture: Video icons created by Freepik - Flaticon
Navigationsleiste - Toolbox: Toolbox icons created by Freepik - Flaticon