#-----------------------------------------------------------------------#
#                         VORLAGE R SCRIPT                                     #
#-----------------------------------------------------------------------#


# installieren von benötigten Packages
install.packages("tidyverse")
# -> tidyverse als Paket von Funktionen, welche im weiteren Verlauf des Tutoriums benötigt werden
# -> Muss nur einmal installiert werden, jedoch in jedem Skript erneut ausgeführt werden (siehe library Befehl)


# laden von benötigten Packages
library(tidyverse)
# -> zuvor installierte Packages müssen vor jedem Start neu aufgerufen werden mit der Funktion "library"


# setzen des Arbeitsverzeichnisses ("\" müssen durch "/" ersetzt werden)
setwd("hier den Pfad einsetzen")


#-----------------------------------------------------------------------#
#---                          AUFGABE 1                              ---#
#-----------------------------------------------------------------------#


#---  (i) 

# Einlesen des Datensatzes
handelsdaten <- read_csv("Handelsdaten.csv")
# -> Wir erstellen ein neues Objekt "handelsdaten"
# -> dem Objekt werden mit dem Zuweisungspfeil "<-" Werte zugewiesen. Hier der Datensatz "handelsdaten"
# -> Siehe global environment in R-Studio oben rechts
# -> 240 observations mit 4 variables (Land, Exporte, Importe, BIP)


#---  (ii)

# Importe: Mittelwert, Minimum, Maximum
summarize(handelsdaten, Mittelwert = mean(Importe), Min = min(Importe), 
          Max = max(Importe))
# -> Hierfür kann die summarize Funktion verwendet werden
# -> Zunächst muss der Datensatz ausgewählt werden, anschließend können durch mean, min, max etc. deskrptive Werte ausgegeben werden
# -> Wir betrachten hier die Importe näher


# Exporte: Mittelwert, Minimum, Maximum
summarize(handelsdaten, Mittelwert = mean(Exporte), Min = min(Exporte), 
          Max = max(Exporte))
# -> Attribut "Importe" wird nun durch "Exporte" ersetzt


# 10 wichtigste Importländer
# Sortieren des Datensatzes nach den Importen in absteigender Reihenfolge
handelsdaten <- arrange(handelsdaten, desc(Importe))
# -> arrange Funktion sortiert den Datensatz, mit desc in absteigender Reihenfolge


# Ausgabe der ersten 10 Zeilen des Datensatzes
head(handelsdaten, 10)
# -> Ausgabe in Console via head- Funktion
# -> ersetzen von 10 mit z.B. 5, dann würden lediglich die ersten 5 Zeilen des Datensatzes ausgegeben werden


# 10 wichtigste Exportländer
# -> Identisch wie zuvor, nur für Exporte
# Sortieren des Datensatzes nach den Exporten in absteigender Reihenfolge
handelsdaten <- arrange(handelsdaten, desc(Exporte))


# Ausgabe der ersten 10 Zeilen des Datensatzes
head(handelsdaten, 10)


#---  (iii)

# Summe der Importe 
gesamt_importe <- summarize(handelsdaten, gesamt_importe = sum(Importe))
# -> Wir erstellen ein neues Objekt "gesamt_importe"
# -> dem Objekt werden mit dem Zuweisungspfeil "<-" Werte zugewiesen
# -> sum(Importe) summiert alle Werte aus der Spalte Importe


# Summe der Exporte
gesamt_exporte <- summarize(handelsdaten, gesamt_exporte = sum(Exporte))
# -> analoges Vorgehen für Exporte 


# Handelsbilanz in Mrd Euro
(gesamt_exporte - gesamt_importe)*10^(-6)
# -> Darstellung in Mrd. via *10^(-6) multiplikation


#-----------------------------------------------------------------------#
#---                          AUFGABE 2                              ---#
#-----------------------------------------------------------------------#


#---  (i)

# Gesamtes Handelsvolumen
handelsdaten <- mutate(handelsdaten, Handel = (Importe + Exporte)*10^(-6))
# -> Funktion mutate erstellt eine neue Spalte innerhalb des bestehenden Datensatzes "handelsdaten"
# -> Spalte "Handel" ist dabei definiert als Summe von Importen und Exporten in Mrd. Euro


# Behalten der Länder mit einem Handelsvolumen mit Deutschland von mehr
# als 30 Mrd. Euro
handelsdaten <- filter(handelsdaten, Handel > 30)
# -> Mit der Funktion filter können bestimmte Werte innerhalb des Datensatzes selektiert werden
# -> In unserem Fall lediglich Länder mit einem Handelsvolumen größer als 30 Mrd. 


#---  (ii)

# Sortieren des Datensatzes nach dem Handelsvolumen in aufsteigender 
# Reihenfolge
handelsdaten <- arrange(handelsdaten, Handel)
# -> erneut arrange Funktion, diesmal Spalte Handel (siehe oben)
# -> Sortierung nun in aufsteigender Reihenfolge, da wir den Teil "desc" nicht benutzen


# Verknüpft die Sortierung mit der Variable "Land"
handelsdaten <- mutate(handelsdaten, Land = factor(Land, Land))
# -> ohne factor Verknüpfung erfolgt die Darstellung in alphabetischer Reihenfolge
# -> mit factor Bezug werden nun die Länder nach den Werten des Handelsvolumens sortiert


# Balkendiagramm, welches das Handelsvolumen zwischen Deutschland und 
# seinen 20 wichtigsten Handelspartnern abbildet
ggplot(handelsdaten, mapping = aes(x = Land, y = Handel)) +
  geom_bar(stat = "identity") + coord_flip()
# -> ggplot als Funktion zur Erstellung von Graphiken
# -> geom_bar erstellt ein Balkendiagramm
# -> In Fenster links unten werden nun die Handelspartner Deutschlands in aufsteigender Reihenfolge dargestellt
# -> Folglich kann erkannt werden, dass DE das größte Handelsvolumen mit China besitzt


#---  (iii)

# Korrelation zwischen dem BIP und dem Handelsvolumen
summarize(handelsdaten, Korrelation = cor(BIP, Handel))
# -> Korreltaion von 0.595 zeigt, dass das BIP und Handelsvolumen eine positive Korrelation aufweisen (jedoch keine 1 zu 1 Beziehung)


# Erstellen der logarithmierten Variablen
handelsdaten <- mutate(handelsdaten, ln_Handel = log(Handel))
handelsdaten <- mutate(handelsdaten, ln_BIP = log(BIP))
# -> Es werden zwei neue Spalten in den Datensatz hinzugefügt, wir logarithmieren die Werte Handel und BIP 
# -> Verwendung von logarithmus zur Vereinfachung der Graphik und Ablesung von Wachstumsrate


# Punktliniendiagramm mit BIP auf der X-Achse und Handelsvolumen auf der # Y-Achse
ggplot(handelsdaten, mapping = aes(x = ln_BIP, y = ln_Handel)) +
  geom_point() + geom_text(aes(label = Land), size = 3) 
# -> nun wird mit geom_point ein Punktdiagramm erstellt
# -> geom_text beschriftet Punkte mit dem label "Land"
# -> Zieht man eine imaginäre Linie aus dem Ursprung nach rechts oben kann man die positive Korrelation erkennen
# -> Bsp.: China und USA mit hohem BIP sowie Handelsvolumen