#-----------------------------------------------------------------------# # VORLAGE R SCRIPT # #-----------------------------------------------------------------------# # installieren von benötigten Packages install.packages("tidyverse") # -> tidyverse als Paket von Funktionen, welche im weiteren Verlauf des Tutoriums benötigt werden # -> Muss nur einmal installiert werden, jedoch in jedem Skript erneut ausgeführt werden (siehe library Befehl) # laden von benötigten Packages library(tidyverse) # -> zuvor installierte Packages müssen vor jedem Start neu aufgerufen werden mit der Funktion "library" # setzen des Arbeitsverzeichnisses ("\" müssen durch "/" ersetzt werden) setwd("hier den Pfad einsetzen") #-----------------------------------------------------------------------# #--- AUFGABE 1 ---# #-----------------------------------------------------------------------# #--- (i) # Einlesen des Datensatzes handelsdaten <- read_csv("Handelsdaten.csv") # -> Wir erstellen ein neues Objekt "handelsdaten" # -> dem Objekt werden mit dem Zuweisungspfeil "<-" Werte zugewiesen. Hier der Datensatz "handelsdaten" # -> Siehe global environment in R-Studio oben rechts # -> 240 observations mit 4 variables (Land, Exporte, Importe, BIP) #--- (ii) # Importe: Mittelwert, Minimum, Maximum summarize(handelsdaten, Mittelwert = mean(Importe), Min = min(Importe), Max = max(Importe)) # -> Hierfür kann die summarize Funktion verwendet werden # -> Zunächst muss der Datensatz ausgewählt werden, anschließend können durch mean, min, max etc. deskrptive Werte ausgegeben werden # -> Wir betrachten hier die Importe näher # Exporte: Mittelwert, Minimum, Maximum summarize(handelsdaten, Mittelwert = mean(Exporte), Min = min(Exporte), Max = max(Exporte)) # -> Attribut "Importe" wird nun durch "Exporte" ersetzt # 10 wichtigste Importländer # Sortieren des Datensatzes nach den Importen in absteigender Reihenfolge handelsdaten <- arrange(handelsdaten, desc(Importe)) # -> arrange Funktion sortiert den Datensatz, mit desc in absteigender Reihenfolge # Ausgabe der ersten 10 Zeilen des Datensatzes head(handelsdaten, 10) # -> Ausgabe in Console via head- Funktion # -> ersetzen von 10 mit z.B. 5, dann würden lediglich die ersten 5 Zeilen des Datensatzes ausgegeben werden # 10 wichtigste Exportländer # -> Identisch wie zuvor, nur für Exporte # Sortieren des Datensatzes nach den Exporten in absteigender Reihenfolge handelsdaten <- arrange(handelsdaten, desc(Exporte)) # Ausgabe der ersten 10 Zeilen des Datensatzes head(handelsdaten, 10) #--- (iii) # Summe der Importe gesamt_importe <- summarize(handelsdaten, gesamt_importe = sum(Importe)) # -> Wir erstellen ein neues Objekt "gesamt_importe" # -> dem Objekt werden mit dem Zuweisungspfeil "<-" Werte zugewiesen # -> sum(Importe) summiert alle Werte aus der Spalte Importe # Summe der Exporte gesamt_exporte <- summarize(handelsdaten, gesamt_exporte = sum(Exporte)) # -> analoges Vorgehen für Exporte # Handelsbilanz in Mrd Euro (gesamt_exporte - gesamt_importe)*10^(-6) # -> Darstellung in Mrd. via *10^(-6) multiplikation #-----------------------------------------------------------------------# #--- AUFGABE 2 ---# #-----------------------------------------------------------------------# #--- (i) # Gesamtes Handelsvolumen handelsdaten <- mutate(handelsdaten, Handel = (Importe + Exporte)*10^(-6)) # -> Funktion mutate erstellt eine neue Spalte innerhalb des bestehenden Datensatzes "handelsdaten" # -> Spalte "Handel" ist dabei definiert als Summe von Importen und Exporten in Mrd. Euro # Behalten der Länder mit einem Handelsvolumen mit Deutschland von mehr # als 30 Mrd. Euro handelsdaten <- filter(handelsdaten, Handel > 30) # -> Mit der Funktion filter können bestimmte Werte innerhalb des Datensatzes selektiert werden # -> In unserem Fall lediglich Länder mit einem Handelsvolumen größer als 30 Mrd. #--- (ii) # Sortieren des Datensatzes nach dem Handelsvolumen in aufsteigender # Reihenfolge handelsdaten <- arrange(handelsdaten, Handel) # -> erneut arrange Funktion, diesmal Spalte Handel (siehe oben) # -> Sortierung nun in aufsteigender Reihenfolge, da wir den Teil "desc" nicht benutzen # Verknüpft die Sortierung mit der Variable "Land" handelsdaten <- mutate(handelsdaten, Land = factor(Land, Land)) # -> ohne factor Verknüpfung erfolgt die Darstellung in alphabetischer Reihenfolge # -> mit factor Bezug werden nun die Länder nach den Werten des Handelsvolumens sortiert # Balkendiagramm, welches das Handelsvolumen zwischen Deutschland und # seinen 20 wichtigsten Handelspartnern abbildet ggplot(handelsdaten, mapping = aes(x = Land, y = Handel)) + geom_bar(stat = "identity") + coord_flip() # -> ggplot als Funktion zur Erstellung von Graphiken # -> geom_bar erstellt ein Balkendiagramm # -> In Fenster links unten werden nun die Handelspartner Deutschlands in aufsteigender Reihenfolge dargestellt # -> Folglich kann erkannt werden, dass DE das größte Handelsvolumen mit China besitzt #--- (iii) # Korrelation zwischen dem BIP und dem Handelsvolumen summarize(handelsdaten, Korrelation = cor(BIP, Handel)) # -> Korreltaion von 0.595 zeigt, dass das BIP und Handelsvolumen eine positive Korrelation aufweisen (jedoch keine 1 zu 1 Beziehung) # Erstellen der logarithmierten Variablen handelsdaten <- mutate(handelsdaten, ln_Handel = log(Handel)) handelsdaten <- mutate(handelsdaten, ln_BIP = log(BIP)) # -> Es werden zwei neue Spalten in den Datensatz hinzugefügt, wir logarithmieren die Werte Handel und BIP # -> Verwendung von logarithmus zur Vereinfachung der Graphik und Ablesung von Wachstumsrate # Punktliniendiagramm mit BIP auf der X-Achse und Handelsvolumen auf der # Y-Achse ggplot(handelsdaten, mapping = aes(x = ln_BIP, y = ln_Handel)) + geom_point() + geom_text(aes(label = Land), size = 3) # -> nun wird mit geom_point ein Punktdiagramm erstellt # -> geom_text beschriftet Punkte mit dem label "Land" # -> Zieht man eine imaginäre Linie aus dem Ursprung nach rechts oben kann man die positive Korrelation erkennen # -> Bsp.: China und USA mit hohem BIP sowie Handelsvolumen