Workshop “Einführung in die Datenanalyse mit R” (Post and Slides in German)


Last weekend, I gave a 1.5 day workshop for students at my university on data analysis using R. In this post I briefly share my experience along with the workshop slides and an example project – both of which are in German. If you are looking for an English introduction into R, have a look at Hadley Wickham’s excellent “R 4 Data Science”, which you can find here.

In unserem Psychologie-Studiengang wird, wie an vielen andere Unis auch, der Umgang mit SPSS gelehrt. Dabei liegt der Fokus im Wesentlichen auf der Anwendung der gängigen Hypothesentests über die Menüs. R wurde bisher nur mal am Rande erwähnt – als Alternative wenn die Fragestellungen etwas anspruchsvoller werden. Im Rahmen der Open Science-Diskussionen ist R aber auch zu einem wichtigen Baustein geworden, wenn es um reproduzierbare Analysen und Nutzung freier Software geht.

Letztes Wochenende habe ich nun, nach Anfrage unserer Fachschaft, einen kurzen, anderthalbtägigen R-Workshop gegeben. Es war mein erster Workshop zu diesem Thema – aber hoffentlich nicht der letzte. Es hat viel Spaß gemacht und ich hab einiges mitgenommen, was ich bei einem nächsten Workshop anders machen würde:

  • Das Vorwissen war sehr, sehr unterschiedlich – während manche bereits Analysen mittels R gerechnet haben, hatten andere noch überhaupt keine Erfahrung. Darüber hinaus waren die Lernkurven sehr, sehr unterschiedlich – das macht es erstaunlich schwierig, alle auf einem Level mitzunehmen – ohne gleichzeitig die Schnellen zu langeweilen.
  • Base R ist wichtig, wenn man ein tiefes Verständnis der technischen Grundlagen erlangen möchte. Beim nächsten Workshop würde ich das tidyverse als Grundlage für Datenflows früher unterbringen und als zentrales Werkzeug vorstellen. Daten filtern, Spalten auswählen und umbenennen – all diese grundlegenden Schritte sind im tidyverse viel einfacher zu erledigen und man kann sich viel Reden über Matrizen-Syntax und Slicing sparen.
  • Ich hatte gebeten, dass jeder eigene Daten mitbringen soll. Meine Idee war, alle früh an die eigenen Daten zu lassen, damit das Erlernte direkt umgesetzt werden kann. Leider hat sich das als sehr schwierig erwiesen: Zum Teil waren das sehr komplexe Datensätze mit mehreren hundert Spalten, samt Sonderzeichen. Auch wenn sich an den Grundbausteinen dabei wenig ändert (trotz der vielen Variablen standen oft nur wenige im Fokus der Analyse), erschlägt einen das am Anfang möglicherweise.
  • Der erste Tag wäre für viele sicherlich noch hilfreicher gewesen, wenn das gemeinsam bearbeitete Beispiel vom zweiten Tag schon am ersten Nachmittag durchgesprochen worden wäre. Wenn man eine komplette Analyse zusammen durchgeht, werden viele der theoretisch besprochenen Bausteine einfacher verständlich.

Insgesamt war das Feedback dennoch sehr gut und zumindest bei einigen hat man ein kurzes Aufleuchten von Begeisterung sehen können. Man glaubt es ja kaum, aber R kann tatsächlich Spaß machen!

Meine Folien gibt es hier (Tag 1, Tag 2) und ein Beispielprojekt für RStudio habe ich ebenfalls angelegt. Die Materialien stehen unter der CC-BY-NC-SA 4.0 International-Lizenz.


Leave a Reply

Your email address will not be published. Required fields are marked *