Bei der R Programmierung geht es um die Anwendung eines kostenlosen Statistik-Programmes, welches über eine eigene Programmiersprache namens R gesteuert wird. (Die kommerzielle Version von R heißt S.)

Im Folgenden erhalten Sie eine kurze Einführung in die R-Programmierung.

Sollten Sie Hilfe beim R Programmieren benötigen, helfen unsere Statistiker Ihnen gerne weiter. Nutzen Sie einfach unser Kontaktformular für eine kostenlose Beratung & ein unverbindliches Angebot – oder rufen Sie uns an.

Lassen Sie uns Ihre Anforderungen wissen & wir erstellen Ihnen innerhalb weniger Stunden ein kostenfreies Angebot.

Jetzt unverbindlich anfragen

In diesem Artikel geht es um folgende Themen:

  • Wie lernt man die R Programmierung?
  • Die Grundlagen: Datentypen in R und Wertzuweisungen
  • Die wichtigsten Befehle der R-Programmierung
  • Befehlseingabe über die Konsole
  • Skripte
  • Kontrollstrukturen
  • Wo finde ich Hilfe, wenn ich nicht weiter weiß?

Wie lernt man, wie man in R programmieren sollte?

Das sog. R Programming ist eine eigene Programmiersprache, die durch ihre Datentypen, Befehle und Regeln definiert ist. Wenn Sie bereits andere Programmiersprachen beherrschen, ist das Erlernen von R sehr einfach. Möchten Sie sich für den Umgang mit R Hilfe einholen, dann sollten Sie einen Statistik Kurs belegen oder Statistik Nachhilfe beanspruchen. Kostenlose Selbstlernkurse und Handbücher gibt es genügend im Internet.
Beispielsweise bei Coursera finden Sie einen englischsprachigen Data Science Kurs der John Hopkins Universität.

Die Grundlagen: Datentypen in R und Wertzuweisungen

In R gibt es dieselben Datentypen wie in anderen Programmiersprachen auch:

  • integer (natürliche Zahlen)
  • numeric (Zahlen mit Nachkommastellen)
  • complex
  • character (Text)
  • logical (die nur zwei Werte annehmen: TRUE und FALSE, also wahr und falsch)

Wertzuweisungen erfolgen über einen Pfeil, also a <- 5 weist der Variablen a den Wert 5 zu. Dabei muss a nicht wie in anderen Programmiersprachen zuvor definiert werden. Sie können beliebig neue Variablen verwenden. Sie müssen jedoch auf den Daten-Typ achten. Manche Operationen oder Funktionen führen je nach Datentyp zu unterschiedlichen Ergebnissen. Beispielsweise ist 9 zwar kleiner als 80, d.h. beim Vergleich dieser Zahlen gilt 9 < 89. Werden die Zahlen aber als Wörter verstanden und alphabetisch sortiert, dann steht 89 vor 9. Die Reihenfolge wäre dann 89, 9, 90. Dies lässt sich durch Typ-Konversionen lösen, beispielsweise mit Funktionen wie as.character(), die eine Zahl in ein Wort umwandelt, oder as.numeric(), die umgekehrt Text in Zahl umwandelt (so weit möglich).

Daten werden für statistische Auswertungen üblicherweise in Listen und Tabellen zusammengestellt. Als vector c bezeichnet man eine Liste von gleichartigen Objekten (z.B. nur Zahlen), als list eine Liste von verschiedenen Objekten. Ähnlich wird bei den Tabellen unterschieden zwischen matrix (aus gleichartigen Elementen) und data frame (aus verschiedenartigen Elementen).

Sie können sich den Inhalt einer Variablen, Liste oder Tabelle jederzeit anzeigen lassen durch Eingabe ihres Namens. Einzelne Elemente eines Vektors x erhalten Sie z.B. mit x[1] für den ersten Eintrag. Den Eintrag in der zweiten Zeile und der dritten Spalte der Matrix m erhalten Sie mit m[2,3]. Die dritte Spalte erhalten Sie mit m[,3]. Tragen die Spalten Namen, können Sie eine Spalte auch mit m$name auswählen.

Die wichtigsten Befehle der R Programmierung

Die wichtigsten Befehle von R sind diejenigen, mit denen Daten eingelesen, zusammengeführt und überarbeitet werden. Diese sind hier beschrieben. Die wichtigsten Statistik-Funktionen finden Sie hier.

Zusätzliche Befehle stehen zur Verfügung, wenn Sie eines der unzähligen Packages (Pakete) installieren. Dies bewerkstelligen Sie mit install.packages(„Paketname“). Um das Package zu verwenden, laden Sie es mit library(„Paketname“).

Befehlseingabe über die Konsole

Wenn man das R-Programm startet, öffnet sich als erstes die Konsole. Dort kann man Befehle eingeben und ausführen. Frühere Befehle kann man schnell wiederholen, indem man mit der Pfeiltaste durch die zuvor eingegebenen Befehle nach oben scrollt. Ideal ist das aber nicht. Üblicherweise startet man in der Konsole nur die Skripte (siehe unten) oder lässt sich Zwischenergebnisse anzeigen.

Skripte in R Programmierung

Es ist durchaus möglich, alle Ihre Auswertungen über die Konsole durchzuführen. Es gibt aber gute Gründe dafür, Ihre Befehle in einer Skript-Datei aufzulisten und abzuspeichern: Erstens unterstützt dies die Dokumentation der durchgeführten Auswertungsschritte und zweitens deren Wiederholbarkeit.

Bevor Sie ein Skript anlegen, sollten Sie das Arbeitsverzeichnis einstellen. Dies tun Sie über das Menü von R über File -> change dir. Dort geben Sie das Arbeitsverzeichnis ein. Ist das Arbeitsverzeichnis beispielsweise Eigene Dateien -> R, dann müssen Sie einen Umweg gehen über C:/ -> Benutzer -> Eigene Dateien -> R. Hier wird nun R Skripte und Dateien abspeichern und einzulesende Daten suchen.

Über File –> new script legen Sie ein neues Skript an oder können unter File ein existierendes Skript öffnen. Natürlich müssen Sie Ihr Skript früher oder später auch speichern, spätestens bevor Sie es starten.

In das Skript schreiben Sie Ihre Befehle in der Reihenfolge, in der sie ausgeführt werden sollen. Sehr hilfreich sind auch Kommentare, die Sie zwischen die Befehle oder auch hinter die Befehle schreiben können, markiert durch ##. Diese Kommentare werden dann von R ignoriert und nicht ausgeführt.

Wenn Sie ein Skript Programm.R ausführen wollen, speichern Sie es durch Klick auf das Speichern-Symbol ab und geben in der Konsole source(„Programm.R“) ein.
Abbildung RSkript.jpg

Kontrollstrukturen beim R Programmieren

Kontrollstrukturen sind Befehle, die es Ihnen erlauben, Bedingungen abzuprüfen und Befehle zu wiederholen. Beispielsweise wollen Sie vielleicht sicher gehen, dass eine Datei heruntergeladen wurde. Sie haben zwar den Befehl download.file(url=“http://adresse.com/datei.txt“, destfile = „datei.txt“) ausgeführt, doch wie stellen Sie sicher, dass es geklappt hat? Sie können die Existenz der Datei prüfen mit file.exists(„datei.txt“) und falls nötig das Herunterladen wiederholen.
Wie in den meisten Programmiersprachen auch haben Sie dafür auch beim R Programming die folgenden Möglichkeiten:
For-Schleife: Wenn Sie schon wissen, wie oft Sie etwas wiederholen möchten, verwenden Sie eine for-Schleife. So möchten Sie im Beispiel sicher nicht unendlich Mal die Datei einlesen, wenn es nicht geklappt hat. Vielleicht existiert sie gar nicht? Wenn Sie etwas zwei Mal wiederholen möchten, schreiben Sie for (i in 1:2).
If(Bedingung) prüft ab, ob eine Bedingung wahr ist. Falls file.exists(„datei.txt“) == FALSE, dann soll der Download wiederholt werden. Mit else kann zusätzlich definiert werden, was im anderen Fall geschehen soll.
Repeat() wiederholt die Befehle innerhalb der runden Klammer unendlich Mal. Sie können diese Endlosschleife mit einem break-Befehl verlassen, z.B. mit if(file.exists(„datei.txt“)) break.
While(Bedingung){} führt die Befehle in den geschweiften Klammern so lange aus wie die Bedingung in den runden Klammern erfüllt ist. Beispiel: while(!file.exists(„datei.txt“)){ download.file(url=“http://adresse.com/datei.txt“, destfile = „datei.txt“) }. (Das Ausrufezeichen ! verneint eine logische Aussage.)

Wo finde ich Hilfe, wenn ich nicht weiter weiß?

Jeder R-Befehl ist in einer ausführlichen Hilfe beschrieben, in der alle Parameter einer Funktion beschrieben sind sowie Beispiele genannt. Sie rufen diese Hilfe auf, indem Sie in der Konsole vor den Befehlsnamen ein Fragezeichen eingeben, also z.B. ?source(). Weiterführende Hilfe finden Sie in der unten genannten Literatur oder über unsere statistische Beratung.

Zum Weiterlesen über R Programmierung