Statistik mit R

Grundlagen der Datenanalyse

Inhaltsverzeichnis

R ist ein frei verfügbares Statistikprogramm und eine freie Programmiersprache für statistische Berechnungen und Grafikerstellung in einem. Dieses Programm wird seit Anfang der 1990er Jahre als GNU Projekt von Anwendern weltweit weiterentwickelt.

R besitzt eine hohe Flexibilität und ist dadurch hervorragend für zahlreiche Anwendungen geeignet (lineare und nichtlineare Modelle, statistische Tests, Zeitreihenanalysen, Verlaufsdatenanalyse, Mehrebenenanalyse, Analyse komplexer Stichprobendesigns, Meta-Analysen, Clusteranalysen, Erstellung interaktiver Grafiken etc.) Die enorme Flexibilität führt allerdings auch zu einem Ausmaß an Komplexität, der den Einstieg für neue Nutzer nicht einfach macht.

Das Handbuch besteht aus zwei Teilen:

  • Einführung in das Programm R
  • Statistische Datenanalyse mit R

Der erste Teil beinhaltet eine fundamentale Einführung in R, ohne dass bereits Kenntnisse von R oder sonstige Programmierkenntnisse vorausgesetzt werden.

Der zweite Teil beinhaltet für verschiedene Stichprobendesigns die geeigneten deskriptiven Analysen, sowie statistische Testverfahren und grafische Darstellungsmöglichkeiten. Anhand von zahlreichen Beispielen werden die vorgestellten Themengebiete vertieft. Kapitel 6 beinhaltet zwar eine kurze Einführung in die Grundlagen der Statistik, der Leser sollte idealerweise aber bereits Vorkenntnisse im Rahmen einer Einführungsveranstaltung in Statistik erworben haben.

  1. Grundlagen in R
  2. Programmieren in R
  3. Datenimport und Datenexport
  4. Datenmanagement
  5. Grafikerstellung mit R
  6. Statistische Grundbegriffe
  7. Kategoriale Daten
  8. Metrische Daten
  9. Kategoriale und metrische Daten
  • A. Editoren für R
  • B. Benutzeroberflächen von R
Inhaltsverzeichnis (R_Handbuch_Inhaltsverzeichnis.pdf, 85.27 KB)
Leseprobe (R_Handbuch_Leseprobe.pdf, 181.83 KB)
Übungsdateien (R-Uebungen-3.zip, 71.85 KB)
Zielgruppe

Das Handbuch richtet sich an Studierende aller Fachbereiche, die im Laufe ihres Studiums auf das Problem der korrekten statistischen Auswertung empirisch erhobener Daten stoßen und zum ersten Mal mit einem Statistik-Programm arbeiten. Ebenso ist das Skript für erfahrene Nutzer anderer Statistik-Programmpakete (SPSS, SAS u.a.) gedacht, die sich mit R vertraut machen möchten.

Lernziele

Dieses Skript soll in erster Linie den statistisch-orientierten Einstieg in das Programm erleichtern. Dem Leser soll auf möglichst anwendungsorientierte Weise das Programm und die benutzten statistischen Verfahren näher gebracht werden. Mit vielen Anwendungsbeispielen zu den vorgestellten Themen soll der Lernstoff vertieft werden. Das Skript ist als praktische Anleitung und Nachschlagewerk angelegt.

Hinweise

"Manche Anwender sehen im freien Statistikpaket R so etwas wie Excel mit Turbolader, andere vor allem eine spezialisierte Programmiersprache. Doch eine breite Gemeinde von Wissenschaftlern, Studenten und Firmenanalytikern ist sich einig, dass R heute in der Statistik eine ähnliche Rolle spielt wie früher einmal so kostspielige Anwendungen wie SPSS und SAS."

c''t 13/2009, Seite 166

Artikel der Uni Heidelberg über das R-Handbuch

Rezension

Das Handbuch "Statistik mit R, 3., veränderte Auflage". Was Hochschulmitglieder dazu meinen:

"Das Handbuch zur Statistik mit R stellt die ausführlichen Möglichkeiten der Software und Programmiersprache R dar. Neben der Beschreibung von grundlegenden Funktionen in R werden auch die vielfältigen statistischen Möglichkeiten erläutert. Es ist gut verständlich geschrieben und sowohl für Einsteiger in R als auch für erfahrene Nutzer von anderen Statistikprogrammen geeignet. Aufgaben zur Vertiefung des erlangten Wissens runden das insgesamt sehr positive Bild dieses Handbuchs ab."
Ökologin Michaela Meyer, M.Sc., Universität Vechta, Lehrstuhl für Landschaftsökologie

Das Handbuch "Statistik mit R, 1. Auflage". Was Hochschulmitglieder dazu meinen:

"Das R-Buch ist wirklich gut gelungen!"
Dr. Andreas Recke, Klinik für Dermatologie und Venerologie, Universitätsklinikum SWH, Lübeck

 „Insgesamt gefällt mir das Skript sehr gut. Es stellt eine sehr gute Einführung in R dar. Die Zweiteilung – zuerst einführende Programmierschritte, dann statistische Verfahren – ist genau das, was der Einsteiger, aber auch der Umsteiger von anderen Programmen benötigt. Die Erläuterung zu den statistischen Methoden sind sehr hilfreich, auch die Interpretationen.“
Dr. Carina Ortseifen, Rechenzentrum der Universität Heidelberg

 "Dieses Buch zur frei verfügbaren Statistiksoftware und Programmiersprache R stellt eine große Bereicherung der Reihe der RRZN-Handbücher dar und wurde – sicher nicht nur von mir – lange ersehnt. Das Handbuch beschreibt sowohl die grundlegenden Funktions- und Arbeitsweisen als auch die statistischen Möglichkeiten von R. Neben der Durchführung in R wird dabei zu jeder statistischen Auswertung auch kurz der mathematische Hintergrund beschrieben.

Dieses sehr gelungene Buch wird sicher vielen Lesern den Einstieg in R erleichtern."

Dipl.-Math. Stefan Englert, Institut fuer Medizinische Biometrie und Informatik, Universitaet Heidelberg

„Lange mussten die Leser von RRZN-Handbüchern auf ein solches zur Statistiksoftware R warten, doch das Warten hat sich definitiv gelohnt!
Der Autor, Herr Hain, schreibt in angenehm lesbarer Weise über die Möglichkeiten von und Fallstricke bei R. Inhaltlich ist das Handbuch in zwei große Bereiche unterteilt. Im ersten Teil (Kapitel 1 bis 5) geht es vor allem um die technischen Aspekte rund um R, wie beispielsweise das Arbeiten mit Vektoren, Matrizen und data frames, den Import und Export  von Daten, oder das Erstellen von Grafiken.
Der zweite Teil (Kapitel 6 bis 9) widmet sich dann speziell statistischen Fragestellungen. Nach einer Kurzzusammenfassung der benötigten statistischen Grundlagen in Kapitel 6 stellen dann die Kapitel 7 bis 9 einen designorientierten  Zugang zur statistischen Datenanalyse dar. Bei diesem für den Praktiker überaus nützlichen Zugang wird zuerst nach der Art der vorliegenden Daten (rein kategorial, rein metrisch oder beides zugleich), der Anzahl der vorliegenden Variablen und der Art der zu untersuchenden Hypothese (z.B. Zusammenhangs- oder Unterschiedshypothese) gefiltert, anschließend  werden gängige Verfahren für den jeweiligen Zweck sowie deren Implementierung in R vorgestellt.
Herr Hain erklärt dabei stets sehr ausführlich und durch eingängige Beispiele illustriert, welche Schritte für welche Zwecke in R unternommen werden müssen. Vor allem präsentiert er im zweiten Teil die statistischen Verfahren nicht als „black box“,  sondern beschreibt auch stets die statistischen Hintergründe und die Interpretation der Resultate. Eine Vielzahl von Abbildungen erleichtern das Verständnis dieser Erklärungen, und die kleinen Übersichtstabellen helfen beim späteren Nachschlagen. Besonders bemerkenswert ist, dass das Buch auch sehr gut für Leser ohne Programmiererfahrung geeignet ist, denn genau diese Notwendigkeit des Programmierens ist ja häufig die  größte Hürde vor der Benutzung von R.“

Dr. Christian H. Weiß (Autor von „Mathematica“ und „Statistica“), Fachbereich Mathematik, TU Darmstadt

Das Handbuch steht als Druckexemplar sowie eBook zur Verfügung.

Dieses Handbuch wurde im Rahmen der Kooperation der staatl. Hochschulen auf dem Gebiet der IT-Dokumentation am Fachbereich Mathematik der Uni Würzburg erstellt.

Verkauf von Handbüchern

Extern: siehe Verkaufsstellen

Verkauf an der LUH:

Handbuch-Team
Verkauf von Montag bis Donnerstag 08:00 – 16:00 Uhr sowie Freitag von 08:00 – 14:00 Uhr
Adresse
Leibniz Universität IT Services
Auskunft
Schloßwender Straße 5
30159 Hannover
Gebäude
Handbuch-Team
Verkauf von Montag bis Donnerstag 08:00 – 16:00 Uhr sowie Freitag von 08:00 – 14:00 Uhr
Adresse
Leibniz Universität IT Services
Auskunft
Schloßwender Straße 5
30159 Hannover
Gebäude