Verena Zuber, Bernd Klaus, Korbinian Strimmer
Uni Leipzig, Wintersemester 2012/13
Neuigkeiten:
- Wichtige Information zur Zusatzleistung (notwendig für das 5 LP-Modul):
- Anmeldung per Mail an die Kursleiter bis zum 29.11.12
- Ausgabe der Aufgaben am 6.12.12
- Vorbesprechung in der Woche vom 7.1. bis 11.1.13
- Vortrag am 17.1.13
- 8.11.: Der R-Kurs beginnt um 11:00 im Raum 110 (1. OG), IMISE, Härtelstr. 16-18
- 11.10.: Erster Termin Donnerstag um 11:15 im CIP-Pool (EG), IMISE, Härtelstr. 16-18
Prüfungsleistung:
Der R-Kurs kann für Studierende der Informatik als 5LP Modul angerechnet werden. Voraussetzung ist das Bestehen einer mündlichen Prüfung am Semesterende und einer Praktikumsleistung. Die Praktikumsleistung umfasst etwa einen Arbeitsaufwand von zwei Wochen und wird in einem Vortrag präsentiert. Das Thema kann aus dem Bereich der Programmierung in R oder der Statistik gewählt werden.
Synopsis:
Ziel der Veranstaltung ist es, einen Einblick in die Programmsprache R zu vermitteln. R bietet eine Basis für statistische Analysen und deren graphische Darstellung. Es ist sowohl möglich auf ein breites Spektrum an bestehenden Methoden zuzugreifen, als auch eigene Anwendungen zu schreiben.
Neben SAS, (SPSS) und Stata ist R eine der beliebtesten statistischen Programmsprachen. R ist ein GNU Projekt und frei für jeden zugänglich und erweiterbar.
R Project for Statistical Computing:
- http://www.r-project.org
- Editor für Windows: Tinn-R
Geplante Inhalte:
- Grundlagen
- Deskriptive Analyse
- Graphische Darstellung
- Verteilungen und Simulieren
- Einfache Tests und das lineare Modell
- Erstellen eigener Funktionen
- Fortgeschrittene Methoden aus der Biostatistik
Verwendete Literatur:
- Wim Krijnen, 2009: Applied Statistics for Bioinformatics Using R
- Andrew Robinson, 2008: IcebreakR
- Tom Short, 2004: R reference card
- W. N. Venables, D. M. Smith and the R Development Core Team, 2009: An Introduction to R
Empfohlene Literatur:
- W. John Braun und Duncan J. Murdoch, 2009: A First Course In Statistical Programming With R
- Michael L. Lavine, 2009: Introduction To Statistical Thought
- Uwe Ligges, 2009: Springer-Verlag, Heidelberg, 3. Auflage, (ISBN 978-3-540-79997-9) Programmieren mit R
- Günther Sawitzki, 2008: Einführung in R
Datensätze:
- Patienten-Daten
- OECD-Daten , 2009: Doing Better for Children
- Modifizierte OECD-Daten , 2009: Doing Better for Children
- Daten von Google zur Suchhäufigkeit von zu Guttenberg und Knut , 2009: Google Insights for Research
- PISA-Daten , 2009: OECD Programmme for International Student Assessment
- Daten von Google zur Suchhäufigkeit von den Begriffen Arbeitsamt und Krise getrennt nach Bundesländern , 2009: Google Insights for Research
- Daten aus der Produktion von Hustensaft
- Mietdaten
- Daten zur Herzfrequenz
- Spielzeugautodaten
- Daten zur Eigenschaft von Süssigkeiten
- HotDog-Daten
- Daten zu Fahrzeuglärm
Vorlesungsübersicht:
Inhalt | Folien | Aufgaben | Lösungen | Literatur | Datum | |
---|---|---|---|---|---|---|
1. | Grundlagen I: Was ist R? Wichtige Datenstrukturen und Funktion |
IcebreakR: Kapitel 4+6 An Introduction to R: Kapitel 1-3, 6 |
11.10 | |||
2. | Grundlagen II: Rechnen mit R, Umgang mit Daten |
IcebreakR: Kapitel 5 An Introduction to R: Kapitel 4,5,7 |
18.10 | |||
3. | Deskriptives: Statistiken und Graphiken |
25.10 | ||||
4. | Programmstrukturen: Umgang mit fremden und Erstellen eigener Funktionen |
Skript treff.R | 1.11 | |||
5. | Dichten und Verteilungsfunktionen: Grundlagen zu Verteilungen, Simulieren und Graphiken |
8.11 | ||||
6. | Statistische Tests: Eine Einführung | 15.11 | ||||
7. | Statistische Tests: Übungen | 22.11 | ||||
8. | Lineare Regression: Theorie | 29.11 | ||||
9. | Lineare Regression: Interpretation und Übung | 6.12 | ||||
10. | Varianzanalyse: |
13.12 |