Verena Zuber, Bernd Klaus, Korbinian Strimmer
Uni Leipzig, Wintersemester 2011/12
Neuigkeiten:
- 26.1.: Letzter Termin zur Prüfungsanmeldung!
- 26.1.: Raumänderung: Seminarraum 110
- Wegen Prüfungstermin bitte bei den Veranstalungsleitern melden!
- 10.11.: Raumänderung: Seminarraum 109
- 13.10.: Erster Termin Donnerstag um 11:15 im CIP-Pool (EG), IMISE, Härtelstr.
Synopsis:
Organisatorische Details zur Vorlesung (z.B. Raum und Zeit) finden Sie im Vorlesungsverzeichnis WS 2011/12.Ziel der Veranstaltung ist es, einen Einblick in die Programmsprache R zu vermitteln. R bietet eine Basis für statistische Analysen und deren graphische Darstellung. Es ist sowohl möglich auf ein breites Spektrum an bestehenden Methoden zuzugreifen, als auch eigene Anwendungen zu schreiben.
Neben SAS, (SPSS) und Stata ist R eine der beliebtesten statistischen Programmsprachen. R ist ein GNU Projekt und frei für jeden zugänglich und erweiterbar.
R Project for Statistical Computing:
- http://www.r-project.org
- Editor für Windows: Tinn-R
Geplante Inhalte:
- Grundlagen
- Deskriptive Analyse
- Graphische Darstellung
- Verteilungen und Simulieren
- Einfache Tests und das lineare Modell
- Erstellen eigener Funktionen
- Fortgeschrittene Methoden aus der Biostatistik
Verwendete Literatur:
- Wim Krijnen, 2009: Applied Statistics for Bioinformatics Using R
- Andrew Robinson, 2008: IcebreakR
- Tom Short, 2004: R reference card
- W. N. Venables, D. M. Smith and the R Development Core Team, 2009:
An Introduction to R
Empfohlene Literatur:
- W. John Braun und Duncan J. Murdoch, 2009: A First Course In Statistical Programming With R
- Carsten Dormann, 2008: Statistische Analyse biologischer Daten
- Michael L. Lavine, 2009: Introduction To Statistical Thought
- Uwe Ligges, 2009: Springer-Verlag, Heidelberg, 3. Auflage, (ISBN 978-3-540-79997-9) Programmieren mit R
- Günther Sawitzki, 2008: Einführung in R
Datensätze:
- Patienten-Daten
- OECD-Daten , 2009: Doing Better for Children
- Modifizierte OECD-Daten , 2009: Doing Better for Children
- Daten von Google zur Suchhäufigkeit von zu Guttenberg und Knut , 2009: Google Insights for Research
- PISA-Daten , 2009: OECD Programmme for International Student Assessment
- Daten von Google zur Suchhäufigkeit von den Begriffen Arbeitsamt und Krise getrennt nach Bundesländern , 2009: Google Insights for Research
- Daten aus der Produktion von Hustensaft
- Daten zur Herzfrequenz
- Spielzeugautodaten
- Daten zur Eigenschaft von Süssigkeiten
- HotDog-Daten
- Daten zu Fahrzeuglärm
- Maus-Daten zu Trisomie 21
- Genexpression
Vorlesungsübersicht:
Inhalt | Folien | Aufgaben | Lösungen | Literatur | Datum | |
---|---|---|---|---|---|---|
1. | Grundlagen I: Was ist R? Wichtige Datenstrukturen und Funktion |
IcebreakR: Kapitel 4+6 An Introduction to R: Kapitel 1-3, 6 |
13.10 | |||
2. | Grundlagen II: Rechnen mit R, Umgang mit Daten |
IcebreakR: Kapitel 5 An Introduction to R: Kapitel 4,5,7 |
20.10 | |||
3. | Deskriptives: Statistiken und Graphiken |
27.10 | ||||
4. | Dichten und Verteilungsfunktionen: Grundlagen zu Verteilungen, Simulieren und Graphiken |
3.11 | ||||
5. | Statistische Tests: Eine Einführung | 10.11 | ||||
6. | Statistische Tests: Übungen | 17.11 | ||||
7. | Programmstrukturen: Umgang mit fremden und Erstellen eigener Funktionen |
Skript treff.R | 24.11 | |||
8. | Programmstrukturen: Erstellen eigener Funktionen |
1.12 | ||||
9. | Lineare Regression: Theorie | 8.12 | ||||
10. | Lineare Regression: Interpretation und Übung | 15.12 | ||||
11. | Varianzanalyse | Skript zum multiplen Testen script11.R | 5.1 | |||
12. | Multivariate Verfahren | Applied Statistics for Bioinformatics Using R: Kapitel 4.2, 6 | 12.1 | |||
13. | Multivariate Verfahren | Applied Statistics for Bioinformatics Using R: Kapitel 7 | 19.1 | |||
14. | Fragestunde | 26.1 |