Chapter 1 Übungseinheiten
In dieser Übung werden wir zunächst verschiedene Arten botanischer Sammlungen und die Entwicklung zu einer Big Data Wissenschaft kennenlernen. Anschließend lernt ihr botanische Sammlungsdaten in R zu verarbeiten und phylogenetische Stammbäume zu erstellen und in R zu verarbeiten.
1.0.1 Lernziele
Nach diesem Kurs seid ihr in der Lage
- Verschiedenen botanischer Sammlungen definieren und ihre Stärken und Herausforderungen im Zeitalter von Big Data an Hand von Beispielen mit korrekter Terminologie erklären
- Geographische Daten in R laden und einfache Datenverarbeitung selbständig durchführen
- Die Grundlagen phylogenetischer Inferenz erklären und phylogenetische Stammbäume unter Anleitung rekonstruieren und in R bearbeiten
1.0.2 Literaturhinweise
Für die meisten Tage geben wir euch spezielle Literaturempfehlungen zur Vorbereitung auf der Seite der jeweiligen Übungseinheit. Nutzt diese Literatur zur Vorbereitung der Kurstage. Falls ihr keine Erfahrung mit R habt, könnt ihr die ersten vier Semesterwochen zur selbständigen Einarbeitung nutzen. Folgendes kostenlos zugängliches Buch ist dabei sehr hilfreich:
Wickham H, Cetinkaya-Rundel M & Grolemund G (2024) R for Data Science. https://r4ds.hadley.nz/
1.0.3 Mehr Information
Organisatorische Informationen und Beispieldaten zum Download (falls zutreffend) findet ihr auf ILIAS (https://ilias.uni-marburg.de/goto.php?target=crs_3883452&client_id=UNIMR). Meldet euch bei Fragen jederzeit gerne in der Vorlesung und Übung.
1.0.4 PC-Setup
Für die Computerübungen werden wir R und RStudio verwenden.
Wichtig: Es empfiehlt sich, eine feste Struktur zu verwenden, um die Dateien für diesen Kurs zu organisieren (dies ist im Übrigen gute Praxis für jedes wissenschaftliche Projekt). In der ersten Übung mit R werden wir daher die folgenden Schritte durchführen.
Richtet auf eurem persönlichen Netzwerklaufwerk H: ein Verzeichnis für diesen Kurs ein, z.B. bot_sammlungsdaten
. Erstellt innerhalb dieses Verzeichnisses die folgenden Ordner:
data
für alle Dateien mit Daten, die ihr herunterladetresults
für alle Grafiken und andere Ergebnisse, die ihr erstelltscripts
für eure R-Skripte. Dies wird euer Arbeitsverzeichnis sein. Wir empfehlen, für jede Übung ein neues R-Skript zu speichern.
Wichtig: Wir werden verschiedene R-Pakete (“libraries”) installieren müssen. Standardmäßig versucht R, ein Paket in eurem Netzwerkverzeichnis (H:) zu installieren, wofür ihr aber keine Berechtigung habt. Wir werden die Pakete daher lokal auf dem Computer installieren – das bedeutet, dass ihr immer den gleichen Computer benutzen oder die Pakete jedes Mal neu installieren müsst.
Legt ein Verzeichnis Rlibraries
auf dem Laufwerk D: an.
Führt den folgenden Code vor jeder Sitzung aus (fügt ihn am Anfang eurer Skripte ein). Damit wird R mitgeteilt, wo Pakete installiert und und geladen werden sollen.
1.0.5 Vorläufiger Zeitplan
Einen Vorläufigen Zeitplan für Vorlesung und Übung findet ihr ebenfalls auf ILIAS (https://ilias.uni-marburg.de/goto.php?target=crs_3883452&client_id=UNIMR).