Mar 16, 2020 — Aufgrund der aktuell unklaren Situation bezüglich des Corona-Virus wird die Wiederholungsprüfung der Vorlesung „DB 1“ verschoben und nicht wie geplant am 3. April 2020 stattfinden. Es wird einen Ersatztermin im Laufe des Sommersemesters geben, den wir rechtzeitig bekanntgeben werden.
Alle Prüfungsanmeldungen bleiben gültig, ihr müsst euch also nicht nochmal anmelden. — Christian Duta
Jan 16, 2020 — Das DB1-Tutorium kann am 6. Februar 2020 (12–14 Uhr) aus gesundheitlichen Gründen leider nicht stattfinden. — Christian Duta
Jan 16, 2020 — Das DB1-Tutorium kann am 16. Januar 2020 (12–14 Uhr) aus gesundheitlichen Gründen leider nicht stattfinden. — Christian Duta
Im Forum zu DB 1 klären wir alle organisatorischen und inhaltlichen Fragen, die sich im Laufe des Semesters auftun werden. Bitte dort regelmäßig vorbei schauen und keine Scheu zu fragen.
Die Vorlesung Datenbanksysteme I ist die klassische Einführung in das spannende Gebiet der Datenbanksysteme. Zentrales Thema sind die Relationalen Datenbanksysteme, in denen Daten in tabellarischer Form modelliert, gespeichert und angefragt werden. Dieser strikt tabellarische Blick auf Daten ist elegant, intuitiv aber dennoch formal und durch Datenbanksysteme effizient implementierbar, wirft aber auch interessante Fragen auf, denen wir uns in dieser Vorlesung widmen werden:
[ Datenbankbegriff ] Genau welche Services kann ein Datenbanksystem eigentlich bieten?
[ Datenmodellierung, ER-Modelle ] Wie bringt man Daten sinnvoll in tabellarische Form, auch wenn Daten zunächst in Form von Objekten, Bäumen, etc. vorliegen?
[ Relationales Modell, Normalformen ] Welche Charakteristika von Tabellen können wir ausnutzen, um Daten effizient und redundanzfrei speichern und wieder extrahieren zu können?
[ Relationale Algebra, SQL ] Welche Sprachen eignen sich für den Zugriff auf Massen von Tabellendaten?
Sowohl Vorlesung als auch Übung werden von Beispielen und Aufgaben begleitet, die wir mittels des relationalen Datenbanksystems PostgreSQL realisieren werden. PostgreSQL (in Version 11.x oder 12.x) ist für viele Plattformen (u.a. MS Windows, Linux, macOS) frei verfügbar.
Mit SQLite3 und MySQL stehen weitere relationale Datenbanksysteme frei zur Verfügung.
⚠️ Terminänderung: Die 90-minütige Klausur zu dieser Vorlesung wird am Montag, den 10. Februar 2020, von 16:00–18:00 Uhr im Kupferbau (Hörsaal 25) stattfinden.
An der Klausur dürfen alle Studierenden teilnehmen, die im Übungsbetrieb dieser Vorlesung mindestens 2/3 der Punkte erreicht haben. Für darüber hinaus erzielte Punkte gewähren wir einen Punktebonus in der Klausur.
Nur für Studierende der Bioinformatik: In dieser Vorlesung können ausnahmsweise auch nur 6 (anstatt regulär 9) ECTS erworben werden. Diese Studierenden steigen dann nach Weihnachten aus dem Vorlesungsbetrieb aus und schreiben am 10. Februar 2020 eine entsprechend angepasste Klausur.
Ramakrishnan, Gehrke: Database Management Systems
(3rd International Edition)
McGraw-Hill, 2003
ISBN 0-07-246563-8
Part I dieses Buch deckt die Inhalte zu relationalen Datenbanksystemen gut ab. Part II widmet sich den Inhalten der Vorlesungen Datenbanksysteme II.
Kemper, Eickler: Datenbanksysteme
(10. Auflage)
De Gruyter Studium, 2015
ISBN 3-11-044375-9
Deutsches Standardlehrbuch, das auch Inhalte der Vorlesung
Datenbanksysteme II bespricht. Eine
hervorragende Quelle für weiterführende Referenzen.
Das relationale Datenbanksystem PostgreSQL ist das Hauptwerkzeug in dieser Vorlesung und auch in den Übungen. Effizient, unkompliziert, standardkonform, erweiterbar und generally awesome. Hinweise zum Download und zur Installation von PostgreSQL. (Für User von Apples macOS bietet Postgres.app eine Installation innerhalb von Sekunden.) [ PostgreSQL Version 9.6 oder 10 ]
Gelegentlich werden wir in Vorlesung, Übung und Übungsblättern die Programmiersprache Python einsetzen, um einfache Skripte zur Verarbeitung von Tabellendaten zu entwerfen oder die Funktionsweise von Datenbanksystemen zu illustrieren. Frei verfügbar für alle gängigen Sytsteme und oft bereits vorinstalliert. [ Python Version 2.7 ]
Zu Beginn der Vorlesung werden wir JSON als Datenmodell und seine Sprache JSONiq thematisieren. Eine Implementation von JSONiq zum freien Download findet sich auf zorba.io.
Nr | File | Download |
---|---|---|
1 | GenBank-Eintrag für *Bakers' Yeast* Datenmodell Text | |
2 | LEGO Set 5610 Datenmodell Text | |
3 | Gesamtgewicht des LEGO Set 5610 Shell-Skript, basierend auf Usage (UNIX-Shell): | |
4 | LEGO Set 5610 Datenmodell JSON (Nested Arrays and Dictionaries) | |
5 | USGS Earthquake Data Datenmodell JSON | |
6 | Gesamtgewicht des LEGO Set 5610 (JSONiq-Query) Usage (UNIX-Shell): | |
7 | Stärke des schwersten Erdbebens auf der Nordhalbkugel (JSONiq-Query) Usage (UNIX-Shell): | |
8 | Stärke und Ort des schwersten Erdbebens auf der Nordhalbkugel (JSONiq-Query) File enthält drei Varianten der Query (zwei Varianten sind derzeit via Usage (UNIX-Shell): | |
9 | USGS Earthquake Data Datenmodell Tabular (CSV) | |
10 | Python-Modul DB1 (Python 2.7) Einfache Query-Library (PyQL und relationale Algebra) für Python 2.7. Einbindung in Python-Code via | |
11 | Python-Modul DB1v3 (Python 3) Einfache Query-Library (PyQL und relationale Algebra) für Python 3. Einbindung in Python-Code via | |
12 | Stärke und Ort des schwersten Erdbebens auf der Nordhalbkugel (PyQL-Query, liest CSV-File Usage (UNIX-Shell): | |
13 | Tabelle contains (LEGO Sets) Datenmodell Tabular (CSV) | |
14 | Tabelle bricks (LEGO Bausteine) Datenmodell Tabular (CSV) | |
15 | Tabelle minifigs (LEGO Minifiguren) Datenmodell Tabular (CSV) | |
16 | Gewicht des LEGO Set 5610 (PyQL-Query) Usage (UNIX-Shell): | |
17 | Gewicht des LEGO Set 5610 (Optimierung #1) (PyQL-Query) Optimierung basiert auf Regeln (constraints) der LEGO Mini-World: eindeutige Identifier in Tabellen Usage (UNIX-Shell): | |
18 | Gewicht des LEGO Set 5610 (Optimierung #2) (PyQL-Query) Optimierung basiert auf Konstruktion einer temporären Datenstruktur (Dictionary/partielle Funktion Usage (UNIX-Shell): | |
19 | Gewicht des LEGO Set 5610 (Data Independence #1) (PyQL-Query) Einführung einer temporären Liste Usage (UNIX-Shell): | |
20 | Gewicht des LEGO Set 5610 (Data Independence #2) (PyQL-Query) Basiert auf einer neuen persistenten Tabelle
Usage (UNIX-Shell): | |
21 | Kopie (Schema und Zustand) einer Tabelle erstellen (SQL-Skript) Kopiert erst Schema und dann Zustand einer existierenden Tabelle, benötigt lediglich je ein DDL- und DML-Statement. Usage (UNIX-Shell): | |
22 | SQL DML Statements (Tabelle `calendar`) (SQL-Skript) Demonstration der SQL DML Kommandos Usage (UNIX-Shell): | |
23 | SQL Foreign Data Wrapper (SQL-Skript) Demonstration des PostgreSQL Foreign Data Wrappers (CSV-File wird in den Zustand einer Relation gespiegelt, read-only: Änderungen im CSV-File werden vom RDBMS übernommen, Achtung: Im SQL-Skript muss der (absolute) Pfad zum CSV-File angepasst werden. Usage (UNIX-Shell): | |
24 | SQL DDL Statements zur Deklaration von Constraints (SQL-Skript) Reichert Tabelle Usage (UNIX-Shell): | |
25 | Kandidaten- und Primärschlüssel (SQL-Skript) Deklariert und lädt die Tabellen der LEGO-Miniwelt und fügt Kandidaten- sowie Primärschlüssel hinzu. NB: Einige SQL-Statements führen zu (erwarteten) Fehlern, siehe Kommentare. Achtung: Im SQL-Skript müssen die (absoluten) Pfade zu den CSV-Files angepasst werden. Usage (UNIX-Shell): | |
26 | Die SQL FROM-Klausel (SQL-Skript) Demonstriert, dass die Nennung von Subqueries in der Usage (UNIX-Shell): | |
27 | Row-Types und Row-Values in SQL (SQL-Skript) Demonstriert das Konzept der row types und row values in SQL. Usage (UNIX-Shell): | |
28 | (Überflüssiges) DISTINCT in SQL (SQL-Skript) Demonstriert, das für einige Queries die Nennung von Usage (UNIX-Shell): | |
29 | SQL: Equi-Joins, θ-Joins (SQL-Skript) Demonstriert die Formulierung von Equi- und allgemeiner θ-Joins (Theta-Joins), auch zwischen mehreren Tabellen (hier: 3-Way Join). Usage (UNIX-Shell): | |
30 | SQL: Kompositionalität (Subqueries) (SQL-Skript) Demonstriert den Einsatz von Subqueries Usage (UNIX-Shell): | |
31 | SQL: Kompositionalität (WITH) (SQL-Skript) Demonstriert den Einsatz von Usage (UNIX-Shell): | |
32 | SQL: Korrelierte Unteranfragen (SQL-Skript) Demonstriert die Nutzung korrelierter Unteranfragen (die freie Variablen beinhalten, die in der umgebenden Anfrage gebunden werden). Usage (UNIX-Shell): | |
33 | SQL: Fremdschlüssel (SQL-Skript) Demonstriert die Deklaration und den Einsatz von Fremdschlüsseln (foreign keys), um eine konsistente Verweisstruktur zwischen Source- und Target-Tabellen zu gewährleisten. Achtung: Im SQL-Skript müssen die (absoluten) Pfade zu den CSV-Files angepasst werden. Usage (UNIX-Shell): | |
34 | SQL: Referentielle Integrität (SQL-Skript) Demonstriert die (manuelle) Überprüfung der referentiellen Integrität einer Datenbank mittels der SQL-Prädikate Achtung: Im SQL-Skript muss ein (absoluter) Pfad zu einem CSV-File angepasst werden. Usage (UNIX-Shell): | |
35 | SQL: Intra-Table Foreign Keys (Operationen auf Bäumen) (SQL-Skript) Repräsentation von Bäumen mittels Fremdschlüsseln innerhalb einer Tabelle ( Usage (UNIX-Shell): | |
36 | SQL (1NF vs NF²): Codierung strukturierter Information als Text (SQL-Skript) Repräsentation von Logo turtle drawing commands mittels Datentyp Usage (UNIX-Shell): | |
37 | SQL (1NF vs NF²): Codierung strukturierter Information in Arrays (SQL-Skript) Repräsentation von Logo turtle drawing commands mittels Arrays von Kommandos (Typ Usage (UNIX-Shell): | |
38 | SQL (1NF vs NF²): Codierung strukturierter Information in geschachtelten Tabellen (SQL-Skript) Repräsentation von Logo turtle drawing commands in geschachtelten Tabellen — die resultierende Tabelle ist in Non-First Normal Form (NF²). Nach Entschachtelung wird die NF²-Tabelle durch zwei 1NF-Tabellen Usage (UNIX-Shell): | |
39 | SQL (1NF vs NF²): Übersetzung von NF²SQL-Queries in reguläres SQL (SQL-Skript) Übersetzung von Anfragen der hypothetischen "NF²SQL"-Sprache in reguläre SQL-Queries über Bundles von 1NF-Tabellen (hier: Usage (UNIX-Shell): | |
40 | SQL: Gruppierung und Aggregation (SQL-Skript) Demonstration verschiedener SQL Aggregat-Funktionen (siehe auch die PostgreSQL 11-Dokumentation zu Aggregat-Funktionen). Usage (UNIX-Shell): | |
41 | SQL: Gruppierung und Aggregation (im Turtle-Beispiel) (SQL-Skript) Demonstration von Gruppierung und Aggregation im Usage (UNIX-Shell): | |
42 | SQL: Gruppierung und Aggregation (Kalender) (SQL-Skript) Gruppierung und Aggregation auf der Kalender-Datenbank Usage (UNIX-Shell): | |
43 | SQL: LEGO Data Warehouse (Report Queries) (SQL-Skript) Aufbau eines Mini-Data Warehouse für die LEGO-Datenbank. Einfache Report-Queries. Usage (UNIX-Shell): | |
44 | SQL: LEGO Data Warehouse (weitere Aggregationen) (SQL-Skript) Weitere Gruppierungen und Aggregationen auf dem LEGO Data Warehouse (Set mit der meisten Teilen, schwerstes Set). Usage (UNIX-Shell): | |
45 | SQL: Test auf Kandidatenschlüssel (SQL-Skript) Test: Ist die angegebene Attributmenge ein Kandidatenschlüssel für Tabelle Usage (UNIX-Shell): | |
46 | SQL: Interaktion von Gruppierung/Aggregation und NULL (SQL-Skript) Verhalten von Gruppierung und Aggregation auf leeren Tabellen und bei der Verarbeitung von NULL-Werten. Usage (UNIX-Shell): | |
47 | SQL: LEGO Building Instructions (funktionale Abhängigkeiten) (SQL-Skript) Generiert Tabelle Achtung: Im Skript müssen Pfade zu den Illustrationen der Bauanleitung angepasst werden. Die Illustrationen selbst befinden sich ich im ZIP-Archiv Usage (UNIX-Shell): | |
48 | Illustrationen zu den LEGO Building Instructions (ZIP-Archiv mit PNG-Bildern) Enthält die Illustrationen zur LEGO-Bauanleitung in Tabelle Usage (UNIX-Shell): | |
49 | SQL: Simulation von FD-Constraints (mittels Trigger) (SQL-Skript) Nutzt einen SQL-Trigger, um die FD Usage (UNIX-Shell): | |
50 | SQL: Erzeugung künstlicher Schlüsselwerte (SQL-Skript) Nutzt den Spalten, die als Usage (UNIX-Shell): | |
51 | SQL: Airport-Countries (generiert aus ER-Diagramm) (SQL-Skript) Relationale Implementation eines ER-Diagramms, das eine many-to-one-Relationship zwischen Entities Airport und Country beschreibt. Usage (UNIX-Shell): | |
52 | SQL: Employees-Engineers-Secretaries (generiert aus EER-Diagramm mit Vererbung) (SQL-Skript) Relationale Implementation eines ER-Diagramms, das Entity-Typ Employee sowie dessen Spezialisierungen Secretary und Engineer beschreibt. Nutzt die SQL-Klausel Usage (UNIX-Shell): | |
53 | RA: Selektion (Python-Skript, benötigt Python-Modul Demonstriert den Selektions-Operators σ[p](R) der Relationalen Algebra (RA). Das Selektionsprädikat p wird hier in Form eines λ-Ausdrucks als anonyme Funktion angegeben: Usage (UNIX-Shell): | |
54 | RA: Projektion (Python-Skript, benötigt Python-Modul Demonstriert den Projektions-Operators π[ℓ](R) der Relationalen Algebra (RA). Die Projektions-Funktion ℓ kann in zwei Formen angegeben werden:
Usage (UNIX-Shell): | |
55 | RA: Two-Hops-Query (Python-Skript, benötigt Python-Modul Demonstriert das Zusammenspiel der RA-Operatoren π, σ und ⨉ zur Implementation einer Anfrage über Graphen (findet alle Pfade der Länge 2). Usage (UNIX-Shell): | |
56 | RA: Natural Join (Python-Skript, benötigt Python-Modul Demonstriert die Funktionalität des Natural Join-Operators ⨝ (verbindet zwei Relationen, Join-Prädikat ergibt sich implizit aus der Gleichheit der gleich benannter Spalten). Usage (UNIX-Shell): | |
57 | RA: LEGO-Steine aus der "Animal"-Kategorie (Python-Skript, benötigt Python-Modul Findet die LEGO-Steine, die aus einer Kategorie mit Bezug zu "Animal" stammen. Greift auf die Tabellen Usage (UNIX-Shell): | |
58 | RA: LEGO-Sets, die schwerer als "Taj Mahal" sind (Python-Skript, benötigt Python-Modul Findet die LEGO-Sets, die schwerer als das LEGO-Set "Taj Mahal" sind. RA-Query ist bereits in mehrern Schritten optimiert. Greift auf die Tabelle Usage (UNIX-Shell): | |
59 | RA: Kategorisiere LEGO-Sets nach Volumen (Python-Skript, benötigt Python-Modul Kategorisiert LEGO-Sets nach ihrem Volumen (small, medium, large). Greift auf Tabelle Usage (UNIX-Shell): | |
60 | SQL: Kategorisiere LEGO-Sets nach Volumen (SQL-Skript) Kategorisiert LEGO-Sets nach ihrem Volumen (small, medium, large). Zwei Varianten nutzen Fallunterscheidung ( Usage (UNIX-Shell): | |
61 | RA: LEGO-Sets, die keine Bausteine mit Aufkleber enthalten (Python-Skript, benötigt Python-Modul Findet die LEGO-Sets, in denen kein Baustein einen Aufkleber erhält. Nicht-monotone Anfrage, demonstriert den Einsatz der relationalen Differenz. Greift auf gekürzte Varianten der Tabellen Usage (UNIX-Shell): | |
62 | RA: LEGO-Sets, die ausschliesslich gelbe Bausteine enthalten (Python-Skript, benötigt Python-Modul Findet die LEGO-Sets, in nur gelbe Bausteine enthalten sind. Nicht-monotone Anfrage, demonstriert den Einsatz der relationalen Differenz. Greift auf gekürzte Varianten der Tabellen Usage (UNIX-Shell): | |
63 | RA: Welche Sets enthalten alle notwendigen Steine? (Python-Skript, benötigt Python-Modul Findet die LEGO-Sets, die alle Steine beinhalten, die benötigt werden, um das LEGO-Set 1609 zu bauen. Nicht-monotone Anfrage, demonstriert den Einsatz des Divisions-Operators (÷). Greift auf gekürzte Variante der Tabellen Usage (UNIX-Shell): | |
64 | Tabelle "colors" (LEGO Farbpalette) Datenmodell Tabular (CSV) | |
65 | Tabelle "bricks-small" (gekürzte Variante der Tabelle "bricks") Datenmodell Tabular (CSV) | |
66 | Tabelle "sets-small" (gekürzte Variante der Tabelle "sets") Datenmodell Tabular (CSV) | |
67 | Tabelle "contains-small" (gekürzte Variante der Tabelle "contains") Datenmodell Tabular (CSV) |