Database-Supported XML Processors (INF 3133) Print

Diese Vorlesung findet sich auch im Campus/LSF der Universität Tübingen

Die Vorlesung findet zukünftig (erstmalig am Donnerstag, 08.11.2012) im Raum A104 (Sand) statt. Die Vorlesung am 01.11.2012 entfällt aufgrund des Feiertages.


Relationale Datenbanksysteme (RDBMS) wurden ursprünglich entworfen, um tabellenstrukturierte Daten halten und anfragen zu können. In dieser Vorlesung werden wir untersuchen, wie sich diese Systeme in XML-, XPath- und XQuery-Prozessoren verwandeln lassen, die Massen von XML-Daten effizienter verarbeiten können, als die weitaus meisten verbreiteteten XML-Prozessoren.

Diese Technologie basiert vor allem auf "cleveren" Abbildungen des XQuery-Datenmodells (geordnete Bäume und Sequenzen) und der XQuery-Semantik auf die tabellenorientierten Strukturen und Anfragesprachen (relationale Algebra und SQL) der RDBMS.

 

Wir werden dazu u.a.,

  • die Transformation von Bäumen (XML-Daten) in Tabellenstrukturen,
  • die Übersetzung und Auswertung von XPath-Anfragen auf diesen Tabellen,
  • mögliche Änderungen am RDBMS-Kernel, die diese Operationen effizient machen, und
  • die Compilation von XQuery in relationale Programme (relationale Algebra und SQL) und deren Auswertung


untersuchen.

Es werden sich teilweise ungewöhnliche und sehr interessante Sichten auf die Anfrageübersetzung und -verarbeitung, Indexstrukturen, etc. in RDBMS ergeben. Parallel dazu werden wir XML, die Anfragesprachen XPath und XQuery, und XML Schema genauestens kennenlernen.

Diese Veranstaltung wird keine "Trockenübung" sein. Am Lehrstuhl Datenbanksysteme konstruieren wir den XQuery-Compiler Pathfinder, der Code zur direkten Ausführung auf verschiedenen RDBMS erzeugen kann. Wir werden dieses System für die praktische Arbeit in Vorlesung und Übung einsetzen. Übrigens: die Arbeit an Pathfinder läuft unter einer Open-Source-Lizenz. Bei Interesse sind die Teilnehmer dieser Vorlesung eingeladen, den Compiler und sein Laufzeitsystem genau unter die Lupe zu nehmen.

Folienskript

Im Laufe des Semesters wird hier das Folienskript der Vorlesung zum Download verfügbar gemacht (jeweils vor den Vorlesungsterminen - es empfiehlt sich einen Ausdruck der Folien mit in die Vorlesung zu bringen und diese mit Notizen etc. anzureichern). Der Folientext ist in Englisch verfasst, die Vorlesung selbst wird auf Deutsch gehalten.


Kapitel (Foliensatz in PDF) Komplett? (¼, ½, ¾, +)
00 & 01 Introduction +
02 Markup Basics +
03 Well-Formed XML +
04 DOM — Document Object Model +
05 SAX — Simple API for XML +
06 Valid XML — DTDs and XML Schema +
07 Querying XML — The XQuery Data Model +
08 XPath — Navigating XML Documents +
09 XSLT — Transforming XML Documents (not covered)
10 XQuery — Querying XML Documents (not covered)
11 Mapping Relational Databases to XML +
12 Mapping XML to Databases +
13 Index Support +
14 XPath Accelerator Optimization +
15 Updating XML Documents (not covered)
16 Serialization, Shredding, and More on Pre/Post Encoding +
17 Staircase Join +

 

Weitere Literatur sind die Materialien des World Wide Web Consortiums (W3C) zu den XML-Standards (Links im Skript), wiss. Artikel zu Pathfinder sowie die Bücher

  • XQuery von Priscilla Walmsley
    (O'Reilly 2007, ISBN 0-596-00634-9)

Zeit und Ort


Zeit Ort
Vorlesung Do. 10:15-11:45
Raum A104
Übung Di, 14:15-15:45 Sand 6/7 kleiner Hörsaal

 

Die Klausur findet in der letzten Vorlesungswoche am Donnerstag, den 07.2.2013 statt.

Übungsaufgaben

Nr. Besprechung Übungsblatt weitere Materialien
01 30.10.2012 Übungsblatt 1
02 13.11.2012 Übungsblatt 2
03 20.11.2012 Übungsblatt 3 dilbert.xml & notenliste.xml
04 20.11.2012 Übungsblatt 4
05 28.11.2012 Übungsblatt 5 dilbert.zip
06 11.12.2012 Übungsblatt 6 email.zip
07 18.12.2012 Übungsblatt 7 doc.xml & doc.sql
08 08.01.2013 Übungsblatt 8 doc.xml
09 15.01.2013 Übungsblatt 9
10 22.01.2013 Übungsblatt 10
11 29.01.2013 Übungsblatt 11 doc2.xml

Semesterwochenstunden / Leistungspunkte / Hörerkreis

  • 2 SWS Vorlesung
  • 2 SWS Übung zur Vorlesung
  • 6 LP (Modul Pr)
  • Studierende im Hauptstudium Diplom Informatik, Bioinformatik und Lehramt Informatik
  • Studierende in Informatik-Masterstudiengängen
  • Studierende in Informatik-Bachelorstudiengängen
  • Teilnehmer, die einen Übungsschein benötigen, müssen im Laufe des Semesters jeweils drei ausgewählte Aufgaben in der Übung vorrechnen. Diese Aufgaben werden auf den Übungszetteln gesondert markiert.

Voraussetzungen

  • Modul Datenbanksysteme oder vgl. Vorkenntnisse

Dozenten

Prof. Dr. Torsten Grust und Alexander Ulrich.