Database Research Group

WSI – Database Systems Research Group

Database-Supported XML Processors



Relationale Datenbanksysteme (RDBMS) wurden ursprünglich entworfen, um tabellenstrukturierte Daten halten und anfragen zu können. In dieser Vorlesung werden wir untersuchen, wie sich diese Systeme in XML-, XPath- und -XQuery-Prozessoren verwandeln lassen, die Massen von XML-Daten effizienter verarbeiten können, als die weitaus meisten verbreiteteten XML-Prozessoren.

Diese Technologie basiert vor allem auf "cleveren" Abbildungen des XQuery-Datenmodells (geordnete Bäume und Sequenzen) und der XQuery-Semantik auf die tabellenorientierten Strukturen und Anfragesprachen (relationale Algebra und SQL) der RDBMS.

Wir werden dazu u.a.,

  • die Transformation von Bäumen (XML-Daten) in Tabellenstrukturen,
  • die Übersetzung und Auswertung von XPath-Anfragen auf diesen Tabellen,
  • mögliche Änderungen am RDBMS-Kernel, die diese Operationen effizient machen, und
  • die Compilation von XQuery in relationale Programme (relationale Algebra und SQL) und deren Auswertung

untersuchen.

Es werden sich teilweise ungewöhnliche und sehr interessante Sichten auf die Anfrageübersetzung und -verarbeitung, Indexstrukturen, etc. in RDBMS ergeben. Parallel dazu werden wir XML, die Anfragesprachen XPath und XQuery, und XML Schema genauestens kennenlernen.

Diese Veranstaltung wird keine "Trockenübung" sein. Am Lehrstuhl Datenbanksysteme konstruieren wir den XQuery-Compiler Pathfinder, der Code zur direkten Ausführung auf verschiedenen RDBMS erzeugen kann. Wir werden dieses System für die praktische Arbeit in Vorlesung und Übung einsetzen. Übrigens: die Arbeit an Pathfinder läuft unter einer Open-Source-Lizenz. Bei Interesse sind die Teilnehmer dieser Vorlesung eingeladen, den Compiler und sein Laufzeitsystem genau unter die Lupe zu nehmen.

Weitere Literatur

Sind die Materialien des World Wide Web Consortiums (W3C) zu den XML-Standards (Links im Skript), wiss. Artikel zu Pathfinder sowie die Bücher

Semesterwochenstunden / Leistungspunkte / Hörerkreis

  • 2 SWS Vorlesung
  • 2 SWS Übung zur Vorlesung
  • 6 LP (Modul Pr)
  • Studierende im Hauptstudium Diplom Informatik, Bioinformatik und Lehramt Informatik
  • Studierende in Informatik-Masterstudiengängen
  • Studierende in Informatik-Bachelorstudiengängen
  • Teilnehmer, die einen Übungsschein benötigen, müssen im Laufe des Semesters jeweils drei ausgewählte Aufgaben in der Übung vorrechnen. Diese Aufgaben werden auf den Übungszetteln gesondert markiert.

Voraussetzungen

Modul Datenbanksysteme oder vgl. Vorkenntnisse


Slides
NrChapterDownload
1

Introduction

pdf
2

Markup Basics

pdf
3

Well-Formed XML

pdf
4

DOM — Document Object Model

pdf
5

SAX — Simple API for XML

pdf
6

Valid XML — DTDs and XML Schema

pdf
7

Querying XML — The XQuery Data Model

pdf
8

XPath — Navigating XML Documents

pdf
9

XQuery — Querying XML Documents

(not covered)

pdf
10

Mapping Relational Databases to XML

pdf
11

Mapping XML to Databases

pdf
12

Index Support

pdf
13

XPath Accelerator Optimization

pdf
14

Updating XML Documents

(not covered)

pdf
15

Serialization, Shredding, and More on Pre/Post Encoding

pdf
16

Staircase Join

pdf
Additional material (code, data)