Informationsstrukturierung: Fr, 28.10.2016

Text und Datenstruktur

In dieser Übung werden wir uns um die Frage bemühen, wie man seine Daten strukturieren soll. Dazu ein Szenario.

Eine Universität hat in ihrer Datenverwaltung eine ganze Reihe von Daten zu ihren Studentinnen und Studenten. Dazu gehören neben der Matrikelnummer und persönlichen Daten (die nicht weiter interessieren sollen) vielmehr die Leistungsbuchungen aus den Kursen. Bei diesen Buchungen werden die Veranstaltung, ihre eKVV Nummer, Modulzuordnungen und mehr erfasst.

Sinn und Zweck dieser Daten ist es, zu jedem Moment (und insbesondere am Ende des Studiums) ein vollständiges Bild über die erbrachten Leistungen sowie Noten zu haben. Wir benötigen minimal:

Angesichts früherer Erfahrungen mit diesem Kurs hier ein Hinweis: geizen Sie bitte mit irrelevanten Informationen; diese erfordern zu viel Zeit. Es genügen also Listen von Namen, Vornamen, Matrikelnummern, also keine Adressen, Telefonnummern, Angaben zu Studiengängen, Hobbys und Haustieren; dazu kommen Veranstaltungen mit Namen, Semester, Veranstaltungsnummer, Modulkürzeln; desweiteren eine Liste von Klausurergebnissen (minimal Datum, Kurs, Matrikelnummer). Das sollte fürs Erste genügen. Nehmen sie nicht zu viele Personen auf aber bitte nicht nur eine oder zwei. Die Daten sollen aussagekräftig sein.

Daraus können und sollen im Bedarfsfall die folgenden Daten erzeugt werden.

  1. Ein persönliches Transkript, zu einem beliebigen Datum erstellbar.
  2. Ein persönliches Abschlusszeugnis.
  3. Eine Übersicht über die verbuchten Leistungen.
  4. Eine anonymisierte Leistungsstatistik für Kurse.
Wie so etwas gehen kann, werden wir in diesem Kurs besprechen.

Zunächst sollen Sie eine Skizze (auf Papier) anfertigen, wie Sie die Daten in XML strukturieren wollen. Geben Sie mir diese Skizze persönlich ab.

Im Anschluss an diese Skizze werden Sie gebeten, einen Datensatz zu erstellen, der als Datenbank der Universität fungieren kann. (Dazu werden Sie dann ein Schema erstellen und Transformationen in andere Daten programmieren, die die obigen Funktionen darstellen werden.)


Achtung:

  1. Jede Datei, die Sie in den Lernraum geben, muss in dem Dateinamen zunächst Ihren Namen enthalten, getrennt durch Unterstriche, und als drittes dann einen Zusatz wie uebung1 oder ein ähnlicher Zusatz. Bitte keine Matrieklnummern verwenden, ich kann damit nichts anfangen, und sie werden automatisch, dh vom System mitgeliefert. (Also etwa so: gustav_gans_ueb1.xml oder dorette_duck_ueb1.zip.)
  2. Benutzen Sie keine Umlaute und andere Sonderzeichen in Dateinamen. Die Dateien können von mir ansonsten nur mit Mühe verwaltet werden. (Sie können genaue Informationen auch in der Datei selbst als Kommentar unterbringen, machen Sie also davon Gebrauch.)
  3. Bitte benutzen Sie zum Archivieren und Bündeln von Dateien nur das .zip-Format.
  4. Laden Sie jede Woche bitte nur genau einmal eine Datei (oder ein Archiv) hoch. Mindestens einmal, weil das Teil Ihrer Studienleistung ist: Sie sollen jede Woche abgeben. Höchstens einmal, weil ich so viele Dateien nicht wirklich lesen und würdigen kann.