Informationsstrukturierung: Fr, 28.10.2016
Text und Datenstruktur
In dieser Übung werden wir uns um die Frage bemühen, wie
man seine Daten strukturieren soll. Dazu ein Szenario.
Eine Universität hat in ihrer Datenverwaltung eine ganze Reihe von
Daten zu ihren Studentinnen und Studenten. Dazu gehören neben der
Matrikelnummer und persönlichen Daten (die nicht weiter interessieren
sollen) vielmehr die Leistungsbuchungen aus den Kursen. Bei diesen
Buchungen werden die Veranstaltung, ihre eKVV Nummer, Modulzuordnungen
und mehr erfasst.
Sinn und Zweck dieser Daten ist es, zu jedem Moment (und insbesondere
am Ende des Studiums) ein vollständiges Bild über die erbrachten Leistungen
sowie Noten zu haben. Wir benötigen minimal:
- Ein Personenverzeichnis
- Ein Veranstaltungsverzeichnis
- Eine Liste, welche zu den jeweiligen Veranstaltungen die Teilnehmer
und ihre Leistungen auflistet.
Angesichts früherer Erfahrungen mit diesem Kurs hier ein Hinweis: geizen
Sie bitte mit irrelevanten Informationen; diese erfordern zu viel Zeit.
Es genügen also Listen von Namen, Vornamen, Matrikelnummern, also keine
Adressen, Telefonnummern, Angaben zu Studiengängen, Hobbys und Haustieren;
dazu kommen Veranstaltungen mit Namen, Semester, Veranstaltungsnummer,
Modulkürzeln; desweiteren eine Liste von Klausurergebnissen (minimal Datum,
Kurs, Matrikelnummer). Das sollte fürs Erste genügen. Nehmen sie nicht zu
viele Personen auf aber bitte nicht nur eine oder zwei. Die Daten sollen
aussagekräftig sein.
Daraus können und sollen im Bedarfsfall die folgenden Daten erzeugt werden.
- Ein persönliches Transkript, zu einem beliebigen Datum erstellbar.
- Ein persönliches Abschlusszeugnis.
- Eine Übersicht über die verbuchten Leistungen.
- Eine anonymisierte Leistungsstatistik für Kurse.
Wie so etwas gehen kann, werden wir in diesem Kurs besprechen.
Zunächst sollen Sie eine Skizze (auf Papier) anfertigen, wie Sie die
Daten in XML strukturieren wollen. Geben Sie mir diese Skizze
persönlich ab.
Im Anschluss an diese Skizze werden Sie gebeten, einen Datensatz
zu erstellen, der als Datenbank der Universität fungieren kann.
(Dazu werden Sie dann ein Schema erstellen und Transformationen
in andere Daten programmieren, die die obigen Funktionen darstellen
werden.)
Achtung:
-
Jede Datei, die Sie in den Lernraum geben, muss in dem Dateinamen
zunächst Ihren Namen enthalten, getrennt durch Unterstriche, und als drittes
dann einen Zusatz wie uebung1 oder ein ähnlicher Zusatz. Bitte keine
Matrieklnummern verwenden, ich kann damit nichts anfangen, und sie werden
automatisch, dh vom System mitgeliefert. (Also etwa so:
gustav_gans_ueb1.xml
oder
dorette_duck_ueb1.zip
.)
-
Benutzen Sie keine Umlaute und andere Sonderzeichen in Dateinamen.
Die Dateien können von mir ansonsten nur mit Mühe verwaltet werden. (Sie
können genaue Informationen auch in der Datei selbst als Kommentar unterbringen,
machen Sie also davon Gebrauch.)
-
Bitte benutzen Sie zum Archivieren und Bündeln von Dateien
nur das
.zip
-Format.
-
Laden Sie jede Woche bitte nur genau einmal eine Datei (oder ein Archiv)
hoch. Mindestens einmal, weil das Teil Ihrer Studienleistung ist: Sie sollen
jede Woche abgeben. Höchstens einmal, weil ich so viele Dateien nicht
wirklich lesen und würdigen kann.