Prof. Dr. Marcus Kracht
Vorlesung Einführung in die Computerlinguistik und Sprachtechnologie (230013)
Ort und Zeit:
Montags 14-16. X-E1-202.
Sprechstunde: Mo 10-11
Materialien und Planung
- "Einführung in die Sprachtechnologie und
Computerlinguistik". Darin findet sich
- Eine Einführung in OCaml (Installation, Funktionsweise);
- Kapitel zu Automatentheorie, Transduktoren, Parsing.
Das Manuskript wurde ursprünglich für eine 4-stündige Veranstaltung
konzipiert, enthält also mehr Stoff als nötig.
- "Formale Sprachen". Skript für eine
gleichnamige Vorlesung.
Weiteres Material:
-
Carstensen et. al: Computerlinguistik und
Sprachtechnologie, Spektrum Verlag,
Berlin, 2004,
- Partee, Wall, ter Meulen: Mathematical
Methods in Linguistics, Kluwer, Dordrecht,
1990.
- Emmanuel Chailloux, Pascal Manoury und Bruno
Pagano: Developing
Applications with Objective Caml (soll
bei O'Reilly erscheinen).
- Reference Manual
OCaml 4.03 (in der Distribution enthalten).
- ../../software/chart.ml ein Chart-Parser.
- ../../software/fstate.ml ein Programm
zur Manipulation von Automaten.
- huelle.ml ein Programm
zur schnellen Berechnung der transitiven Hülle.
- Ein Programm, mit dem man eine Zeichenkette anhand eines regulären
Ausdrucks direkt parsen kann. Anleitung. Nur für Unix
geeignet. Man benötigt folgende Dateien:
- rg.ml (enthält die Typdefinitionen)
- rellex.mll (enthält den Lexer)
- regx.mly (enthält den Parser)
- excute.ml (enthält die Manipulationsalgorithmen für reguläre Terme)
- sequenz (enthält die gesamte Installation)
- ocamlinit (das Initialisierungsprogramm, bitte
erst umbenennen in
.ocamlinit )
Zunächst müssen Sie die Dateien in ein Verzeichnis packen, möglichst
separat (weil Ihnen bei Ihrer sonstigen Arbeit .ocamlinit
ständig in die Quere kommt, weil es immer die gleichen Dateien lädt).
Machen Sie die Datei sequenz ausführbar (also
chmod +x sequenz ). Anschließend ocaml
und es meldet sich das Programm.
Zeitplanung.
Die Zeitplanung ist nur provisorisch. Ich werde mich bemühen, den
jeweiligen Stand genau abzubilden. Eine Garantie dafür gebe ich
allerdings nicht. Wenn Sie eine Veranstaltung nicht besuchen, müssen
sie sich selbst darum kümmern, dass Sie den Stoff nachholen.
- 17.10.2016. Vorbesprechung. Grundtypen.
- 24.10.2016. Typen und Funktionen. 1. Übung.
- 31.10.2016. Rekursion 2. Übung.
- 07.11.2016. Kombinatorische Logik.
3. Übung.
- 14.11.2016. Typentheoretische Semantik.
4. Übung.
- 21.11.2016. Buchstaben und Zeichenketten, Reguläre Ausdrücke.
5. Übung.
- 28.11.2016. Reguläre Gleichungssysteme.
6. Übung.
- 05.12.2016. Endliche Automaten.
7. Übung.
- 12.12.2016. Kontextfreie Grammatiken: Parsing.
8. Übung
- 19.12.2016. AB-Kategorialgrammatik I. Syntax. (keine Übungen)
- 09.01.2017. AB-Kategorialgrammatik II. Semantik.
9. Übung.
- 16.01.2017. Kombinatorische Kategorialgrammatiken I.
10. Übung.
- 23.01.2017. Kombinatorische Kategorialgrammatiken II.
- 30.02.2017.
- 06.02.2017. Klausur.
Leistungskriterien
Für eine Einzelleistung (unbenoteter/benoteter
Schein) müssen Sie die Klausur bestehen (die Hälfte
der Punkte erzielen). Dies entspricht der Mindestnote
von 4.0 (ausreichend) für einen benoteten
Schein. Für Studienleistungen gelten andere Bedingungen.
Marcus Kracht
Zuletzt geändert: So 15. Januar 2017 11:00:00 CET
|