Prof. Dr. Marcus Kracht

Vorlesung Einführung in die Computerlinguistik und Sprachtechnologie (230013)

Ort und Zeit: Montags 14-16. X-E1-202.

Sprechstunde: Mo 10-11

Materialien und Planung

  1. "Einführung in die Sprachtechnologie und Computerlinguistik". Darin findet sich
    • Eine Einführung in OCaml (Installation, Funktionsweise);
    • Kapitel zu Automatentheorie, Transduktoren, Parsing.
    Das Manuskript wurde ursprünglich für eine 4-stündige Veranstaltung konzipiert, enthält also mehr Stoff als nötig.
  2. "Formale Sprachen". Skript für eine gleichnamige Vorlesung.

Weiteres Material:

  • Carstensen et. al: Computerlinguistik und Sprachtechnologie, Spektrum Verlag, Berlin, 2004,
  • Partee, Wall, ter Meulen: Mathematical Methods in Linguistics, Kluwer, Dordrecht, 1990.
  • Emmanuel Chailloux, Pascal Manoury und Bruno Pagano: Developing Applications with Objective Caml (soll bei O'Reilly erscheinen).
  • Reference Manual OCaml 4.03 (in der Distribution enthalten).
  • ../../software/chart.ml ein Chart-Parser.
  • ../../software/fstate.ml ein Programm zur Manipulation von Automaten.
  • huelle.ml ein Programm zur schnellen Berechnung der transitiven Hülle.
  • Ein Programm, mit dem man eine Zeichenkette anhand eines regulären Ausdrucks direkt parsen kann. Anleitung. Nur für Unix geeignet. Man benötigt folgende Dateien:
    1. rg.ml (enthält die Typdefinitionen)
    2. rellex.mll (enthält den Lexer)
    3. regx.mly (enthält den Parser)
    4. excute.ml (enthält die Manipulationsalgorithmen für reguläre Terme)
    5. sequenz (enthält die gesamte Installation)
    6. ocamlinit (das Initialisierungsprogramm, bitte erst umbenennen in .ocamlinit)
    Zunächst müssen Sie die Dateien in ein Verzeichnis packen, möglichst separat (weil Ihnen bei Ihrer sonstigen Arbeit .ocamlinit ständig in die Quere kommt, weil es immer die gleichen Dateien lädt). Machen Sie die Datei sequenz ausführbar (also chmod +x sequenz). Anschließend ocaml und es meldet sich das Programm.

Zeitplanung. Die Zeitplanung ist nur provisorisch. Ich werde mich bemühen, den jeweiligen Stand genau abzubilden. Eine Garantie dafür gebe ich allerdings nicht. Wenn Sie eine Veranstaltung nicht besuchen, müssen sie sich selbst darum kümmern, dass Sie den Stoff nachholen.

  • 17.10.2016. Vorbesprechung. Grundtypen.
  • 24.10.2016. Typen und Funktionen. 1. Übung.
  • 31.10.2016. Rekursion 2. Übung.
  • 07.11.2016. Kombinatorische Logik. 3. Übung.
  • 14.11.2016. Typentheoretische Semantik. 4. Übung.
  • 21.11.2016. Buchstaben und Zeichenketten, Reguläre Ausdrücke. 5. Übung.
  • 28.11.2016. Reguläre Gleichungssysteme. 6. Übung.
  • 05.12.2016. Endliche Automaten. 7. Übung.
  • 12.12.2016. Kontextfreie Grammatiken: Parsing. 8. Übung
  • 19.12.2016. AB-Kategorialgrammatik I. Syntax. (keine Übungen)
  • 09.01.2017. AB-Kategorialgrammatik II. Semantik. 9. Übung.
  • 16.01.2017. Kombinatorische Kategorialgrammatiken I. 10. Übung.
  • 23.01.2017. Kombinatorische Kategorialgrammatiken II.
  • 30.02.2017.
  • 06.02.2017. Klausur.

Leistungskriterien

Für eine Einzelleistung (unbenoteter/benoteter Schein) müssen Sie die Klausur bestehen (die Hälfte der Punkte erzielen). Dies entspricht der Mindestnote von 4.0 (ausreichend) für einen benoteten Schein. Für Studienleistungen gelten andere Bedingungen.
Marcus Kracht
Zuletzt geändert: So 15. Januar 2017 11:00:00 CET