- Stefan Langer, Centrum für Informations- und Sprachverarbeitung, Universität München/Elexir GmbH (Fast Search & Transfer), München, zum Thema Sprachverarbeitung in Internet-Suchmaschinen. Ort: Komplex Golm, Haus 24, R.075. Zeit: Dienstag, 07. Mai '02, 17 Uhr s.t.
Abstract
Das WWW ist die umfangreichste existierende Sammlung elektronischer
Texte - und sicherlich auch die heterogenste. Sinnvolle Navigation in
dieser Textsammlung ist nur möglich durch die Existenz von
Internet-Suchmaschinen wie Google, AllTheWeb oder AltaVista. Nach einer
Übersicht über die Hauptanforderungen an Suchmaschinen und die
wichtigsten Problemstellungen, werde ich in meinem Vortrag zunächst
Methoden der Sprachverarbeitung vorstellen, die im
Internet-Dokumentretrieval bereits ein Rolle spielen, und dann versuchen
zu zeigen, welche Möglichkeiten zur Optimierung der Suche und des
Ranking von Treffern aus linguistischer Perspektive noch bestehen. Der
Schwerpunkt liegt auf der Präsentation der Sprachverarbeitung in
AllTheWeb, aber auch die wichtigsten Konkurrenten (v.a. Google) sollen
nicht unerwähnt bleiben.