Talks and Abstracts


  • Stefan Langer, Centrum für Informations- und Sprachverarbeitung, Universität München/Elexir GmbH (Fast Search & Transfer), München, zum Thema Sprachverarbeitung in Internet-Suchmaschinen. Ort: Komplex Golm, Haus 24, R.075. Zeit: Dienstag, 07. Mai '02, 17 Uhr s.t.

    Abstract

    Das WWW ist die umfangreichste existierende Sammlung elektronischer Texte - und sicherlich auch die heterogenste. Sinnvolle Navigation in dieser Textsammlung ist nur möglich durch die Existenz von Internet-Suchmaschinen wie Google, AllTheWeb oder AltaVista. Nach einer Übersicht über die Hauptanforderungen an Suchmaschinen und die wichtigsten Problemstellungen, werde ich in meinem Vortrag zunächst Methoden der Sprachverarbeitung vorstellen, die im Internet-Dokumentretrieval bereits ein Rolle spielen, und dann versuchen zu zeigen, welche Möglichkeiten zur Optimierung der Suche und des Ranking von Treffern aus linguistischer Perspektive noch bestehen. Der Schwerpunkt liegt auf der Präsentation der Sprachverarbeitung in AllTheWeb, aber auch die wichtigsten Konkurrenten (v.a. Google) sollen nicht unerwähnt bleiben.