COMPUTERLINGUISTIK

Compuerlinguistik Forschung

In der Computerlinguistik verfolgen wir die folgenden Forschungsschwerpunkte:

Framesemantik

Im SFB 991 gehen wir davon aus, dass Frames ein universelles Beschreibungsmittel für kognitive Konzepte sind. In unserer Forschung geht es um die formale Modellierung von Frames sowie um die Verwendung von Frames bei der Repräsentation von Konzepten mit sprachlichen Ausdrücken.

Parsing

Unser Fokus hier ist die Untersuchung und Weiterentwicklung von schwach kontextsensitiven Grammatikformalismen, also Formalismen, die eine größere Auswahl an formellen Sprachen erfassen als kontextfreie Grammatiken, ohne dabei exponentielle Laufzeiten zu benötigen. Die untersuchten Formalismen sind insbesondere TAG, LCFRS und RCG. Ein Kernpunkt ist das Open Source Projekt TuLiPA.

Finite State Methoden

Endliche Automaten sind die Ferraris unter den sprachverarbeitenden Maschinen. Wir verwenden sie bei der Konstruktion von Lemmatisierern und bei der Identifikation von Possessivkonstruktionen in Dependenzbäumen.

Korpusbasierte Methoden

Annotierte Korpora sind eine Quelle für maschinelles Lernen. Wir sammeln und konstruieren Korpora für verschieden Projekte im SFB 991 und verwenden sie in der eigenen Forschung.

Grammatikformalismen

Hier beschäftigen wir uns insbesondere mit Tree Adjoining Grammars (TAG) und Linear Context Free Rewriting Systems (LCFRS).

Maschinelle Übersetzung

Hier untersuchen wir Wort Alignment Verfahren und die Kombination von Grammatikformalismen und maschineller Übersetzung (sogenannte baumbasierte Verfahren).

Formalisierung der Astadhyayi

Wir vergleichen die über 2000 Jahre alten phonologischen Beschreibungssysteme Paninis mit moderen merkmalsbasierten Ansätzen im Blick auf ihre Adäquatheit.