Compuerlinguistik Forschung
In der Computerlinguistik verfolgen wir die folgenden Forschungsschwerpunkte:
Framesemantik
Im SFB 991 gehen wir davon aus, dass Frames ein universelles Beschreibungsmittel für kognitive Konzepte sind. In unserer Forschung geht es um die formale Modellierung von Frames sowie um die Verwendung von Frames bei der Repräsentation von Konzepten mit sprachlichen Ausdrücken.
Parsing
Unser Fokus hier ist die Untersuchung und Weiterentwicklung von schwach kontextsensitiven Grammatikformalismen, also Formalismen, die eine größere Auswahl an formellen Sprachen erfassen als kontextfreie Grammatiken, ohne dabei exponentielle Laufzeiten zu benötigen. Die untersuchten Formalismen sind insbesondere TAG, LCFRS und RCG. Ein Kernpunkt ist das Open Source Projekt TuLiPA.
Finite State Methoden
Endliche Automaten sind die Ferraris unter den sprachverarbeitenden Maschinen. Wir verwenden sie bei der Konstruktion von Lemmatisierern und bei der Identifikation von Possessivkonstruktionen in Dependenzbäumen.
Korpusbasierte Methoden
Annotierte Korpora sind eine Quelle für maschinelles Lernen. Wir sammeln und konstruieren Korpora für verschieden Projekte im SFB 991 und verwenden sie in der eigenen Forschung.
Grammatikformalismen
Hier beschäftigen wir uns insbesondere mit Tree Adjoining Grammars (TAG) und Linear Context Free Rewriting Systems (LCFRS).
Maschinelle Übersetzung
Hier untersuchen wir Wort Alignment Verfahren und die Kombination von Grammatikformalismen und maschineller Übersetzung (sogenannte baumbasierte Verfahren).
Formalisierung der Astadhyayi
Wir vergleichen die über 2000 Jahre alten phonologischen Beschreibungssysteme Paninis mit moderen merkmalsbasierten Ansätzen im Blick auf ihre Adäquatheit.
