COMPUTERLINGUISTIK

Herzlich Willkommen

auf den Seiten der Computerlinguistik. Wir sind neben Linguistik und Informationswissenschaft eine Abteilung des Instituts für Sprache und Information und an der Philosophischen Fakultät der Heinrich-Heine-Universität Düsseldorf angesiedelt. Die Abteilung hat einen Lehrstuhl für Computerlinguistik, der seit 2011 von Prof. Dr. Laura Kallmeyer besetzt ist. Daneben hat Dr. Wiebke Petersen eine Junior-Professur für Mathematische Linguistik und es gibt etwa 15 weitere wissenschaftliche Mitarbeiter in Forschung und Lehre. In der Lehre bedienen wir die Bachelor- und Masterstudiengänge Linguistik sowie Informationswissenschaft und Sprachtechnologie. Promotion ist ebenfalls möglich. In der Forschung sind wir mit 4 Projekten in den SFB 991 eingebunden und haben daneben noch 4 weitere Projekte. Unser thematischer Schwerpunkt in Forschung und Lehre umfasst schwach kontextsensitive Grammatikformalismen, Finite-State-Techniken, statistische maschinelle Übersetzung und Wissensrepräsentation auf Basis von Frames.

Aktuelles

Vortragsankündigung

Jackie C. K. Cheung (Toronto)
06.11.2014, um 14.30 Uhr in Raum 23.21.U1.72

Towards Large-Scale Natural Language Inference with Distributional Semantics

Language understanding and semantic inference are crucial for solving complex natural language applications, from intelligent personal assistants to automatic summarization systems. However, current systems often require hand-coded information about the domain of interest, an approach that will not scale up to the large array of possible domains and topics in text collections today. In this talk, I demonstrate the potential of distributional semantics (DS), an approach to modelling meaning by using the contexts in which a word or phrase appears, to assist in acquiring domain knowledge and to support the desired inference, with applications to automatic summarization and natural language generation. I present a method that integrates phrasal DS representations into a probabilistic model in order to learn about the important events and slots in a domain, resulting in state-of-the-art performance on template induction and multi-document summarization for systems that do not rely on hand-coded domain knowledge. I also propose to evaluate DS by their ability to support inference, the hallmark of any semantic formalism, and discuss their use in a text-to-text generation setting. These results demonstrate the utility of DS for current natural language applications, and provide a principled framework for measuring progress towards automated inference in any domain.

Video-Interview mit Laura Kallmeyer

Videoplayer