COMPUTERLINGUISTIK

Herzlich Willkommen

auf den Seiten der Computerlinguistik. Wir sind neben Linguistik und Informationswissenschaft eine Abteilung des Instituts für Sprache und Information und an der Philosophischen Fakultät der Heinrich-Heine-Universität Düsseldorf angesiedelt. Die Abteilung hat einen Lehrstuhl für Computerlinguistik, der seit 2011 von Prof. Dr. Laura Kallmeyer besetzt ist. Daneben hat Dr. Wiebke Petersen eine Junior-Professur für Mathematische Linguistik und es gibt etwa 15 weitere wissenschaftliche Mitarbeiter in Forschung und Lehre. In der Lehre bedienen wir die Bachelor- und Masterstudiengänge Linguistik sowie Informationswissenschaft und Sprachtechnologie. Promotion ist ebenfalls möglich. In der Forschung sind wir mit 4 Projekten in den SFB 991 eingebunden und haben daneben noch 4 weitere Projekte. Unser thematischer Schwerpunkt in Forschung und Lehre umfasst schwach kontextsensitive Grammatikformalismen, Finite-State-Techniken, statistische maschinelle Übersetzung und Wissensrepräsentation auf Basis von Frames.

Aktuelles

Vortragsankündigung

Wolfgang Maier (HHU)
23.10.2014, um 14.30 Uhr in Raum 23.21.U1.72

Language variety identification in Spanish tweets

We study the problem of language variant identification, approximated by the problem of labeling tweets from Spanish speaking countries by the country from which they were posted. While this task is closely related to “pure” language identification, it comes with additional complications. We build a balanced collection of tweets and apply techniques from language modeling. A simplified version of the task is also solved by human test subjects, who are outperformed by the automatic classification. Our best automatic system achieves an overall F-score of 67.7% on 5-class classification.
Joint work with Carlos Gómez Rodríguez, Universidade da Coruña, Spain

Video-Interview mit Laura Kallmeyer

Videoplayer