Themen
Unsere Forschung ist sehr breit gefächert und deckt eine Vielzahl von Themen der Computerlinguistik, der Allgemeinen Sprachwissenschaft und der Vergleichenden Sprachwissenschaft ab. Darüber hinaus sind wir an wissenschaftlichen Methoden allgemein interessiert und widmen uns diesen im Rahmen unserer Arbeit mit linguistischen Fragestellungen.
Methoden des Sprachvergleichs
Der Sprachvergleich – sei er nun typologisch oder historisch orientiert – hat eine lange Tradition in der Linguistik, die weit bis in die Anfänge des 19. Jahrhunderts zurück geht. Dank neuer computergestützter Methoden und einer viel größeren Verfügbarkeit vor allem auch digitaler Sprachdaten ist es uns nun möglich, die klassische Methodologie neu zu bewerten und durch die Hinzunahme von Computerverfahren auch mitunter zu verbessern. Im Rahmen unserer Forschng entwickeln wir dabei aktiv neue computergestützte Methoden, mit deren Hilfe wir konkrete Probleme im historischen und typologischen Sprachvergleich lösen wollen.
Computergestützte Chinesische Historische Phonologie
Chinesisch ist eine historisch überaus gut dokumentierte Sprache. Dies ermöglicht es uns, die Entwicklung der Sprache in einem sehr großen Detail zu untersuchen. Viele Faktoren erschweren die Untersuchung jedoch. So erlaubt das chinesische Schriftbild kaum Rückschluss auf die Lesung der Wörter, weshalb wir mühsam rekonstruieren müssen, wie das Chinesische vor hunderten von Jahren geklungen hat. Auch verdeckt die Schrift die große dialektale Vielfalt im Chinesischen, die sich in einer Vielzahl gegenseitig nicht verständlicher Dialektvarietäten widerspiegelt, deren Entwicklung ebenfalls mühsam rekonstruiert werden muss. Im Rahmen der Multilingualen Computerlinguistik versuchen wir, die vielen Verfahren, die im Rahmen der sogenannten Traditionellen Chinesischen Phonologie entwickelt wurden, sukzessive mit computergestützten Verfahren zu unterfüttern und zu ergänzen. Unsere Arbeiten reichen von Netzwerkanalysen über phonetische Alinierung bis hin zur phylogenetischen Rekonstruktion der chinesischen Dialektgeschichte.
Sprachkontakt und Sprachwandel
Alle Sprachen wandeln sich so lange sie existieren, das hat schon August Schleicher im Jahr 1863 gesagt, und es ist bis heute gültig geblieben. Der Sprachwandel verläuft in interessanten Bahnen, welche alle Kernbereiche der Sprache betreffen und somit von der Phonologie (oder dem Lautstand) über die Aussprache einzelner Wörter und über deren Bedeutung bis hin zu Morphologie und Syntax reichen. Sprachen wandeln sich dabei unabhängig davon, ob sie mit anderen Sprachen in Kontakt kommen, doch wenn Sprachkontakt eintritt, werden die Wandelprozesse ungleich komplizierter und auch faszinierender, vor allen auch deshalb, weil Wörter nicht nur konkret, sondern auch indirekt entlehnt werden können (wie beim deutschen Wort Wolkenkratzer, das dem Englischen skyscraper nachempfunden wurde). Wir erforschen Sprachwandel und Sprachkontakt auf vielfältige Weise und versuchen dabei vor allem, neue Methoden zu entwickeln, mit deren Hilfe Sprachkontakt und Sprachwandel computergestützt untersucht werden können.
Geschichte und Entwicklung ausgesuchter Sprachfamilien in Südostasien und Südamerika
Unsere Arbeit verharrt nicht im Abstrakten sondern basiert immer auf konkreten Beispielen aus konkreten Sprachfamilien. Thematische Schwerpunkte liegen hierbei am Lehrstuhl aufgrund von Kollaborationen und Forschungserfahrung im Bereich von Sprachfamilien in Südostasien und Südamerika. Speziell in Südostasien haben sich Sprachen aus sehr unterschiedlichen Sprachfamilien in sehr engem Kontakt miteinander über Jahrtausende hinweg entwickelt. In Südamerika finden wir auch Sprachfamilien, die sich in sehr engem Kontakt miteinander entwickelt haben. Darüber hinaus finden wir in beiden Regionen dominante Sprachen wie Chinesisch oder Spanisch vor, die häufig einen starken Einfluss auf die Entwicklung weniger dominanter Sprachvarietäten mit einer kleineren Anzahl an Sprecherinnen und Sprechern gehabt haben. Unsere Arbeit beruht auf dem Sammeln von Daten zu individuellen Sprachfamilien und deren Analyse mit Hilfe der von uns entwickelten Tools.
Lexikalische Typology
Die lexikalische Semantik beschäftigt sich mit der Bedeutung von Wörtern in individuellen Sprachen im Speziellen und in menschlichen Sprachen im Allgemeinen. Die Lexikalische Typologie versucht, die Strukturen des Lexikons in den Sprachen der Welt miteinander zu vergleichen, um Gemeinsamkeiten, Unterschiede, und grundlegende Tendenzen der Entwicklung und Strukturierung zu identifizieren. Die Multilinguale Computerlinguistik kann über die Hinzunahme von Computermethoden einen sehr spezifischen Beitrag zur Lexikalischen Typologie leisten, indem sie Verfahren anwendet, ausbaut, und entwickelt, mit deren Hilfe sich lexikalische Strukturen in den Sprachen der Welt vergleichen lassen. Diese Verfahren sind grundlegend computergestützt und machen Gebrauch von lexikalischen Daten, die auf verschiedene Arten standardisiert und aufbereitet werden müssen. Für die Darstellung der Ergebnisse unserer Untersuchungen entwickeln wir darüber hinaus interaktive Applikationen (wie beispielsweise die CLICS-Datenbank), mit deren Hilfe sich semantische Strukturen sehr transparent untersuchen lassen können.
Datenmanagement und Datenanalyse
Aufgrund der großen Bedeutung, die den Daten und deren Analyse in der Multilingualen Computerlinguistik beikommt, haben wir großes Interesse daran, die Kuratierung von Daten und die gezielte nachhaltige Analyse von Forschungsdaten selbst zum Objekt unserer Forschung zu machen. Unser Ziel ist es dabei, im Austausch mit verschiedenen Wissenschaftszweigen Beispiele für gute wissenschaftliche Praxis im Umgang und in der Analyse von Forschungsdaten am Beispiel der vielfältigen Themenfelder, die die Multilinguale Computerlinguistik untersucht, aufzuzeigen und der Forschungsgemeinschaft zur Verfügung zustellen. Zentrale Themen unserer Arbeit in diesem Bereich sind die Standardisierung von Forschungsdaten, die computergestützte Kuratierung von Forschungsdaten, und die interaktive Analyse von Forschungsdaten. Eine wichtige Rolle bei der Analyse und Kuratierung von Forschungsdaten kommt dabei der Annotation und der Visualisierung zu.
Wissenschaftliche Problemlösung
Da wir für die meisten Probleme im Bereich der Multilingualen Computerlinguistik keine vorgefertigten Lösungen verwenden können, müssen wir meist aktiv nach neuen Lösungsansätzen suchen. Daher haben wir im Laufe der Zeit eine große Erfahrung im Bereich der wissenschaftlichen Problemlösung gesammelt und versuchen die Erkenntnisse in diesem Bereich zu sammeln und mit der Forschungsgemeinschaft zu teilen. Unsere zentrale Strategien zur wissenschaftlichen Problemlösung sind eine gezielte Modellierung von Forschungsdaten und eine interdisziplinäre Ausrichtung, die uns hilft, Lösungsansätze aus anderen Disziplinen auf neue Bereiche zu übertragen. Eine große Rolle spielt die Algorithmik, also die Auseinandersetzung mit algorithmischen Lösungsverfahren, auf die wir bei der Suche nach Lösungen für konkrete Probleme zurückgreifen können.