Prof. Dr. Stefan Müller : Sprachwissenschaft: Empirie, Theorie, Verifikation, Publikation (Große Korpora, Grammatikimplementation und Open Access-Verlag)

Hier finden Sie den Videomitschnitt zu diesem Vortrag auf dem Digital Science Match 2015.

Prof. Dr. Stefan Müller
Prof. Dr. Stefan MüllerFoto: Oliver Elsner

In der Arbeitsgruppe Deutsche Grammatik der FU Berlin haben wir drei Hauptarbeitsgebiete, die für die Digitalisierung relevant sind. Im ersten Bereich arbeiten wir an linguistisch motivierten, computerverarbeitbaren Grammatiken im Rahmen der Head-Driven Phrase Structure Grammar (HPSG) für verschiedene Sprachen (z.B. Deutsch, Mandarin Chinesisch, Persisch, Dänisch, Maltesisch). Es wird herausgearbeitet, was die Sprachen gemeinsam haben. Mit hoher Wahrscheinlichkeit lassen sich Beschränkungen, die für mehrere Sprachen gelten, auch für neue, noch nicht abgedeckte Sprachen verwenden, so dass die Entwicklung von neuen Sprachfragmenten dann schneller vonstatten geht.

Video
Prof. Stefan Müller
Prof. Stefan Müller

Die ausgearbeiteten Grammatikfragmente enthalten Morphologiekomponenten, syntaktische Beschränkungen und auch semantische Repräsentationen. Sie lassen sich also prinzipiell zum automatischen Verstehen von Texten einsetzen. http://hpsg.fu-berlin.de/Projects/CoreGram.html

Der zweite Bereich beschäftigt sich mit der Erstellung und Aufbereitung großer Korpora aus dem Web (COW). Auch hier werden verschieden Sprachen abgedeckt (z.B. Deutsch, Spanisch, Schwedisch, Niederländisch). Diese Korpora sind oft wesentlich größer als andere zugängliche Ressourcen. http://hpsg.fu-berlin.de/cow/

Im dritten Bereich beschäftigen wir uns mit dem digitalen Publizieren. Wir haben Language Science Press aufgebaut mit dem Ziel, Monographien für Autoren und Leser unentgeltlich zugänglich zu machen (Open Access). Bei Language Science Press gibt es siebzehn dezentral organisierte Reihen mit mehr als 160 Wissenschaftlern in den Herausgebergremien. Wir haben bereits 9 Bücher publiziert und zehn weitere werden in der verbleibenden Zeit bis zum Jahresende erscheinen.

In der Arbeitsgruppe wird an der Publikationssoftware Open Monograph Press gearbeitet und es werden Tools zur Konversion von LaTeX in Buchformate wie ePub und Formate wie XML/HTML entwickelt. Des weiteren hat unsere Ökonomin ein nachhaltiges Geschäftsmodell für Buchpublikationen im Open Access erarbeitet, das gegenwärtig erprobt wird. http://langsci-press.org

Zur Person

Freie Universität Berlin, Institut für Deutsche und Niederländische Philologie, Deutsche Grammatik

Stefan Müller hat an der Humboldt-Universität Berlin und Edinburgh Informatik, Computerlinguistik und Sprachwissenschaft studiert. Er arbeitete an der HU-Berlin, am Deutschen Forschungszentrum für Künstliche Intelligenz in Saarbrücken und an der Universität in Jena und Potsdam. In Bremen hatte er eine Juniorprofessor für Theoretische Linguistik und Computerlinguistik inne. An der FU-Berlin ist Stefan Müller Professor für Deutsche und Allgemeine Sprachwissenschaft.

Links

http://hpsg.fu-berlin.de

Schlagworte

Grammatik

tiefe Verarbeitung

theoretische Linguistik

Korpuslinguistik

Open Access

ePublishing