Ausbau der normativen Datenbasis für die obersorbische Rechtschreibkontrolle (Phase II)
Seit 2009 arbeiteten an der sorbischen Sprache Interessierte zunächst auf eigene Initiative an einem obersorbischen Rechtschreibmodul für Open/LibreOffice sowie Microsoft Office. Die Basis bildeten der im Obersorbisch-deutschen Wörterbuch von Paul Völkel kodifizierte obersorbische Wortschatz und ein neu entwickelter morphologischer Generator. 2016 wurde der Datenbestand von Sprachwissenschaftlern des Sorbischen Instituts einer zielgerichteten Revision unterzogen und korrigiert. Damit lag Ende 2016 eine vollständig qualitätsgeprüfte Version des morphologischen Generators als Grundlage für die obersorbische Rechtschreibkontrolle vor. Bereits 2017/18 wurde die Datenbasis der Rechtschreibkontrolle erweitert um den Wortschatz, der in den Äquivalenten des Deutsch-obersorbischen Wörterbuchs neuer Lexik (DOWNL, 2009) und in den im Rahmen des Projekts II.1.2. vorbereiteten Terminologiesammlungen verzeichnet und nicht vom Wörterbuch von Völkel abgedeckt ist (Version 2).
Mit diesem Vorhaben wurde die nächste umfangreiche Erweiterung der Datenbasis realisiert, mit der ein hoher Grad an Aktualität und Vollständigkeit erreicht wurde. Einbezogen wurden folgende Datenbestände:
(a) Erschließung der bisher nicht für die automatische Rechtschreibprüfung verfügbaren Lexik aus dem Deutsch-obersorbischen Wörterbuch (DOW, 1989/1991, 9300 Lexeme, ein Restbestand wird erfasst im Projekt „Ausbau der normativen Datenbasis für die obersorbische Rechtschreibkontrolle, Phase III“). Mit der Zusammenführung der Lexik aus dem Wörterbuch von Völkel und dem DOW 1989/1991 sowie dem bereits integrierten DOWNL wird ein annähernd vollständiges Bild des zeitgenössischen obersorbischen Lexikons erreicht, soweit es sich in Wörterbüchern niederschlägt.
(b) Integration der Vornamen aus dem Buch „Sorbische Vornamen“ von Timo Meškank sowie geografischer Namen aus der „Datenbank obersorbischer Exonyme“, außerdem Integration neuer Lexik aus „Rěčny kućik“.
Ergebnisse
- Juli 2019: Erweiterungsmodul: Sorbische Vornamen ; Pressemitteilung
- Februar/Mai 2020: Integrierung neuer Lexik aus„Rěčny kućik“ und der „Datenbank obersorbischer Exonyme“
- Januar 2021: Integrierung neuer Lexik aus DOW 1989/1991
Projektbeteiligte: Richard Bígl, Bernhard Baier (extern)
Förderer
Das Vorhaben wurde gefördert durch die Stiftung für das sorbische Volk, die jährlich auf der Grundlage der beschlossenen Haushalte des Deutschen Bundestages, des Landtages Brandenburg und des Sächsischen Landtages Zuwendungen aus Steuermitteln erhält.