Ausbau der normativen Datenbasis für die obersorbische Rechtschreibkontrolle (Phase III)

Seit 2009 erarbeiteten an der sorbischen Sprache Interessierte zunächst auf eigene Initiative ein obersorbisches Rechtschreibmodul für Open/LibreOffice sowie Microsoft Office. Die Basis bildeten der im Obersorbisch-deutschen Wörterbuch von Paul Völkel kodifizierte obersorbische Wortschatz und ein neu entwickelter morphologischer Generator. Ab 2016 arbeiten Sprachwissenschaftler des Sorbischen Instituts an der Weiterentwicklung des Datenbestands, zunächst 2015/2016 durch Revision und Korrektur des morphologischen Generators, danach durch Erweiterung der lexikalischen Datengrundlage durch Einbeziehung weiterer lexikografischer Quellen – zuletzt 2019/20 die bisher nicht registrierte Lexik aus dem Deutsch-obersorbischen Wörterbuch (DOW 1989/91). (Veröffentlichung auf soblex.de am 18.01.2021.) Aus dem im Institut für sorbische Volksforschung erarbeiteten DOW 1989/91 konnten bisher ca. 9300 zusätzliche Wörter mit über 330 000 Wortformen integriert werden. Im vorliegenden Projekt wurde ein bisher nicht erfasster Restbestand von weiteren ca. 7300 Lexemen insbesondere aus den Anwendungsbeispielen im DOW 1989/91 ergänzt.
Damit deckt die obersorbische Rechtschreibprüfung den in aktuellen Wörterbüchern verzeichneten Wortschatz vollständig ab. Dies ist nicht nur für die Erweiterung der Datenbasis der Rechtschreibprüfung wichtig, sondern auch als Vergleichsbasis für das seit 2019 begonnene regelmäßige Schrifttums-Monitoring, auf dessen Grundlage sich weitere Ergänzungsbestände des bekannten obersorbischen Wortschatzes sowohl für die Rechtschreibprüfung als auch für lexikografische Zwecke ergeben.

Ergebnisse

Dezember 2021 – neue Version der obersorbischen Rechtschreibprüfung und Verknüpfung der Daten mit dem DOW 1989/91 unter obersorbisch.de, s. Pressemitteilung

Projektleitung: Dr. habil. Sonja Wölke
Projektbeteiligte: Božena Braumann