Projektmodul „Referenzkorpora – Erstellung qualitätsgesicherter Referenzkorpora der nieder- und obersorbischen Schriftsprache der Gegenwart als Grundlage für die Entwicklung von Sprachressourcen“ (Drittmittelprojekt)
Eine zurzeit von der Stiftung für das sorbische Volk koordinierte und von mehreren sorbischen Institutionen – u. a. vom SI – getragene Initiative zur Stärkung des Sorbischen in den „Neuen Medien“ führt zu einer verstärkten Nachfrage zuverlässiger computerlesbarer, auch quantitativ auswertbarer Sprachdaten zum Nieder- und Obersorbischen. Das Institut arbeitet zwar schon seit vielen Jahren am Aufbau umfassender digitaler Textkorpora, jedoch handelt es sich dabei zum einen um nach wissenschaftlichen Kriterien zusammengestellte Textsammlungen (im Falle des Niedersorbischen etwa um ein Korpus mit stark „historischem“ Charakter), die nicht ohne weiteres als Grundlage für die Erarbeitung aktuell notwendiger Sprachressourcen dienen können. Zum anderen konnte bisher aus Mangel an (personellen) Ressourcen für manuelle und/oder technische Qualitätskontrollen keine hinreichende Qualität der Digitalisate erreicht werden. Hohe Zuverlässigkeit ist aber Voraussetzung für die Nutzung der Korpora zur Entwicklung bzw. Verbesserung von Rechtschreibkontrollen, Referenzwortschätzen für Lehrwerke usw.
Projektbeteiligte: Marcin Szczepański, Thomas Menzel