Teksty ako skład wědy – globalne spśistupnjenje z wusokogódnotnym digitalizěrowanim

Tekstowe korpuse maju wjeliki wuznam w sorabistice, su skład wědy a źěł cełkownego namrěśa mjeńšyny a słuže ako wažne žrědło za slěźenja. W projekśe zestaja se wusokogódny a anotěrowany korpus dolnoserbskich publicistiskich tekstow z lět mjazy 1947 a 2018 (72 lětnikow raz wob tyźeń wuchadajucego „Nowego Casnika“), kótaryž wopśimjejo w cełku za wšym zdaśim jadnab 30 milionow tekstowych słow (tokenow). Pśitom jo planowane pódla stawnego lematizěrowanja teke markěrowanje swójskich mjenjow (pśede wšym městnych a wósobowych). Togodla jo pśedwiźona wuska kooperacija z źělnym projektom Potencial swójskich mjenjow wužywaś I: pśistupnjenje a spleśenje korpusowych tekstow. Tak wutwórijo se jaden tekstowy korpus, kótaryž zmóžnijo wjelebocne wužywanja a móžo mócnje spěchowaś linguistiske a kulturnoanalytiske zaběranje z dolnoserbskeju rěcu. Rownocasnje nastawa na ten part dolnoserbski źěł jadnogo dolnoserbsko-górnoserbsko-nimskego paralelnego korpusa, kótaryž dej w pózdźejšej fazy projekta byś pśespytowany z metodami analyze diskursa, glědajucy na styri casowe etapy towarišnostnych pśewrośenjow: 1946–1955 (pówójnski cas a załoženje NDR), 1967–1976 (Praske nalěśe a cas politiskich reformow), 1986–1995 („pśewrośenje“ a zasejzjadnośenje), 2007–2016 (góspodaŕske a migraciske krize).
Wětšy źěł w projekśe pśigótowanych korpusowych tekstow jo wordował južo kóńc měrca 2025 ako nowy „casnikowy korpus (1947-2016)“ k dispoziciji stajony a to w zjawnem korpusowem pytanju.
Toś ten projekt jo źělny projekt ramikowego pśedewześa Integrated Digital Sorbian Studies.


Na projekśe wobźělone: Joanna Szczepańska , (z pódpěru dalšego personala SI)


Spěchowarje

Logo von