CYFROWE LITERATUROZNAWSTWO – SIEĆ BADAWCZA, NARZĘDZIA, METODOLOGIA

Kierownik projektu: prof. dr hab. Maciej Eder

Numer projektu: 101004984
Data rozpoczęcia: 2021-03-01
Data zakończenia: 2025-02-28
Jednostka finansująca: H2020 INFRAIA-2018-2020

Opis projektu

Era cyfrowa stawia nowe wyzwania i otwiera perspektywę przełomowych badań nad wielojęzycznym i wzajemnie powiązanym dziedzictwem literackim Europy. Obecnie zasoby danych tekstowych są zróżnicowane i fragmentaryczne. Choć wiele z nich jest obecnie dostępnych w bibliotekach cyfrowych, archiwach, repozytoriach, katalogach lub na stronach internetowych, brak standaryzacji utrudnia ich rozbudowę oraz ogranicza dostęp i zakres, w jakim można je ponownie wykorzystać. Projekt Computational Literary Studies Infrastructure (CLS INFRA) ma na celu połączenie tych zasobów z narzędziami potrzebnymi do ich analizy, a także dalszego wykorzystywania przez dużą grupę użytkowników, w duchu zasad FAIR i CARE. Wynikające z tego udoskonalenia przyniosą korzyści naukowcom, wypełniając luki między większymi i mniej zasobnymi społecznościami zajmującymi się literaturoznawstwem cyfrowym i nie tylko, ostatecznie oferując możliwości tworzenia nowych badań i wglądu w nasze wspólne i zróżnicowane europejskie dziedzictwo kulturowe. Działania projektu CLS INFRA mają kluczowe znaczenie dla zaspokojenia tych pilnych potrzeb naukowych oraz infrastrukturalnych rosnącej społeczności użytkowników. Zamiast budować całkowicie nowe zaplecze dla studiów literackich, projekt jest silnie zaangażowany w wykorzystywanie i łączenie istniejących inicjatyw, aby docenić i wykorzystać ogromną pracę badaczy, która została już podjęta. Dlatego projekt opiera się na niedawno zbudowanych, wysokiej jakości korpusach literackich, takich jak DraCor i ELTeC, integruje istniejące narzędzia do analizy tekstu, np. TXM, stylo czy wielojęzyczne systemy przetwarzania języka naturalnego, oraz korzysta z głębokiej integracji z dwoma innymi projektami infrastrukturalnymi, a mianowicie CLARIN i DARIAH ERIC. W związku z tym projekt ma na celu zbudowanie spójnego ekosystemu, aby wspierać techniczną i intelektualną dostępność odpowiednich danych. Ekosystem ten składa się z (1) zasobów, tj. zbiorów tekstów obejmujących prozę, poezję i dramat w wielu językach, (2) narzędzi do przetwarzania danych językowych, (3) rozważań metodologicznych i teoretycznych, (4) sieci naukowców CLS z różnych instytucji europejskich, (5) systemu krótkoterminowych pobytów badawczych zarówno dla początkujących badaczy, jak i doświadczonych naukowców, (6) repozytorium materiałów szkoleniowych, a także (7) skutecznej strategii upowszechniania wiedzy wytworzonej w ramach projektu. Struktura projektu wraz z grupami roboczymi ściśle nawiązuje do powyższych elementów infrastruktury. Projekt jest realizowany przez zrównoważone geograficznie, komplementarne międzynarodowe konsorcjum kluczowych dostawców danych oraz narzędzi z wielu krajów europejskich. Konsorcjum obejmuje pełen zakres określonych przez projekt obszarów integracji i innowacji oraz jest skomponowane tak, aby stworzyć wspólne podejście infrastrukturalne do cyfrowych studiów literaturoznawczych. W szczególności głęboka integracja środowisk CLARIN, jak i DARIAH ERIC, zapewnia długoterminową stabilność i trwałość projektu.

 

Ikona z ludzikiem do otwierania panelu kontrolnego WCAG
Aa+
Aa-
Ikona kontrastu
Ikona linku
Ikona skali szarości
Ikona zmiany na czytelne czcionki
Ikona resetu ustawień WCAG