Lingwistyka korpusowa
Informacje ogólne
Kod przedmiotu: | 3223-1ULK |
Kod Erasmus / ISCED: |
09.3
|
Nazwa przedmiotu: | Lingwistyka korpusowa |
Jednostka: | Instytut Komunikacji Specjalistycznej i Interkulturowej |
Grupy: | |
Punkty ECTS i inne: |
(brak)
|
Język prowadzenia: | polski |
Rodzaj przedmiotu: | obowiązkowe |
Założenia (opisowo): | Student powinien posiadać podstawową wiedzę z zakresu językoznawstwa podawaną na zajęciach „Wstęp do językoznawstwa” lub równoważnych, wskazana wiedza z podstaw zastosowania narzędzi komputerowej analizy tekstów m.i.n z przedmiotu "Terminologia i terminografia"/"Wstęp do terminologii"/"Leksykografia" lub pochodne. Powinien posiadać podstawową znajomość języka angielskiego. |
Tryb prowadzenia: | w sali |
Skrócony opis: |
Przedmiot przeznaczony jest dla studentów kierunków językoznawczych, ze szczególnym naciskiem na osoby podnoszące kompetencje językowe w zakresie języków obcych oraz rozwijające kompetencje w zakresie narzędzi informatycznych wspomagających naukę języka obcego oraz procesy tłumaczeniowe. Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi proces gromadzenia, weryfikowania i stosowania odpowiednich dla języka ogólnego lub specjalistycznego struktur leksykalnych, stylistycznych i syntagmatycznych. Na zajęciach omawiane są wybrane programy do analizy tekstów, tworzenia i oceny korpusów tekstowych, programy stylometryczne, i elektroniczne korpusy tekstowe. Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach z korpusu tekstowego. |
Pełny opis: |
Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych, technik gromadzenia danych językowych oraz możliwości ich praktycznego wykorzystania: 1. Pojęcie korpusu językowego. Korpus językowy a zbiór tekstów. Badania teoretyczne a materiałowe: rola danych językowych w językoznawstwie 2. Typologia korpusów: korpusy jedno i wielojęzyczne, równoległe i porównywalne. Pojęcie reprezentatywności i adekwatności korpusów. 3. Podstawowe informacje na temat indeksacji korpusów językowych; umiejętności interpretacji danych i wykorzystania zdobytych informacji morfologiczno-składniowych 4. Podstawowe korpusy języka polskiego: NKJP, PWN, IPI PAN, PELCRA. Korpus NKJP wraz z narzędziami towarzyszącymi. 5. Podstawowe korpusy języków nauczanych obszarów językowych (preferowane języki: angielski, niemiecki, rosyjski, włoski) 6. Baza danych leksykograficznych jako podstawa do tworzenia różnych modeli słowników. 7. Dostępne narzędzia analizy korpusów tekstowych (AntConc, Jasnopis i in.). 8. Narzędzia analizy parametrycznej tekstu, zastosowania praktyczne pomiaru modalności tekstu. 9. Możliwe zastosowania korpusów w praktyce językoznawczej: a) badanie języków specjalistycznych b) korpus jako narzędzie wspomagające tłumacza c) dydaktyka języków obcych d) słowniki i modele słowników na różnych nośnikach danych 10. Korpusy tekstowe i teksty równoległe w pracy z programami wspomagającymi proces tłumaczenia (narzędzia CAT). Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi proces gromadzenia, weryfikowania i stosowania odpowiednich dla języka ogólnego lub specjalistycznego struktur leksykalnych, stylistycznych i syntagmatycznych. Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane lingwistyczne przy pomocy poznanych narzędzi. Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych. Ponadto, kurs kładzie nacisk na samodzielne wyszukiwanie oprogramowania oraz wyprowadzania indywidualnych wniosków z prowadzonych analiz lingwistycznych oraz ich wizualizacji. Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach z korpusu tekstowego, stanowiącego podstawę zaliczenia przedmiotu oraz zwiększenie kompetencji studentów w zakresie tworzenia samodzielnych prac leksykograficzno-korpusowych (w tym przeprowadzenia analiz na potrzeby pracy dyplomowej). Nakład pracy studenta (3 ECTS): 30 godzin obecność na zajęciach w sali (1) 30 godzin przygotowanie korpusu tekstowego (1) 15 godzin praca własna z oprogramowaniem (0,5) 15 godzin lektura i przygotowanie do zajęć, przygotowanie do egzaminu (0,5) |
Literatura: |
Literatura podstawowa: - Gruszczyńska E., Leńko-Szymanska A. (red.), Polskojęzyczne korpusy równoległe / Polish-language Parallel Corpora, WLS UW, Warszawa, 2016. - Karpiński Ł., Systemy leksykalno-komunikacyjne, Campidoglio, Warszawa, 2017. - "Prace filologiczne", tom. LXIII, WP UW, Warszawa 2012 (tom zawierający zbiór prac dot. lingwistyki korpusowej) Literatura uzupełniająca: - Biber C., Corpus Linguistics. Investigating language structure and use, Cambridge Univesrity Press 1998. - Celiński P., 2013a, Postmedia. Cyfrowy kod i bazy danych, Wydawnictwo UMCS, Lublin. - Kamińska-Szmaj I., 1989, Słownictwo tekstów popularnonaukowych w ujęciu statystycznym, [w:] „Rozprawy Komisji Językowej”, t. XVI, Wrocławskie Towarzystwo Naukowe, Wyd. PAN, Wrocław, s. 69-87. - Karpiński Ł., Zarys leksykografii terminologicznej, KJS UW, Warszawa, 2008 - Karpiński Ł., 2009a, Wybrane założenia komputerowej analizy tekstów i gromadzenia danych, [w] „Języki Specjalistyczne 9 – Kulturowy i leksykograficzny obraz języków specjalistycznych”, (red. eidem), KJS UW, Warszawa - Karpiński Ł., 2012a, Analiza parametryczna tekstu a translacja maszynowa – wybrane zagadnienia, [w] „The Linguistic Journal of Applied Linguistics”, (red.), Lingwistyczna Szkoła Wyższa w Warszawie, Warszawa. - Karpiński Ł., Michałowski P., 2012, Wybrane metody analizy terminologii specjalistycznej (na przykładzie technolektu geografii), [w:] „Edukacja dla Przyszłości”, t. IX, 2012, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok, s. 19-46. - Lewandowska-Tomaszczyk B., Gramatyka angielska na autentycznych materiałach językowych, Łódź, WSSM 2004. - Lewandowska-Tomaszczyk B., Podstawy językoznawstwa korpusowego, Wyd. Uniwersytetu Łódzkiego, Łódź 2005. - Ludskanow A., 1973, Tłumaczy człowiek i maszyna cyfrowa, WNT, Warszawa - McEnery T., Wilson A., Corpus Linguistics: an Introduction, Edinburgh : Edinburgh University Press, 2001 - Pawłowski A., 2001, Metody kwantytatywne w sekwencyjnej analizie tekstu, Uniwersytet Warszawski Katedra Lingwistyki Formalnej, Warszawa. - Przepiórkowski A., Bańko M., Górski R., Lewandowska-Tomaszczyk B., Narodowy Korpus Języka Polskiego, PWN, Warszawa 2012 - Sambor J., 1969, Badania statystyczne nad słownictwem. Na materiale „Pana Tadeusza”, Wrocław-Warszawa. - Świdziński M., 2006, Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, [w:] „LingVaria”, nr 1, Wydział Polonistyki UJ, Kraków. - Tognini-Bonelli E., Corpus Linguistics at Work, John Benjamins, Amsterdam/Philadelphia 2001 Materiały autorskie prowadzącego, zbiory analiz, wizualizacje danych stylometrycznych. |
Efekty uczenia się: |
Wiedza: zna terminologię stosowaną w językoznawstwie i dziedzinach pokrewnych na poziomie rozszerzonym, orientuje się w najważniejszych kierunkach i metodach badań lingwistycznych; rozumie terminologię gramatyczną; posiada wiedzę na temat wybranych uwarunkowań pragmatycznych danych systemów językowych; ma pogłębioną wiedzę na temat metodologii i prowadzenia badań językoznawczych lub literackich; zna styl naukowy i leksykę naukową; ma wiedzę na temat baz danych dla lingwistyki, posiada podstawową wiedzę na temat interpretacji danych pozyskanych z analiz; zna popularne programy komputerowe wspomagające pracę tłumacza (CAT) oraz wybrane programy do analizy frekwencyjnej i stylometrycznej; zna możliwości wykorzystania tłumaczenia maszynowego; Umiejętności: wykorzystuje programy komputerowe przydatne w pracy tłumacza, potrafi właściwie formatować tekst w języku polskim, oraz w przynajmniej jednym w języku obcym; sprawnie posługuje się arkuszami kalkulacyjnymi i wykresami; potrafi korzystać z ogólnie dostępnych naukowych baz danych (w tym baz terminologicznych i korpusowych); sprawnie wyszukuje informacje, korzysta z wiedzy eksperckiej, ze słowników encyklopedycznych, językowych, terminologicznych ogólno-naukowych, ogólno-technicznych, interdyscyplinarnych i branżowych, korpusów językowych, baz danych, tekstów paralelnych; potrafi wskazać luki w badaniach naukowych i kierunki ich kontynuowania; formułuje problemy badawcze, dobiera adekwatne metody, konstruuje narzędzia badawcze, opracowuje, prezentuje i interpretuje wyniki badań, wyciąga wnioski; Kompetencje społeczne: potrafi uzupełniać i doskonalić nabytą wiedzę o przynajmniej jednym języku specjalności oraz o własnym języku; jest świadomy konieczności ciągłego poszukiwania nowych źródeł słownikowych i tekstowych, a także śledzenia współcześnie powstających teorii naukowych; szybko reaguje na zmieniającą się rzeczywistość; wyciąga wnioski z informacji zwrotnych, umie zarządzać czasem; utrzymuje kontakt ze środowiskiem tłumaczy, pracuje w środowisku wielokulturowym; zna środowisko pracy tłumacza; potrafi pracować w grupie, współpracować z innymi, przyjmując odpowiednie role (funkcje); kierować małym zespołem (3-4 osoby w grupach ćwiczeniowych); |
Metody i kryteria oceniania: |
Metody oceny pracy studenta - ocena aktywności i bieżące przygotowanie do zajęć; - projekt (tematyczny korpus tekstowy); - końcowe zaliczenie pisemne (test lub analiza stylometryczna korpusu). Kryteria oceniania (komponenty oceny końcowej): - ocena ciągła z zajęć: 10% - projekt (tematyczny korpus tekstowy): 40% - zaliczenie końcowe: 50% Egzamin (zaliczenie końcowe): W przypadku testu wielokrotnego/jednokrotnego wyboru wiążąca jest liczba uzyskanych punktów. W przypadku analizy stylometrycznej korpusu wiążąca jest liczba uzyskanych punktów za poszczególne parametry stylometryczne. Zasady punktacji dla oceny bieżącej i egzaminu/zaliczenia: 55%-69% = 3 70%-74% = 3+ 75%-84% = 4 85%-89% = 4+ 90%-100% = 5 Zasady współpracy prowadzącego ze studentami: 1. Nieobecności – dopuszczalne 3 nieusprawiedliwione nieobecności w semestrze (jest to zgodne z regulaminem). 2. Do końcowego zaliczenia można podejść po zaliczeniu projektu oraz otrzymania pozytywnej oceny ciągłej zajęć. wszystkich sprawdzianów. 3. Student ma prawo do dwukrotnej poprawy każdego sprawdzianu pisemnego. Nieprzystąpienie do sprawdzianu w pierwszym terminie bez usprawiedliwienia powoduje utratę tego terminu. |
Praktyki zawodowe: |
Nie przewiduje się. |
Właścicielem praw autorskich jest Uniwersytet DEMO.