Uniwersytet DEMO - Centralny System Uwierzytelniania
Strona główna

Lingwistyka korpusowa

Informacje ogólne

Kod przedmiotu: 3223-1ULK
Kod Erasmus / ISCED: 09.3 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (brak danych)
Nazwa przedmiotu: Lingwistyka korpusowa
Jednostka: Instytut Komunikacji Specjalistycznej i Interkulturowej
Grupy:
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Rodzaj przedmiotu:

obowiązkowe

Założenia (opisowo):

Student powinien posiadać podstawową wiedzę z zakresu językoznawstwa podawaną na zajęciach „Wstęp do językoznawstwa” lub równoważnych, wskazana wiedza z podstaw zastosowania narzędzi komputerowej analizy tekstów m.i.n z przedmiotu "Terminologia i terminografia"/"Wstęp do terminologii"/"Leksykografia" lub pochodne.

Powinien posiadać podstawową znajomość języka angielskiego.


Tryb prowadzenia:

w sali

Skrócony opis:

Przedmiot przeznaczony jest dla studentów kierunków językoznawczych, ze szczególnym naciskiem na osoby podnoszące kompetencje językowe w zakresie języków obcych oraz rozwijające kompetencje w zakresie narzędzi informatycznych wspomagających naukę języka obcego oraz procesy tłumaczeniowe.

Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi proces gromadzenia, weryfikowania i stosowania odpowiednich dla języka ogólnego lub specjalistycznego struktur leksykalnych, stylistycznych i syntagmatycznych. Na zajęciach omawiane są wybrane programy do analizy tekstów, tworzenia i oceny korpusów tekstowych, programy stylometryczne, i elektroniczne korpusy tekstowe. Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach z korpusu tekstowego.

Pełny opis:

Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych, technik gromadzenia danych językowych oraz możliwości ich praktycznego wykorzystania:

1. Pojęcie korpusu językowego. Korpus językowy a zbiór tekstów. Badania teoretyczne a materiałowe: rola danych językowych w językoznawstwie

2. Typologia korpusów: korpusy jedno i wielojęzyczne, równoległe i porównywalne. Pojęcie reprezentatywności i adekwatności korpusów.

3. Podstawowe informacje na temat indeksacji korpusów językowych; umiejętności interpretacji danych i wykorzystania zdobytych informacji morfologiczno-składniowych

4. Podstawowe korpusy języka polskiego: NKJP, PWN, IPI PAN, PELCRA. Korpus NKJP wraz z narzędziami towarzyszącymi.

5. Podstawowe korpusy języków nauczanych obszarów językowych (preferowane języki: angielski, niemiecki, rosyjski, włoski)

6. Baza danych leksykograficznych jako podstawa do tworzenia różnych modeli słowników.

7. Dostępne narzędzia analizy korpusów tekstowych (AntConc, Jasnopis i in.).

8. Narzędzia analizy parametrycznej tekstu, zastosowania praktyczne pomiaru modalności tekstu.

9. Możliwe zastosowania korpusów w praktyce językoznawczej:

a) badanie języków specjalistycznych

b) korpus jako narzędzie wspomagające tłumacza

c) dydaktyka języków obcych

d) słowniki i modele słowników na różnych nośnikach danych

10. Korpusy tekstowe i teksty równoległe w pracy z programami wspomagającymi proces tłumaczenia (narzędzia CAT).

Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi proces gromadzenia, weryfikowania i stosowania odpowiednich dla języka ogólnego lub specjalistycznego struktur leksykalnych, stylistycznych i syntagmatycznych. Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane lingwistyczne przy pomocy poznanych narzędzi.

Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych.

Ponadto, kurs kładzie nacisk na samodzielne wyszukiwanie oprogramowania oraz wyprowadzania indywidualnych wniosków z prowadzonych analiz lingwistycznych oraz ich wizualizacji.

Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach z korpusu tekstowego, stanowiącego podstawę zaliczenia przedmiotu oraz zwiększenie kompetencji studentów w zakresie tworzenia samodzielnych prac leksykograficzno-korpusowych (w tym przeprowadzenia analiz na potrzeby pracy dyplomowej).

Nakład pracy studenta (3 ECTS):

30 godzin obecność na zajęciach w sali (1)

30 godzin przygotowanie korpusu tekstowego (1)

15 godzin praca własna z oprogramowaniem (0,5)

15 godzin lektura i przygotowanie do zajęć, przygotowanie do egzaminu (0,5)

Literatura:

Literatura podstawowa:

- Gruszczyńska E., Leńko-Szymanska A. (red.), Polskojęzyczne korpusy równoległe / Polish-language Parallel Corpora, WLS UW, Warszawa, 2016.

- Karpiński Ł., Systemy leksykalno-komunikacyjne, Campidoglio, Warszawa, 2017.

- "Prace filologiczne", tom. LXIII, WP UW, Warszawa 2012 (tom zawierający zbiór prac dot. lingwistyki korpusowej)

Literatura uzupełniająca:

- Biber C., Corpus Linguistics. Investigating language structure and use, Cambridge Univesrity Press 1998.

- Celiński P., 2013a, Postmedia. Cyfrowy kod i bazy danych, Wydawnictwo UMCS, Lublin.

- Kamińska-Szmaj I., 1989, Słownictwo tekstów popularnonaukowych w ujęciu statystycznym, [w:] „Rozprawy Komisji Językowej”, t. XVI, Wrocławskie Towarzystwo Naukowe, Wyd. PAN, Wrocław, s. 69-87.

- Karpiński Ł., Zarys leksykografii terminologicznej, KJS UW, Warszawa, 2008

- Karpiński Ł., 2009a, Wybrane założenia komputerowej analizy tekstów i gromadzenia danych, [w] „Języki Specjalistyczne 9 – Kulturowy i leksykograficzny obraz języków specjalistycznych”, (red. eidem), KJS UW, Warszawa

- Karpiński Ł., 2012a, Analiza parametryczna tekstu a translacja maszynowa – wybrane zagadnienia, [w] „The Linguistic Journal of Applied Linguistics”, (red.), Lingwistyczna Szkoła Wyższa w Warszawie, Warszawa.

- Karpiński Ł., Michałowski P., 2012, Wybrane metody analizy terminologii specjalistycznej (na przykładzie technolektu geografii), [w:] „Edukacja dla Przyszłości”, t. IX, 2012, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok, s. 19-46.

- Lewandowska-Tomaszczyk B., Gramatyka angielska na autentycznych materiałach językowych, Łódź, WSSM 2004.

- Lewandowska-Tomaszczyk B., Podstawy językoznawstwa korpusowego, Wyd. Uniwersytetu Łódzkiego, Łódź 2005.

- Ludskanow A., 1973, Tłumaczy człowiek i maszyna cyfrowa, WNT, Warszawa

- McEnery T., Wilson A., Corpus Linguistics: an Introduction, Edinburgh : Edinburgh University Press, 2001

- Pawłowski A., 2001, Metody kwantytatywne w sekwencyjnej analizie tekstu, Uniwersytet Warszawski Katedra Lingwistyki Formalnej, Warszawa.

- Przepiórkowski A., Bańko M., Górski R., Lewandowska-Tomaszczyk B., Narodowy Korpus Języka Polskiego, PWN, Warszawa 2012

- Sambor J., 1969, Badania statystyczne nad słownictwem. Na materiale „Pana Tadeusza”, Wrocław-Warszawa.

- Świdziński M., 2006, Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, [w:] „LingVaria”, nr 1, Wydział Polonistyki UJ, Kraków.

- Tognini-Bonelli E., Corpus Linguistics at Work, John Benjamins, Amsterdam/Philadelphia 2001

Materiały autorskie prowadzącego, zbiory analiz, wizualizacje danych stylometrycznych.

Efekty uczenia się:

Wiedza:

zna terminologię stosowaną w językoznawstwie i dziedzinach pokrewnych na poziomie rozszerzonym, orientuje się w najważniejszych kierunkach i metodach badań lingwistycznych; rozumie terminologię gramatyczną; posiada wiedzę na temat wybranych uwarunkowań pragmatycznych danych systemów językowych;

ma pogłębioną wiedzę na temat metodologii i prowadzenia badań językoznawczych lub literackich; zna styl naukowy i leksykę naukową; ma wiedzę na temat baz danych dla lingwistyki, posiada podstawową wiedzę na temat interpretacji danych pozyskanych z analiz;

zna popularne programy komputerowe wspomagające pracę tłumacza (CAT) oraz wybrane programy do analizy frekwencyjnej i stylometrycznej; zna możliwości wykorzystania tłumaczenia maszynowego;

Umiejętności:

wykorzystuje programy komputerowe przydatne w pracy tłumacza, potrafi właściwie formatować tekst w języku polskim, oraz w przynajmniej jednym w języku obcym; sprawnie posługuje się arkuszami kalkulacyjnymi i wykresami; potrafi korzystać z ogólnie dostępnych naukowych baz danych (w tym baz terminologicznych i korpusowych); sprawnie wyszukuje informacje, korzysta z wiedzy eksperckiej, ze słowników encyklopedycznych, językowych, terminologicznych ogólno-naukowych, ogólno-technicznych, interdyscyplinarnych i branżowych, korpusów językowych, baz danych, tekstów paralelnych;

potrafi wskazać luki w badaniach naukowych i kierunki ich kontynuowania; formułuje problemy badawcze, dobiera adekwatne metody, konstruuje narzędzia badawcze, opracowuje, prezentuje i interpretuje wyniki badań, wyciąga wnioski;

Kompetencje społeczne:

potrafi uzupełniać i doskonalić nabytą wiedzę o przynajmniej jednym języku specjalności oraz o własnym języku; jest świadomy konieczności ciągłego poszukiwania nowych źródeł słownikowych i tekstowych, a także śledzenia współcześnie powstających teorii naukowych; szybko reaguje na zmieniającą się rzeczywistość;

wyciąga wnioski z informacji zwrotnych, umie zarządzać czasem; utrzymuje kontakt ze środowiskiem tłumaczy, pracuje w środowisku wielokulturowym; zna środowisko pracy tłumacza;

potrafi pracować w grupie, współpracować z innymi, przyjmując odpowiednie role (funkcje); kierować małym zespołem (3-4 osoby w grupach ćwiczeniowych);

Metody i kryteria oceniania:

Metody oceny pracy studenta

- ocena aktywności i bieżące przygotowanie do zajęć;

- projekt (tematyczny korpus tekstowy);

- końcowe zaliczenie pisemne (test lub analiza stylometryczna korpusu).

Kryteria oceniania (komponenty oceny końcowej):

- ocena ciągła z zajęć: 10%

- projekt (tematyczny korpus tekstowy): 40%

- zaliczenie końcowe: 50%

Egzamin (zaliczenie końcowe):

W przypadku testu wielokrotnego/jednokrotnego wyboru wiążąca jest liczba uzyskanych punktów.

W przypadku analizy stylometrycznej korpusu wiążąca jest liczba uzyskanych punktów za poszczególne parametry stylometryczne.

Zasady punktacji dla oceny bieżącej i egzaminu/zaliczenia:

55%-69% = 3

70%-74% = 3+

75%-84% = 4

85%-89% = 4+

90%-100% = 5

Zasady współpracy prowadzącego ze studentami:

1. Nieobecności – dopuszczalne 3 nieusprawiedliwione nieobecności w semestrze (jest to zgodne z regulaminem).

2. Do końcowego zaliczenia można podejść po zaliczeniu projektu oraz otrzymania pozytywnej oceny ciągłej zajęć. wszystkich sprawdzianów.

3. Student ma prawo do dwukrotnej poprawy każdego sprawdzianu pisemnego. Nieprzystąpienie do sprawdzianu w pierwszym terminie bez usprawiedliwienia powoduje utratę tego terminu.

Praktyki zawodowe:

Nie przewiduje się.

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet DEMO.
ul. Demo 1
01-234 Demo
tel: +48 123 456 789 https://usosweb.demo.usos.edu.pl/
kontakt deklaracja dostępności USOSweb 7.0.2.0-4652b4bdc (2024-02-29)

debug