TY - JOUR
AU - Roksolana Nazarchuk
AU - Iryna Karamysheva
PY - 2022/11/04
Y2 - 2026/07/21
TI - КОРПУСНИЙ ПІДХІД У ДОСЛІДЖЕННІ ДІЄСЛІВНИХ ПРЕДИКАТІВ
JF - Львівський філологічний часопис
JA - philology
VL - 0
IS - 11
SE - Статті
DO - 
UR - https://journal.ldubgd.edu.ua/index.php/philology/article/view/2429
AB - У статті висвітлено особливості корпусного підходу до аналізу дієслівних предикатів української, польської, англійської мов. Окреслено проблеми корпусної лінгвістики, здійснено огляд корпусів текстів, а саме Генерального регіонально анотованого корпусу української мови (GRAC), Національного корпусу польської мови (NKJP) і Британського національного корпусу (BNC). Згадані ресурси, відповідаючи вимогам автентичності, репрезентативності (збалансованості), достатності за обсягом (С. Бук, О. Демська, К. Фельбавм, А. Стефановіч, В. Широков, М. Шведова та ін.), дають змогу оптимізувати й об’єктивізувати тлумачення мовного матеріалу, одержати високу достовірність результатів. Наукова новизна дослідження полягає у комплексному зіставному аналізі функційних можливостей корпусів текстів української, польської, англійської мов з метою визначення їхніх особливостей, а також окреслення перспектив застосування корпуснобазованого підходу для вияву об’єктних зв’язків дієслівних предикатів. Уведено основні поняття корпусної лінгвістики: лема, словоформа, токен, мітка (тег), співуживання (колокація), конкорданс, частотність, запит CQL; їх проілюстровано реалізаціями відповідних референтно спеціалізованих дієслівних предикатів і їхніх об’єктів на базі GRAC, NKJP і BNC. Зокрема, показано, що найпростіше використання корпусів текстів полягає в засвідченні вживання тої чи іншої одиниці (concordance) та її частотності (тобто кількості повторень у корпусі). Для мов, багатих на словозміну, важлива можливість ідентифікації різних форм одного слова з його базовою формою – лемою. Проілюстровано, як досліджені корпуси уможливлюють подальше групування, упорядкування за частотністю та виокремлення конкретних словосполук, а розмітка частин мови полегшує пошук усіх колокацій дієслівних предикатів з потенційними об’єктами-іменниками на відстані 4 токенів. Описано функцію пошуку співуживань дієслів, погрупованих за лемами чи граматичними характеристиками та впорядкованих за частотністю. Вказано на переваги семантичної розмітки у корпусі GRAC для автоматичного пошуку одиниць мови та їхніх поєднань. Усі описані особливості корпусів текстів супроводжено ілюстраціями з GRAC, NKJP і BNC.
ER -