Lancsbox software options for the prospective investigation of the multilingual corpus for European studies



Ключові слова:

European, LancsBox, корпусні дослідження, корпусний інструментарій, автоматичний аналіз


У статті представлено компаративний аналіз лексеми European у двох мовних варіантах англійської мови (британський та американський) на основі вбудованих ліцензованих корпусів програмного забезпечення LancsBox (AmE06 та BE06 відповідно), що репрезентовані газетними статтями, художньою літературою тощо. Описано алгоритм виконання лінгвістичного дослідження, що є частиною проєкту “Мультилінгвальний корпус та його ресурси для дослідження Європеїстики” (КНЛУ) (програма Erasmus+). LancsBox – зручне програмне забезпечення, що працює з основними
операційними системами та є ефективним менеджером для укладання й використання вже наявних корпусів. Це дає змогу візуалізувати текстуальні дані на основі наступного пакету програмного забезпечення: KWIC, GraphColl, Words, Ngrams, Wizard. Вони є основними для вивчення окремої лінгвістичної одиниці. Статистичний аналіз обох окреслених корпусів довів, що слово European належить до лексичних одиниць із низькою частотою використання в мові. Порівняння двох мовних варіантів показало, що слово використовується в майже однакових найпоширеніших
10 колокаціях, проте при імплементації інструмента візуалізації GraphColl зауважена основна відмінність між уживанням одиниці в корпусах. Так, у корпусі британської англійської мови найчастіше трапляються структури N+N, що більш динамічні порівняно з відповідними структурами в корпусі американської англійської мови. Окрім цього, T-тест статистично показав значну різницю між корпусами у функціонуванні лінгвістичної змінної European. Отримані дані
можуть свідчити про культурну відмінність носіїв у двох мовних варіантах, зважаючи на те, що обидва корпуси представляють тексти, укладені в межах однакових часових рамок.


