Lancsbox software options for the prospective investigation  of the multilingual corpus for European studies

О. Ю. Андрушенко

doi:10.32589/2311-0821.1.2023.286180

Lancsbox software options for the prospective investigation of the multilingual corpus for European studies

Автор(и)

О. Ю. Андрушенко Київський національний лінгвістичний університет, Україна https://orcid.org/0000-0002-7699-9733

DOI:

https://doi.org/10.32589/2311-0821.1.2023.286180

Ключові слова:

European, LancsBox, корпусні дослідження, корпусний інструментарій, автоматичний аналіз

Анотація

У статті представлено компаративний аналіз лексеми European у двох мовних варіантах англійської мови (британський та американський) на основі вбудованих ліцензованих корпусів програмного забезпечення LancsBox (AmE06 та BE06 відповідно), що репрезентовані газетними статтями, художньою літературою тощо. Описано алгоритм виконання лінгвістичного дослідження, що є частиною проєкту “Мультилінгвальний корпус та його ресурси для дослідження Європеїстики” (КНЛУ) (програма Erasmus+). LancsBox – зручне програмне забезпечення, що працює з основними
операційними системами та є ефективним менеджером для укладання й використання вже наявних корпусів. Це дає змогу візуалізувати текстуальні дані на основі наступного пакету програмного забезпечення: KWIC, GraphColl, Words, Ngrams, Wizard. Вони є основними для вивчення окремої лінгвістичної одиниці. Статистичний аналіз обох окреслених корпусів довів, що слово European належить до лексичних одиниць із низькою частотою використання в мові. Порівняння двох мовних варіантів показало, що слово використовується в майже однакових найпоширеніших
10 колокаціях, проте при імплементації інструмента візуалізації GraphColl зауважена основна відмінність між уживанням одиниці в корпусах. Так, у корпусі британської англійської мови найчастіше трапляються структури N+N, що більш динамічні порівняно з відповідними структурами в корпусі американської англійської мови. Окрім цього, T-тест статистично показав значну різницю між корпусами у функціонуванні лінгвістичної змінної European. Отримані дані
можуть свідчити про культурну відмінність носіїв у двох мовних варіантах, зважаючи на те, що обидва корпуси представляють тексти, укладені в межах однакових часових рамок.

Посилання

Andrushenko, O. (2021). Information-structural transformations of additive adverb EVEN (a case study of the English language written records and corpora of the XII-XVII c.). Messenger of Kyiv National Linguistic University. Series Philology. Volume 24, No. 1,

pp. 16-32. DOI: 10.32589/2311-0821.24%20(1).2021.236109.

Andrushenko, O. (2022). The Scope of just: evidence from information-structure annotation in diachronic English Corpora. In N. Sharonova, V. Lytvyn, et al. (Eds.), Proceedings of the 6th international conference on computational linguistics and intelligent systems

(COLINS 2022), Vol. I: Main Conference, Gliwice, Poland, May 12-13, 2022 (pp. 677– 696). Available online: https://ceur-ws.org/Vol-3171/paper51.pdf

Andrushenko, O. (2023). Particularizing focus markers in Old English: just the case of adverb polysemy? Lege Artis: Language yesterday, today, tomorrow. (Accepted for publication, date of publication: December 2023).

Andrushenko О.Iu. Lancsbox software options for the prospective investigation of the multilingual corpus for European studies

Anokhina, T. (2023). Newspaper subcorpus (subcorpus of the modern european media) in the structure of the multilingual corpus. Philological Treatises. Volume 15, No. 1, pp. 7-15. DOI: 10.21272/Ftrk.2023.15(1)-1.

Baker, P. (2009). The BE06 Corpus of British English and recent language change. International Journal of Corpus Linguistics, 14 (3), 312–337. DOI: 10.1075/ijcl.14.3.02.bak.

Baker, P. (2010). Corpus methods in linguistics. In L. Litosseliti (Ed.), Research methods in linguistics (pp. 93–113). London, New York: Continuum.

Brezina, V. (2018). Statistics in corpus linguistics: A practical guide. Cambridge: Cambridge University Press.

Brezina, V., McEnery, T., & Wattam, S. (2015). Collocations in context: A new perspective on collocation networks. International Journal of Corpus Linguistics, 20 (2), 139–173.

Brezina, V., Porizka, P. (2021). Kolokační grafy a sítě s použitím nástroje #LancsBox: aplikace v angličtině a češtině. Časopis pro moderní filologii, 103, Č. 1, 36–59. DOI: 10.14712/23366591.2021.1.

Brezina, V., Timperley, M., & McEnery, T. (2018). #LancsBox 4.x [software]. Available online: http://corpora.lancs.ac.uk/lancsbox.

Brezina, V., Weill-Tessier, P., & McEnery, T. (2020). #LancsBox 5.x and 6.x [software]. Available online: http://corpora.lancs.ac.uk/lancsbox.

Collins, L. (2019). Corpus linguistics for online communication: A guide for research. New-York: Routledge.

Davies, M. (2019). The best of both worlds: Multi-billion word “dynamic” corpora. In P. Banski at al (Eds.). Proceeding of the Workshop on Challenges in the Management of Large Corpora (CMLC-7) 2019 (pp. 23–28). Manhein: Leibniz Institute für Deutsche Sprache. DOI: 10.14618/ids.pub.8998.

Gries, S. (2013). 50-something years of work on collocations: What is or should be next.... International Journal of Corpus Linguistics, 18(1), 137–166. DOI: 10.1075/ijcl.18.1.09gri.

Johansson, S. (2009). Some aspects of the development of corpus linguistics in thr 1970s and 1980s. In Anke Lüdeling & Merja Kytö (Eds), Corpus linguistics: An international handbook (pp. 33–53). Berlin: De Gruyter.

Kilgarriff, A., Baisa, V., Bušta, J., Jakubíček, M., Kovář, V., Michelfeit, J., Rychlý, P., & Suchomel, V. (2014). The Sketch Engine: ten years on. Lexicography, 1 (1), 7–36. DOI: 10.1007/s40607-014-0009-9.

Lange, C. & Leuckert, S. (2020) Corpus linguistics for world Englishers: A guide for research. New-York: Routledge.

Lavidas, N. & Haugh, D.T.T. (2020). Postclassical Greek and treebanks for a diachronic analysis. In D. Rafiyenko & I. Seržant (Eds.), Postclassical Greek: contemporary approaches to philology and linguistics (pp. 163–202). Berlin: Walter de Gruyter.

Lawrence, S. (2019). A rite of the edge: The language of baptism and christening in the church of England. London: SCM Press.

López-Couso, M. J., Méndez-Naya, A., Núñez-Pertejo, B. P., & Palacios-Martínez, I.M. (2016). Corpus linguistics on the move. Exploring and understanding English through corpora. Leiden, Boston: Brill Rodopi.

McEnery, T. & Hardie, A. (2015) Corpus Linguistics. New-York: Routledge.

O’Keeffe, A., McCarthy, M. (2021). The Routledge Handbook of Corpus Linguistics. NewYork: Routledge.

Potts, A., & Baker, P. (2012). Does semantic tagging identify cultural change in British and American English? International Journal of Corpus Linguistics, 17 (3), 295–324.

Rissanen, M. (2009). Corpus linguistics and historical linguistics. In A. Lüdeling & M. Kytö (Eds.), Corpus linguistics: An international handbook (pp. 53–68). Berlin: De Gruyter.

Stefanowitsch, A. (2020). Corpus linguistics: a guide to the methodology. Berlin: Language Science.

Whitt, R. (2018). Using diachronic corpora to understand the connection between genre and language change. In R. Whitt (Ed.), Diachronic corpora, genre, and language change, (pp. 1-18), Amsterdam, Philadelphia: John Benjamins Publ

##submission.downloads##

PDF (English)

Опубліковано

2023-08-31

Номер

Том 26 № 1 (2023)

Розділ

Статті

Ліцензія

1. Дослідження, що публікуються у збірнику наукових праць, повинні бути виконані відповідно до чинного законодавства України та етичних норм. Основний обов’язок автора полягає в тому, щоб виконати таке дослідження, яке заслуговує на об’єктивне обговорення науковою спільнотою його значущості.

2. Автори повинні формулювати свої наукові спостереження у такий спосіб, щоб їхні результати могли бути підтверджені іншими вченими, без підробки отриманих висновків або маніпуляції ними.

3. Автори статей несуть відповідальність за зміст статей і за сам факт їх публікації.

4. Автор повинен цитувати ті публікації, які вплинули на сутність роботи, а також ті, які можуть швидко познайомити читача з попередніми роботами, важливими для розуміння цього дослідження. За винятком оглядів, слід мінімізувати цитування робіт, які не мають безпосереднього відношення до змісту дослідження. Автор зобов’язаний провести джерельний пошук, щоб знайти і процитувати оригінальні публікації, тісно пов’язані з цим матеріалом. Необхідно також коректно вказувати на джерела принципово важливих матеріалів, використаних у цій роботі, якщо вони не були отримані самим автором.

5. Автори повинні дотримуватися усіх чинних вимог щодо публікацій рукописів. Неприпустимим є плагіат та його удавання за оригінальну розвідку, а також подання до редакції раніше опублікованої статті. У випадках виявлення плагіату відповідальність несуть автори поданих матеріалів.

6. Експериментальне або теоретичне дослідження може іноді слугувати основою для науково коректної і об’єктивної критики роботи іншого дослідника. Опубліковані статті в окремих випадках можуть містити подібну критику. Персональна суб’єктивна критика не є доречною за жодних обставин.

7. Співавторами статті мають бути ті особи, науковий внесок яких є вагомим у її зміст та які розділяють відповідальність за здобуті результати. Автор, який подає рукопис до друку, відповідає за те, щоб до списку співавторів були включені всі ті й лише ті особи, які відповідають критеріям авторства. У статті, написаної декількома авторами, той з авторів, хто подає до редакції контактні відомості, документи і листується з редакторами, бере на себе відповідальність за згоду інших авторів статті на її публікацію у збірнику.

8. Автори повинні повідомити редактора про будь-який потенційний конфлікт інтересів, на які могла б вплинути публікація результатів, що містяться у рукописі.

9. Автори повинні чітко вказати джерела всієї процитованої інформації, оформити посилання на наукові джерела відповідно до вимог ДСТУ ГОСТ 7.1:2006.

10. Редколегія має право відмовити у публікації статті за умов недотримання зазначених вимог.

11. Автор може висловити побажання не залучати деяких рецензентів до розгляду рукопису. Проте головний редактор може прийняти рішення залучити одного або декількох із цих рецензентів, якщо переконаний, що їх думки є важливими для неупередженого розгляду рукопису. Таке рішення може бути прийняте, наприклад, у тому випадку, коли є серйозні суперечності між цим рукописом і попередньою роботою потенційного рецензента.

12. Запобігання псевдонауковим публікаціям є відповідальністю кожного автора, головного редактора, рецензента, видавця й організації.