Мультилінгвальний корпус і його програмне забезпечення для дослідження європеїстики
DOI:
https://doi.org/10.32589/2311-0821.1.2023.286184Ключові слова:
мультилінгвальний корпус, комбінований тип корпусу текстів, Європеїстика, комп’ютерні програми, корпус-менеджериАнотація
У статті запропонована методика роботи із функціоналом комп’ютерних програм AntConc, WordSmith, WordList, MonoConc Pro, CATMA й KORP, які можна використовувати для дослідження текстів мультилінгвального корпусу за тематикою Європеїстики. Розглянуто різні дискусійні погляди зарубіжних учених – представників корпусної лінгвістики – щодо змісту поняття мультилінгвальний корпус. Сформульовано робоче визначення мультилінгвального зіставного корпусу, який належить до комбінованого типу тематично орієнтованих різномовних корпусів текстів, об’єднаних
у підкорпуси, з їх перекладом іншими мовами (або з можливістю застосування комп’ютерних програм для виконання перекладу текстів). Визначено роль корпусної лінгвостатистики, якою оснащені проаналізовані комп’ютерні програми і яка дозволяє здійснювати обчислення частоти вживання слів чи колокацій, будувати діаграми частоти вживання слова / колокації в підкорпусах текстів тощо. Зроблено попередній висновок про те, що комп’ютерний інструментарій корпус-менеджерів AntConc, WordSmith, WordList, MonoConc Pro, CATMA й KORP надає змогу конструювати як окремі Key Word
in Context (KWIC), так й конкордансні списки пошукових елементів за тематикою Європеїстики; розмежовувати відтінки того чи іншого контекстуального значення пошукових одиниць в їхній найбільш імовірній лівобічній та правобічній валентності в різних мовах; побачити результати статистичної обробки інформації з корпусних тегів; зберігати та роздруковувати результати; підтримувати різні формати текстових даних (txt, doc, rtf, html й ін.).
Посилання
Андрушенко, О. (2022). Комплексна методика дослідження фокусувальних адвербів у сучасних та історичних корпусах текстів англійської мови. Innovative pathway for the development of modern philological sciences in Ukraine and EU countries (pp. 26–54). Publishing House “Baltija Publishing”.
Бобер, Н. М. (2020). Когнітивно-семантична матриця фразових дієслів емоційних станів людини у Британському національному корпусі [Дис. канд. філол. наук, Національний педагогічний університет імені М. П. Драгоманова].
Жуковська, В. В. (2013). Ресурси корпусної лінгвістики у дослідженні історичної динаміки мови. В Матеріали міжнародної наукової конференції “Слово і речення: синтактика, семантика, прагматика” (с. 151–156). Київський університет імені Бориса Грінченка.
Мейзерська, І. В. (2014). Корпусний підхід у сучасній лінгвістиці: перспективи і можливості застосування. Науковий вісник кафедри Юнеско. Серія Філологія. Педагогіка. Психологія, 28, 53–58.
Широков, В. А., Бугаков, О. В., & Грязнухіна, Т. О. (2005). Корпусна лінгвістика. Київ: Довіра.
Afli, H., Barrault, L., & Schwenk, H. (2012). Traduction automatique à partir de corpus comparables: extraction de phrases parallèles à partir de données comparables multimodales. Actes de la conférence conjointe JEP-TALN-RECITAL, 2, 447–454.
Barzilay, R., & Lee, L. (2003). Learning to Paraphrase: An Unsupervised Approach Using Multiple-Sequence Alignment. Edmonton.
Biber, D., Conrad, S., & Reppen, R. (1998). Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press.
Bowker, L., & Pearson, J. (2002). Working with Specialized Language: A Practical Guide to Using Corpora. Routeledge.
Brawn, S. (2007). Designing and exploiting small multimedia corpora for autonomous learning and teaching. In E. Hidalgo, L. Quereda, J. Santana (Eds.), Corporain the Foreign Language Classroom: Selected Papers from the Sixth International Conference on Teaching and Language Corpora (TaLC 6, p. 32–33.). Rodopi.
Cartoni, B., & Deléger, L. (2011). Découverte de patrons paraphrastiques en corpus comparable: une approche basée sur les n-grammes. In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts (p. 182–187). Montpellier.
Culo, O., Schirra, S.H., Neumann, S., & Vela, M. (2008). Empirical Studies on Language Contrast Using the English-German Comparable and Parallel Corpus. In N. Calzolari (Ed.), Workshop abstracts / Sixth International Conference on Language Resources and Evaluation (pp. 47–51). Palais des Congrès Mansour Eddahbi.
Elhadad, N., & Sutaria, K. (2007). Mining a Lexicon of Technical Terms and Lay Equivalents. In ACL BioNLP Workshop (p. 49–56). Prague.
Guidère, M. (2010). Introduction à la traductologie. Penser la traduction: hier, aujourd‟hui, demain. De Boeck Université.
Johns, T. (1991). Should You Be Persuaded – Two Samples of Data-driven Learning Materials. Classroom Concordancing: ELR Journal, 4, 1–16.
Kapranov, Ya. (2022). AntСonc corpus manager and its possibilities for keywords with resilience semantics search. In R. Vasko (Ed.), Language. Culture. Discourse (p. 22–32). РС ТЕСHNOLOGY СЕNTЕR.
Kilgariff, A. (2001). Comparing Corpora. International Journal of Corpus Linguistics, 6, 97–133.
McEnery, A. M. (2003). Corpus Linguistics. In R. Mitkov (Ed.), The Oxford Handbook of Computational Linguistics (p. 448–463). Oxford University Press.
McЕnery, A., & Xiao, Z. (2007). Parallel and Comparable Corpora: What is Happening. In Incorporating Corpora: Translation and the Linguist (p. 18–31). Multilingual Matters.
O’Keeffe, A., McCarthy, M., & Carter, R. (2007). From Corpus to Classroom : Language Use and Language Teaching. Cambridge University Press.
Rauf, S. (2012). Efficient Corpus Selection for Statistical Machine Translation: thèse de Doctorat. Université du Maine.
Reppen, R. (2010). Using Corpora in the Language Classroom. Cambridge University Press.
Resnik, P., & Smith, N. A. (2003). The Web as a parallel corpus. Computational Linguistics, 29(3), 349‒380.
Scarpa, F. (2010). La traduction spécialisée: une approche professionnelle à l’enseignement de la traduction. University of Ottawa Press.
Zanettin, F. (1998). Bilingual Corpora and the Training of Translators. Meta, 4(43), 616–630.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
1. Дослідження, що публікуються у збірнику наукових праць, повинні бути виконані відповідно до чинного законодавства України та етичних норм. Основний обов’язок автора полягає в тому, щоб виконати таке дослідження, яке заслуговує на об’єктивне обговорення науковою спільнотою його значущості.
2. Автори повинні формулювати свої наукові спостереження у такий спосіб, щоб їхні результати могли бути підтверджені іншими вченими, без підробки отриманих висновків або маніпуляції ними.
3. Автори статей несуть відповідальність за зміст статей і за сам факт їх публікації.
4. Автор повинен цитувати ті публікації, які вплинули на сутність роботи, а також ті, які можуть швидко познайомити читача з попередніми роботами, важливими для розуміння цього дослідження. За винятком оглядів, слід мінімізувати цитування робіт, які не мають безпосереднього відношення до змісту дослідження. Автор зобов’язаний провести джерельний пошук, щоб знайти і процитувати оригінальні публікації, тісно пов’язані з цим матеріалом. Необхідно також коректно вказувати на джерела принципово важливих матеріалів, використаних у цій роботі, якщо вони не були отримані самим автором.
5. Автори повинні дотримуватися усіх чинних вимог щодо публікацій рукописів. Неприпустимим є плагіат та його удавання за оригінальну розвідку, а також подання до редакції раніше опублікованої статті. У випадках виявлення плагіату відповідальність несуть автори поданих матеріалів.
6. Експериментальне або теоретичне дослідження може іноді слугувати основою для науково коректної і об’єктивної критики роботи іншого дослідника. Опубліковані статті в окремих випадках можуть містити подібну критику. Персональна суб’єктивна критика не є доречною за жодних обставин.
7. Співавторами статті мають бути ті особи, науковий внесок яких є вагомим у її зміст та які розділяють відповідальність за здобуті результати. Автор, який подає рукопис до друку, відповідає за те, щоб до списку співавторів були включені всі ті й лише ті особи, які відповідають критеріям авторства. У статті, написаної декількома авторами, той з авторів, хто подає до редакції контактні відомості, документи і листується з редакторами, бере на себе відповідальність за згоду інших авторів статті на її публікацію у збірнику.
8. Автори повинні повідомити редактора про будь-який потенційний конфлікт інтересів, на які могла б вплинути публікація результатів, що містяться у рукописі.
9. Автори повинні чітко вказати джерела всієї процитованої інформації, оформити посилання на наукові джерела відповідно до вимог ДСТУ ГОСТ 7.1:2006.
10. Редколегія має право відмовити у публікації статті за умов недотримання зазначених вимог.
11. Автор може висловити побажання не залучати деяких рецензентів до розгляду рукопису. Проте головний редактор може прийняти рішення залучити одного або декількох із цих рецензентів, якщо переконаний, що їх думки є важливими для неупередженого розгляду рукопису. Таке рішення може бути прийняте, наприклад, у тому випадку, коли є серйозні суперечності між цим рукописом і попередньою роботою потенційного рецензента.
12. Запобігання псевдонауковим публікаціям є відповідальністю кожного автора, головного редактора, рецензента, видавця й організації.