Корпусний інструментарій OPUS для забезпечення інтелектуального перекладу (на прикладі текстів L1 і L2 англійсько-українського кінодискурсу)
DOI:
https://doi.org/10.32589/2311-0821.2.2022.274929Ключові слова:
перекладацька пам’ять, автоматизований переклад, машинний переклад, паралельний корпусний інструментарій, корпусна лінгвістика, OPUSАнотація
У статті розтлумачено термінопоняття “перекладацька пам’ять” і визначено як комп’ютерні бази даних, де представлено як сегменти текстів різних дискурсів L1, так і еквіваленти цих сегментів L2. Окреслено основні види перекладацької пам’яті: автоматизований переклад, машинний переклад, паралельний корпусний інструментарій. Автоматизований переклад – це процес виконання перекладу тексту L1 для отримання L2 шляхом використання спеціалізованого комп’ютерного забезпечення. У такий спосіб людський фактор відіграє одну з важливих місій у
процесі виконання автоматизованого перекладу, адже текст L1 піддається трьом видам обробки – до, інтер- і післяредагуванню. Машинний переклад розглянуто вузько як процес перекладу тексту з L1 на L2, що відбувається за допомогою комп’ютера повністю і / або частково, а також у широкому значенні – як галузь наукових досліджень лінгвістики, математики і кібернетики, яка має на меті побудувати систему, що реалізує машинний переклад у вузькому значенні цього поняття. Паралельний корпусний інструментарій – база даних із набором текстів L1 і L2, де міститься значна кількість текстів різних дискурсів, проблематики, тематики. Окрім цього, увагу звернено на корпусний інструментарій OPUS як один із видів перекладацької пам’яті, що забезпечує ефективність процесу інтелектуального перекладу і на сьогодні є безкоштовною корпусною системою у відкритому доступі, яка містить корпуси текстів від L1 і L2 до L3… Ln із різних інтернет-ресурсів і постійно поповнюється. Апробовані ресурсні можливості корпусного інструмента OPUS засвідчили свою ефективність у процесі верифікації одно-, дво- і трикомпонентних лексичних конструктів L2 на прикладі фрагментів тексту L1 і L2, що належить до кінодискурсу.
Посилання
Ємельянова, О. В., Мовчан, Д. В., & Баранова, С. В. (2018). ХХІ століття – нова ера
можливостей для студентів перекладачів. Проблеми освіти : збірник наукових
праць, 89, 134–144.
Попович, Н. М., Луцків, А. М., & Тищук, А. Г. (2020). Corpus-Based Concept
Translation. Фаховий та художній переклад: теорія, методологія, практика:
матеріали Міжнародної науково-практичної конференції, 306–314.
Alsop, S., King, V., Giaimo, G., & Xu, X. (2020), Uses of Corpus Linguistics in Higher
Education Research: An Adjustable Lens. In Huisman, J. and Tight, M. (Ed.) Theory
and Method in Higher Education Research (Theory and Method in Higher Education
Research, Vol. 6), Emerald Publishing Limited, Bingley, pp. 21–40. https://doi.
org/10.1108/S2056-375220200000006003
Cheng, Y., Jiang, L., & Macherey, W. (2019). Robust Neural Machine Translation with
Doubly Adversarial Inputs. Proceedings of ACL, 4324–4333.
Chitez, M., & Pungǎ, L. (2020). Digital Methods of Translation Studies: Using Corpus Data
To Assess Trainee Translations. British and American Studies; Timisoara Vol. 26, 241–270.
Halacsy, P., Kornai, A., & Oravecz, C. (2007). Poster paper: Hunpos – an open source
trigram tagger. In Proceedings of the 45th Annual Meeting of the Association for
Computational Linguistics Companion Volume Proceedings of the Demo and Poster
Sessions, (pp. 209–212), Prague, Czech Republic, June. Association for Computational
Linguistics.
Kay, M. (1980). The proper place of men and machines in language translation. Xerox Palo
Alto Research Center, 1–21.
Kruger, A. (2002). “Corpus-based Translation Research: Its Development and Implications
for General, Literary and Bible Translation” in Acta Theologica Supplementum, 2, 70–106.
Neumann, S., Freiwald, J., & Heilmann, A. (2022). On the Use of Multiple Methods in
Empirical Translation Studies: A Combined Corpus and Experimental Analysis of
Subject Identifiability in English and German. In S. Granger & M. Lefer (Authors),
Extending the Scope of Corpus-Based Translation Studies (pp. 98–129). London:
Bloomsbury Academic.
Nivre, J., Hall, J., Nilsson, J., Chanev, A., Eryigit, G., Kubler, S., Marinov, S., & Marsi,
E. (2007). MaltParser: A Language Independent System for Data-Driven Dependency
Parsing. Natural Language Engineering, 13(2), 95–135.
Pylypiuk, K. M. (2022). On the Issue of Interaction of Linguistic Regional Studies and
Translation Theory and Practice. Закарпатські філологічні студії, 22(1), 221–225.
https://doi.org/10.32782/tps2663-4880/2022.21.1.41
Stefanowitsch, A. (2020). Corpus Linguistics: A Guide to the Methodology. Berlin:
Language Science Press. https://doi.org/10.5281/zenodo.3735822
Tiedemann, J. (2009). News from OPUS – a Collection of Multilingual Parallel Corpora
with Tools and Interfaces. In N. Nicolov, K. Bontcheva, G. Angelova, & R. Mitkov.
Recent Advances in Natural Language Processing, V, 237–248. John Benjamins,
Amsterdam/Philadelphia, Borovets, Bulgaria.
Tiedemann, J. (2012). Parallel Data, Tools and Interfaces in OPUS. In LREC Conferences,
–2218.
Tognini-Bonelli, E. (2001). Corpus Linguistics at Work. Studies in Corpus Linguistics, 6.
Amsterdam: John Benjamns.
Yifan He (2011). The Integration of Machine Translation and Translation Memory: Thesis.
Dublin City University School of Computing.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
1. Дослідження, що публікуються у збірнику наукових праць, повинні бути виконані відповідно до чинного законодавства України та етичних норм. Основний обов’язок автора полягає в тому, щоб виконати таке дослідження, яке заслуговує на об’єктивне обговорення науковою спільнотою його значущості.
2. Автори повинні формулювати свої наукові спостереження у такий спосіб, щоб їхні результати могли бути підтверджені іншими вченими, без підробки отриманих висновків або маніпуляції ними.
3. Автори статей несуть відповідальність за зміст статей і за сам факт їх публікації.
4. Автор повинен цитувати ті публікації, які вплинули на сутність роботи, а також ті, які можуть швидко познайомити читача з попередніми роботами, важливими для розуміння цього дослідження. За винятком оглядів, слід мінімізувати цитування робіт, які не мають безпосереднього відношення до змісту дослідження. Автор зобов’язаний провести джерельний пошук, щоб знайти і процитувати оригінальні публікації, тісно пов’язані з цим матеріалом. Необхідно також коректно вказувати на джерела принципово важливих матеріалів, використаних у цій роботі, якщо вони не були отримані самим автором.
5. Автори повинні дотримуватися усіх чинних вимог щодо публікацій рукописів. Неприпустимим є плагіат та його удавання за оригінальну розвідку, а також подання до редакції раніше опублікованої статті. У випадках виявлення плагіату відповідальність несуть автори поданих матеріалів.
6. Експериментальне або теоретичне дослідження може іноді слугувати основою для науково коректної і об’єктивної критики роботи іншого дослідника. Опубліковані статті в окремих випадках можуть містити подібну критику. Персональна суб’єктивна критика не є доречною за жодних обставин.
7. Співавторами статті мають бути ті особи, науковий внесок яких є вагомим у її зміст та які розділяють відповідальність за здобуті результати. Автор, який подає рукопис до друку, відповідає за те, щоб до списку співавторів були включені всі ті й лише ті особи, які відповідають критеріям авторства. У статті, написаної декількома авторами, той з авторів, хто подає до редакції контактні відомості, документи і листується з редакторами, бере на себе відповідальність за згоду інших авторів статті на її публікацію у збірнику.
8. Автори повинні повідомити редактора про будь-який потенційний конфлікт інтересів, на які могла б вплинути публікація результатів, що містяться у рукописі.
9. Автори повинні чітко вказати джерела всієї процитованої інформації, оформити посилання на наукові джерела відповідно до вимог ДСТУ ГОСТ 7.1:2006.
10. Редколегія має право відмовити у публікації статті за умов недотримання зазначених вимог.
11. Автор може висловити побажання не залучати деяких рецензентів до розгляду рукопису. Проте головний редактор може прийняти рішення залучити одного або декількох із цих рецензентів, якщо переконаний, що їх думки є важливими для неупередженого розгляду рукопису. Таке рішення може бути прийняте, наприклад, у тому випадку, коли є серйозні суперечності між цим рукописом і попередньою роботою потенційного рецензента.
12. Запобігання псевдонауковим публікаціям є відповідальністю кожного автора, головного редактора, рецензента, видавця й організації.