Корпусний інструментарій OPUS для забезпечення інтелектуального перекладу (на прикладі текстів L1 і L2 англійсько-українського кінодискурсу)

Автор(и)

DOI:

https://doi.org/10.32589/2311-0821.2.2022.274929

Ключові слова:

перекладацька пам’ять, автоматизований переклад, машинний переклад, паралельний корпусний інструментарій, корпусна лінгвістика, OPUS

Анотація

У статті розтлумачено термінопоняття “перекладацька пам’ять” і визначено як комп’ютерні бази даних, де представлено як сегменти текстів різних дискурсів L1, так і еквіваленти цих сегментів L2. Окреслено основні види перекладацької пам’яті: автоматизований переклад, машинний переклад, паралельний корпусний інструментарій. Автоматизований переклад – це процес виконання перекладу тексту L1 для отримання L2 шляхом використання спеціалізованого комп’ютерного забезпечення. У такий спосіб людський фактор відіграє одну з важливих місій у
процесі виконання автоматизованого перекладу, адже текст L1 піддається трьом видам обробки – до, інтер- і післяредагуванню. Машинний переклад розглянуто вузько як процес перекладу тексту з L1 на L2, що відбувається за допомогою комп’ютера повністю і / або частково, а також у широкому значенні – як галузь наукових досліджень лінгвістики, математики і кібернетики, яка має на меті побудувати систему, що реалізує машинний переклад у вузькому значенні цього поняття. Паралельний корпусний інструментарій – база даних із набором текстів L1 і L2, де міститься значна кількість текстів різних дискурсів, проблематики, тематики. Окрім цього, увагу звернено на корпусний інструментарій OPUS як один із видів перекладацької пам’яті, що забезпечує ефективність процесу інтелектуального перекладу і на сьогодні є безкоштовною корпусною системою у відкритому доступі, яка містить корпуси текстів від L1 і L2 до L3… Ln із різних інтернет-ресурсів і постійно поповнюється. Апробовані ресурсні можливості корпусного інструмента OPUS засвідчили свою ефективність у процесі верифікації одно-, дво- і трикомпонентних лексичних конструктів L2 на прикладі фрагментів тексту L1 і L2, що належить до кінодискурсу.

Посилання

Ємельянова, О. В., Мовчан, Д. В., & Баранова, С. В. (2018). ХХІ століття – нова ера

можливостей для студентів перекладачів. Проблеми освіти : збірник наукових

праць, 89, 134–144.

Попович, Н. М., Луцків, А. М., & Тищук, А. Г. (2020). Corpus-Based Concept

Translation. Фаховий та художній переклад: теорія, методологія, практика:

матеріали Міжнародної науково-практичної конференції, 306–314.

Alsop, S., King, V., Giaimo, G., & Xu, X. (2020), Uses of Corpus Linguistics in Higher

Education Research: An Adjustable Lens. In Huisman, J. and Tight, M. (Ed.) Theory

and Method in Higher Education Research (Theory and Method in Higher Education

Research, Vol. 6), Emerald Publishing Limited, Bingley, pp. 21–40. https://doi.

org/10.1108/S2056-375220200000006003

Cheng, Y., Jiang, L., & Macherey, W. (2019). Robust Neural Machine Translation with

Doubly Adversarial Inputs. Proceedings of ACL, 4324–4333.

Chitez, M., & Pungǎ, L. (2020). Digital Methods of Translation Studies: Using Corpus Data

To Assess Trainee Translations. British and American Studies; Timisoara Vol. 26, 241–270.

Halacsy, P., Kornai, A., & Oravecz, C. (2007). Poster paper: Hunpos – an open source

trigram tagger. In Proceedings of the 45th Annual Meeting of the Association for

Computational Linguistics Companion Volume Proceedings of the Demo and Poster

Sessions, (pp. 209–212), Prague, Czech Republic, June. Association for Computational

Linguistics.

Kay, M. (1980). The proper place of men and machines in language translation. Xerox Palo

Alto Research Center, 1–21.

Kruger, A. (2002). “Corpus-based Translation Research: Its Development and Implications

for General, Literary and Bible Translation” in Acta Theologica Supplementum, 2, 70–106.

Neumann, S., Freiwald, J., & Heilmann, A. (2022). On the Use of Multiple Methods in

Empirical Translation Studies: A Combined Corpus and Experimental Analysis of

Subject Identifiability in English and German. In S. Granger & M. Lefer (Authors),

Extending the Scope of Corpus-Based Translation Studies (pp. 98–129). London:

Bloomsbury Academic.

Nivre, J., Hall, J., Nilsson, J., Chanev, A., Eryigit, G., Kubler, S., Marinov, S., & Marsi,

E. (2007). MaltParser: A Language Independent System for Data-Driven Dependency

Parsing. Natural Language Engineering, 13(2), 95–135.

Pylypiuk, K. M. (2022). On the Issue of Interaction of Linguistic Regional Studies and

Translation Theory and Practice. Закарпатські філологічні студії, 22(1), 221–225.

https://doi.org/10.32782/tps2663-4880/2022.21.1.41

Stefanowitsch, A. (2020). Corpus Linguistics: A Guide to the Methodology. Berlin:

Language Science Press. https://doi.org/10.5281/zenodo.3735822

Tiedemann, J. (2009). News from OPUS – a Collection of Multilingual Parallel Corpora

with Tools and Interfaces. In N. Nicolov, K. Bontcheva, G. Angelova, & R. Mitkov.

Recent Advances in Natural Language Processing, V, 237–248. John Benjamins,

Amsterdam/Philadelphia, Borovets, Bulgaria.

Tiedemann, J. (2012). Parallel Data, Tools and Interfaces in OPUS. In LREC Conferences,

–2218.

Tognini-Bonelli, E. (2001). Corpus Linguistics at Work. Studies in Corpus Linguistics, 6.

Amsterdam: John Benjamns.

Yifan He (2011). The Integration of Machine Translation and Translation Memory: Thesis.

Dublin City University School of Computing.

##submission.downloads##

Опубліковано

2023-03-14

Номер

Розділ

ПЕРЕКЛАДОЗНАВСТВО