Корпусний інструментарій OPUS для забезпечення інтелектуального перекладу (на прикладі текстів L1 і L2 англійсько-українського кінодискурсу)

Я. В.  Капранов; Т. В.  Тронь; Б. О.  Івановська

doi:10.32589/2311-0821.2.2022.274929

Корпусний інструментарій OPUS для забезпечення інтелектуального перекладу (на прикладі текстів L1 і L2 англійсько-українського кінодискурсу)

Автор(и)

Я. В. Капранов Київський національний лінгвістичний університет, Україна https://orcid.org/0000-0003-2915-038X
Т. В. Тронь Київський національний лінгвістичний університет, Україна https://orcid.org/0000-0003-0266-8461
Б. О. Івановська Економіко-гуманітарний університет у Варшаві, Польща https://orcid.org/0000-0003-1331-2866

DOI:

https://doi.org/10.32589/2311-0821.2.2022.274929

Ключові слова:

перекладацька пам’ять, автоматизований переклад, машинний переклад, паралельний корпусний інструментарій, корпусна лінгвістика, OPUS

Анотація

У статті розтлумачено термінопоняття “перекладацька пам’ять” і визначено як комп’ютерні бази даних, де представлено як сегменти текстів різних дискурсів L1, так і еквіваленти цих сегментів L2. Окреслено основні види перекладацької пам’яті: автоматизований переклад, машинний переклад, паралельний корпусний інструментарій. Автоматизований переклад – це процес виконання перекладу тексту L1 для отримання L2 шляхом використання спеціалізованого комп’ютерного забезпечення. У такий спосіб людський фактор відіграє одну з важливих місій у
процесі виконання автоматизованого перекладу, адже текст L1 піддається трьом видам обробки – до, інтер- і післяредагуванню. Машинний переклад розглянуто вузько як процес перекладу тексту з L1 на L2, що відбувається за допомогою комп’ютера повністю і / або частково, а також у широкому значенні – як галузь наукових досліджень лінгвістики, математики і кібернетики, яка має на меті побудувати систему, що реалізує машинний переклад у вузькому значенні цього поняття. Паралельний корпусний інструментарій – база даних із набором текстів L1 і L2, де міститься значна кількість текстів різних дискурсів, проблематики, тематики. Окрім цього, увагу звернено на корпусний інструментарій OPUS як один із видів перекладацької пам’яті, що забезпечує ефективність процесу інтелектуального перекладу і на сьогодні є безкоштовною корпусною системою у відкритому доступі, яка містить корпуси текстів від L1 і L2 до L3… Ln із різних інтернет-ресурсів і постійно поповнюється. Апробовані ресурсні можливості корпусного інструмента OPUS засвідчили свою ефективність у процесі верифікації одно-, дво- і трикомпонентних лексичних конструктів L2 на прикладі фрагментів тексту L1 і L2, що належить до кінодискурсу.

Посилання

Ємельянова, О. В., Мовчан, Д. В., & Баранова, С. В. (2018). ХХІ століття – нова ера

можливостей для студентів перекладачів. Проблеми освіти : збірник наукових

праць, 89, 134–144.

Попович, Н. М., Луцків, А. М., & Тищук, А. Г. (2020). Corpus-Based Concept

Translation. Фаховий та художній переклад: теорія, методологія, практика:

матеріали Міжнародної науково-практичної конференції, 306–314.

Alsop, S., King, V., Giaimo, G., & Xu, X. (2020), Uses of Corpus Linguistics in Higher

Education Research: An Adjustable Lens. In Huisman, J. and Tight, M. (Ed.) Theory

and Method in Higher Education Research (Theory and Method in Higher Education

Research, Vol. 6), Emerald Publishing Limited, Bingley, pp. 21–40. https://doi.

org/10.1108/S2056-375220200000006003

Cheng, Y., Jiang, L., & Macherey, W. (2019). Robust Neural Machine Translation with

Doubly Adversarial Inputs. Proceedings of ACL, 4324–4333.

Chitez, M., & Pungǎ, L. (2020). Digital Methods of Translation Studies: Using Corpus Data

To Assess Trainee Translations. British and American Studies; Timisoara Vol. 26, 241–270.

Halacsy, P., Kornai, A., & Oravecz, C. (2007). Poster paper: Hunpos – an open source

trigram tagger. In Proceedings of the 45th Annual Meeting of the Association for

Computational Linguistics Companion Volume Proceedings of the Demo and Poster

Sessions, (pp. 209–212), Prague, Czech Republic, June. Association for Computational

Linguistics.

Kay, M. (1980). The proper place of men and machines in language translation. Xerox Palo

Alto Research Center, 1–21.

Kruger, A. (2002). “Corpus-based Translation Research: Its Development and Implications

for General, Literary and Bible Translation” in Acta Theologica Supplementum, 2, 70–106.

Neumann, S., Freiwald, J., & Heilmann, A. (2022). On the Use of Multiple Methods in

Empirical Translation Studies: A Combined Corpus and Experimental Analysis of

Subject Identifiability in English and German. In S. Granger & M. Lefer (Authors),

Extending the Scope of Corpus-Based Translation Studies (pp. 98–129). London:

Bloomsbury Academic.

Nivre, J., Hall, J., Nilsson, J., Chanev, A., Eryigit, G., Kubler, S., Marinov, S., & Marsi,

E. (2007). MaltParser: A Language Independent System for Data-Driven Dependency

Parsing. Natural Language Engineering, 13(2), 95–135.

Pylypiuk, K. M. (2022). On the Issue of Interaction of Linguistic Regional Studies and

Translation Theory and Practice. Закарпатські філологічні студії, 22(1), 221–225.

https://doi.org/10.32782/tps2663-4880/2022.21.1.41

Stefanowitsch, A. (2020). Corpus Linguistics: A Guide to the Methodology. Berlin:

Language Science Press. https://doi.org/10.5281/zenodo.3735822

Tiedemann, J. (2009). News from OPUS – a Collection of Multilingual Parallel Corpora

with Tools and Interfaces. In N. Nicolov, K. Bontcheva, G. Angelova, & R. Mitkov.

Recent Advances in Natural Language Processing, V, 237–248. John Benjamins,

Amsterdam/Philadelphia, Borovets, Bulgaria.

Tiedemann, J. (2012). Parallel Data, Tools and Interfaces in OPUS. In LREC Conferences,

–2218.

Tognini-Bonelli, E. (2001). Corpus Linguistics at Work. Studies in Corpus Linguistics, 6.

Amsterdam: John Benjamns.

Yifan He (2011). The Integration of Machine Translation and Translation Memory: Thesis.

Dublin City University School of Computing.

##submission.downloads##

Опубліковано

2023-03-14

Номер

Том 25 № 2 (2022)

Розділ

ПЕРЕКЛАДОЗНАВСТВО

Ліцензія

1. Дослідження, що публікуються у збірнику наукових праць, повинні бути виконані відповідно до чинного законодавства України та етичних норм. Основний обов’язок автора полягає в тому, щоб виконати таке дослідження, яке заслуговує на об’єктивне обговорення науковою спільнотою його значущості.

2. Автори повинні формулювати свої наукові спостереження у такий спосіб, щоб їхні результати могли бути підтверджені іншими вченими, без підробки отриманих висновків або маніпуляції ними.

3. Автори статей несуть відповідальність за зміст статей і за сам факт їх публікації.

4. Автор повинен цитувати ті публікації, які вплинули на сутність роботи, а також ті, які можуть швидко познайомити читача з попередніми роботами, важливими для розуміння цього дослідження. За винятком оглядів, слід мінімізувати цитування робіт, які не мають безпосереднього відношення до змісту дослідження. Автор зобов’язаний провести джерельний пошук, щоб знайти і процитувати оригінальні публікації, тісно пов’язані з цим матеріалом. Необхідно також коректно вказувати на джерела принципово важливих матеріалів, використаних у цій роботі, якщо вони не були отримані самим автором.

5. Автори повинні дотримуватися усіх чинних вимог щодо публікацій рукописів. Неприпустимим є плагіат та його удавання за оригінальну розвідку, а також подання до редакції раніше опублікованої статті. У випадках виявлення плагіату відповідальність несуть автори поданих матеріалів.

6. Експериментальне або теоретичне дослідження може іноді слугувати основою для науково коректної і об’єктивної критики роботи іншого дослідника. Опубліковані статті в окремих випадках можуть містити подібну критику. Персональна суб’єктивна критика не є доречною за жодних обставин.

7. Співавторами статті мають бути ті особи, науковий внесок яких є вагомим у її зміст та які розділяють відповідальність за здобуті результати. Автор, який подає рукопис до друку, відповідає за те, щоб до списку співавторів були включені всі ті й лише ті особи, які відповідають критеріям авторства. У статті, написаної декількома авторами, той з авторів, хто подає до редакції контактні відомості, документи і листується з редакторами, бере на себе відповідальність за згоду інших авторів статті на її публікацію у збірнику.

8. Автори повинні повідомити редактора про будь-який потенційний конфлікт інтересів, на які могла б вплинути публікація результатів, що містяться у рукописі.

9. Автори повинні чітко вказати джерела всієї процитованої інформації, оформити посилання на наукові джерела відповідно до вимог ДСТУ ГОСТ 7.1:2006.

10. Редколегія має право відмовити у публікації статті за умов недотримання зазначених вимог.

11. Автор може висловити побажання не залучати деяких рецензентів до розгляду рукопису. Проте головний редактор може прийняти рішення залучити одного або декількох із цих рецензентів, якщо переконаний, що їх думки є важливими для неупередженого розгляду рукопису. Таке рішення може бути прийняте, наприклад, у тому випадку, коли є серйозні суперечності між цим рукописом і попередньою роботою потенційного рецензента.

12. Запобігання псевдонауковим публікаціям є відповідальністю кожного автора, головного редактора, рецензента, видавця й організації.

Корпусний інструментарій OPUS для забезпечення інтелектуального перекладу (на прикладі текстів L1 і L2 англійсько-українського кінодискурсу)

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Номер

Розділ

Ліцензія

Мова