A számítógép már létrejöttekor kapcsolatban volt a fordítási feladattal, de csak a két nyelv közötti, tehát az egyetlen forrásnyelvből és egyetlen célnyelvből álló mondatpárokra koncentrált. Igaz, ekkortájt született meg az interlingva, azaz a közvetítőnyelv segítségével való többnyelvű fordítás gondolata, de a működő megoldások elmaradása miatt ez hosszú ideig csak absztrakt elképzelés maradt. Ezen az erősen kétnyelvű helyzeten a 20. század utolsó éveiben megjelent statisztikai rendszerek sem tudtak változtatni, mert a gyakoriságokon alapuló megközelítések szintén a forrásnyelvi-célnyelvi mondatpárokat helyezték a középpontba, amivel a többnyelvűséget pusztán kétnyelvű fordítások összekapcsolásaként vélték megvalósíthatónak. Az ok tehát mind a szabályalapú, mind a statisztikai rendszerek esetében a forrásnyelvi karaktersorozatból a célnyelvi karaktersorozatra való fordítás volt. A technológia további javulásával, de főleg a mesterséges intelligenciának nevezett gépi tanuló rendszerek előretörésével megjelentek a többé-kevésbé nyelvfüggetlen reprezentációk, és ezzel elkezdtek kialakulni a többnyelvűséget „alanyi jogon” kezelni képes számítógépes nyelvészeti rendszerek, melyek a gépi fordításban is új lehetőségeket hoztak. Az utóbbi években létrehozott többnyelvű fordítórendszerek minősége azt mutatja, hogy bár a fordítási feladat egy időben mindig két nyelv között zajlik, a „valódi” többnyelvűség megjelenése a nyelvtechnológiában új lehetőségeket hozott. Ezeket járja körül a tanulmány.
The computer was already involved in the task of translation at the time of its creation, but it focused only on sentence pairs of a single source language and a single target language. The idea of interlingua, i.e. multilingual translation using an intermediary language, had already been born, but it remained an abstract concept for a long time due to the lack of operational solutions. The statistical systems that appeared in the last years of the twentieth century could not change this strongly bilingual situation, because the frequency-based approaches also focused on source-language–target-language sentence pairs, whereby multilingualism was considered to be feasible as a mere combination of bilingual translations. The reason for both rule-based and statistical systems was therefore the translation from the source language string to the target language string. With the further improvement of technology, but especially with the advance of machine learning systems called artificial intelligence, more or less language-independent representations appeared, and with them, computational linguistic systems capable of handling multilingualism “by default” began to emerge, which also brought new possibilities for machine translation. The quality of the multilingual translation systems developed in recent years shows that, although the translation task is always performed between two languages at the same time, the emergence of “genuine” multilingualism has opened up new opportunities for language technology. These are explored in this paper.
Aharoni, Roee – Johnson, Melvin – Firat, Orhan (2019). „Massively Multilingual Neural Machine Translation”. In: Proceedings of the Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. 1 (Long and Short Papers). Minneapolis, Minnesota: Association for Computational Linguistics, 3874–3884. https://aclanthology.org/N19-1388.pdf
Chiang, Ting-Rui – Chen, Yi-Pei – Yeh, Yi-Ting et al. (2022). „Breaking Down Multilingual Machine Translation”. In: Findings of the Association for Computational Linguistics: ACL 2022. Dublin: Association for Computational Linguistics, 2766‒2780. https://aclanthology.org/2022.findings-acl.218.pdf
Dabre, Raj–Chu, Chenhui–Kunchukuttan, Anoop (2020). „A Survey of Multilingual Neural Machine Translation”. ACM Computing Surveys, 53, 5, 1‒38. https://dl.acm.org/doi/pdf/10.1145/3406095
Fan, Angela–Bhosale, Shruti–Schwenk, Holger et al. (2021). „Beyond English-Centric Multilingual Machine Translation”. Journal of Machine Learning Research, 22/107, 1–48.
Herranz, Manuel (2024). „Neural Machine Translation versus Prompting-Based LLM Translation - How Close Are We?” Pangeanic Blog, (2024. máj. 18.). https://blog.pangeanic.com/neural-machine-translation-prompting-based-llm-translation-how-close-are-we
Johnson, Melvin – Schuster, Mike – Le, Quoc V. et al. (2017). „Google’s Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation”. In: Transactions of the Association for Computational Linguistics, 5, Cambridge, MA: MIT Press, 339‒351. https://aclanthology.org/Q17-1024/
Lu, Yichao–Keung, Phillip–Ladhak, Faisal (2018). „A Neural Interlingua for Multilingual Machine Translation”. Proceedings of the Third Conference on Machine Translation, 1, Research Papers, 84–92. https://aclanthology.org/W18-6309/
Novák Attila – Tihanyi László – Prószéky Gábor (2008). „The MetaMorpho Translation System”. Proceedings of the Third Workshop on Statistical Machine Translation, ACL: Columbus, Ohio, 111–114. https://aclanthology.org/W08-0311.pdf
Oravecz Csaba – Sass Bálint – Tihanyi László (2012). „iTranslate4.eu”. In: Research Report. Budapest: MTA Nyelvtudományi Intézet.
Pan, Sinno Jialin–Yang, Qiang (2010). „A Survey on Transfer Learning”. IEEE Transactions on Knowledge and Data Engineering, 22/10, 1345‒1359. https://www.cse.ust.hk/~qyang/Docs/2009/tkde_transfer_learning.pdf
Prószéky Gábor (2021). „A gépi fordítás hetvenéves története”. In: Dodé Réka – Ludányi Zsófia, szerk. A korpusznyelvészettől a neurális hálókig: Köszöntő kötet Váradi Tamás 70. születésnapjára. Budapest: MTA Nyelvtudományi Kutatóközpont, 141‒156. https://real.mtak.hu/126717/1/VT70_kotet_Proszeky_125-end.pdf
Prószéky Gábor – Tihanyi László (2009). „webforditas.hu: egy internetes nyelvtechnológiai szolgáltatás tanulságai”. In: Tanács Attila, szerk. VI. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2009). Szeged: SZTE, 35–45. https://acta.bibl.u-szeged.hu/58695/
Raw, Anthony–Vandecapelle, Bart–Van Eynde, Frank (1988). „Eurotra: An Overview”. Interface. Journal of Applied Linguistics, 3/1, 5−32. https://aclanthology.org/www.mt-archive.info/Interface-1988-Raw.pdf
Schubert, Klaus (1988). „The Architecture of DLT – Interlingual or Double Direct?” In: Dan Maxwell − Klaus Schubert − Toon Witkam, szerk. New Directions in Machine Translation. Dordrecht: Foris, 131–144.
Vaswani, Ashish – Shazeer, Noam – Parmar, Niki et al. (2017). „Attention Is All You Need”. In: Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach, CA, USA, 6000–6010. https://proceedings.neurips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf
Weaver, Warren (1955). „Translation”. In: Locke, William N. – Booth, Donald, szerk. Machine Translation of Languages: Fourteen Essays. Cambridge/New York: MIT/Wiley, 15‒23.
Zhu, Changfeng – Yu, Heng ‒ Cheng, Shanbo et al. (2020). „Language-Aware Interlingua for Multilingual Neural Machine Translation”. In: Jurafsky, Dan – Chai, Joyce – Schluter, Natalie et al. (eds.) Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. ACL, 1650–1655. https://aclanthology.org/2020.acl-main.150
Zoph, Barret – Knight, Kevin (2016). „Multi-source Neural Translation”. In: Proceedings of the Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. San Diego: Association for Computational Linguistics, 30‒34. https://aclanthology.org/N16-1004/
Zoph, Barret – Yuret, Deniz – May, Jonathan et al. (2016). „Transfer Learning for Low-resource Neural Machine Translation”. Proceedings of the Conference on Empirical Methods in Natural Language Processing. Austin, Texas: Association for Computational Linguistics, 1568–1575. https://aclanthology.org/D16-1163/