Tato studie se pokouší pomocí velkého množství jazykových dat a lexikografického popisu češtiny sledovat, jak se v češtině píše a hovoří o válce, jak se tento diskurz proměňuje v čase a jak se do textů promítá česká historická zkušenost. Rozsáhlá data pocházejí z českých korpusů: výběrově od 50. let 20. století do podzimu roku 2024. Po roce 1990 vzhledem k současnosti data narůstají, jsou zastoupena především publicistikou, ale i výběr beletrie je rozsáhlý a roste podíl webových textů. Data jsou doplněna i malým, ale unikátním výběrem textu z mluvených projevů. Pro výzkum byl zvolen přístup data-driven: vyhledané slovo válka je zkoumáno v kontextech pomocí kolokačních měr, nástroje pro sémantickou podobnost slov, frazémové anotace. Důležitou roli hraje i frekvence, která díky poměrně velkému časovému rozsahu textů a velkému zastoupení publicistiky odráží aktuální válečné konflikty ve světě. Výsledky přinášejí dynamický pohled na to, jak se v češtině reflektuje téma války.
Opakovaně jsou zmiňovány války, které silně zasáhly do české historie a po nichž se změnily politické poměry. Jedná se především o válku třicetiletou (1618–1648) a dvě světové války ve 20. století. Po první světové válce (1914–1918) vzniklo samostatné Československo, během druhé světové války (1939–1945) bylo Československo okupováno a poté zde nastal komunistický režim. Zejména z této doby se objevují vzpomínky na autentické prožitky příbuzných v mluvených datech. Tyto tendence potvrzuje i zvolený sémantický model vytvořený na základě rozsáhlých webových textů. Mnohem méně zmínek je věnováno časově delší studené válce (v letech 1947–1991), jak je nazýváno období napjatých politických vztahů mezi Spojenými státy a tehdejším Sovětským svazem.
Aktuálně probíhající válečné konflikty pak odrážejí především data psané češtiny z roku 2022, jde o válku na Ukrajině. V těchto textech se objevuje podpora ukrajinských imigrantů a ke srovnání průběhu války slouží zkušenosti z první a druhé světové války. Objevují se také zmínky o negativních věcech doprovázejících válku, jako je např. inflace.
Nejčerstvější data pocházejí z webu a prezentují mimo jiné názorové rozdíly v přístupech k válce na Ukrajině. V těchto textech je už zmiňován i aktuální konflikt na Blízkém východě. Pod vlivem jednotlivých názorových skupin, často spojených s tzv. antisystémovými weby, vzniká i řada neologismů. Jejich velkou část představují kompozita s ironickým významem.
V korpusu česky psané beletrie, v němž se objevují i mimoevropská a historická válečná témata, je téma války poměrně časté. Patří sem ovšem i slavná postava dobrého vojáka Švejka, která rovněž rezonuje v dalších textech a zároveň je slovotvorně produktivní. Jedná se o jeden z českých stereotypů.
Podobně širší časovou perspektivu představují frazémy a jejich modifikace. Zde je zřejmé, že válka představuje metaforický koncept. Kolokace představují dále slovesné kombinace, které demonstrují počátek, průběh a konec konfliktu a s ním spojenou smrt.
This study attempts to use a large amount of linguistic data and lexicographic descriptions of the Czech language to trace how ‘war’ (válka) is written and spoken about in Czech, how this discourse changes over time, and how Czech historical experience is reflected in the texts. The extensive data comes from Czech corpora: the sample is from the 1950s to the autumn of 2024. After 1990, relative to the present, the data grows, being represented mainly by journalism, but the selection of fiction is also extensive, and the proportion of web texts is growing. The data is also supplemented by a small, but unique selection of spoken texts. A data-driven approach has been adopted for the research: the retrieved word ‘war’ is examined in contexts using collocation measures, a word semantic similarity tool, and phrase annotation. Frequency also plays an important role, reflecting the current war conflicts in the world due to the relatively large period in which the texts appeared and the large representation of journalism. The results provide a dynamic view of how the topic of war appears in Czech.
The following war references appear most often in the texts: the Thirty Years’ War (1618–1648), and two world wars in the 20th century. After the First World War (1914–1918), an independent Czechoslovakia was established, and during the Second World War (1939–1945), Czechoslovakia was occupied and then it was subjected to the communist regime. These tendencies are confirmed by the chosen semantic model based on extensive web texts. Far fewer mentions are devoted to the longer Cold War (1947–1991), as the tense political relations between the USA and the Soviet Union.
The current ongoing war conflicts are then mainly reflected in the dates of the written Czech from 2022: the war in Ukraine. Support for Ukrainian immigrants appears in these texts and the practices and developments in World War I and World War II are used as a comparison. There are also references to the negative aspects accompanying the war, such as inflation and economic problems.
The most recent data comes from the web and presents, among other things, differences of opinion in approaches to the war in Ukraine. The current conflict in the Middle East has already been mentioned in these texts. Several new collocations have been created under the influence of individual opinion groups, often associated with so-called anti-system websites.
Non-European and historical wars also appear in the corpus of Czech fiction. The theme of war is quite frequent here. However, it also includes the famous figure of the good soldier Švejk, which also resonates in other texts and is at the same time verbally productive. This is one of the Czech stereotypes.
Similarly, a broader temporal perspective is represented by idioms and their modifications. Here it is clear that war is a metaphorical concept. Collocations are further represented by verb combinations that demonstrate the beginning, course and end of the conflict and the associated death of soldiers.
Borovička Michael – Kaše Jiří – Kučera Jan P. – Bělina P. 2013 Velké dějiny zemí Koruny české. Svazek XII.b 1890–1918. Praha–Litomyšl, Paseka.
Dvořáková Žaneta 2023 Ukraine and Ukrainian toponyms in Czech urbanonymy. Zhytomyr Ivan Franko State University Journal. Philological Sciences 100, 2, 111−125.
Gebhart Jan – Kuklík Jan 2006 Velké dějiny zemí Koruny české. Sv. XV. 1938–1945. Praha–Litomyšl, Paseka.
Haller Jiří 1969–1986 Český slovník věcný a synonymický 1–3. Praha, SPN.
Havránek Bohuslav a kol. 1989 Slovník spisovného jazyka českého. Praha, Academia.
Hrdlička Milan 2021 České předložky v komunikaci i ve výuce cizinců. Nová čeština doma a ve světě 2, 41–49.
Klégr Aleš 2007 Tezaurus jazyka českého. Slovník českých slov a frází souznačných, blízkých a příbuzných. Praha, NLN.
Kopřivová Marie 2024 Krajina a počasí prostřednictvím jazyka. In: Kiss Szemán Róbert (ed.): Otisky středoevropské krajiny a podnebí v našich kulturách. Budapest, ELTE BTK Szláv Filológiai Tanszék – Szent Adalbert Közép- és Kelet-Európa Kutatásokért Alapítvány, 137–148.
Kratochvíl Alexander – Soukup Jiří a kol. (eds.) 2016 Paměť válek a konfliktů. Ústav pro českou literaturu AV ČR. Praha, Akropolis.
Machek Václav 1997 Etymologický slovník jazyka českého. Praha, NLN.
Obstová Zora–Tichý Ondřej–Klégr Aleš 2022 Projekt Lexikálně-sémantické databáze češtiny (LSD-Czech: uživatelský pojmový slovník a online databáze). Studie z aplikované lingvistiky 13, 2, 86–98.
Petkevič Vladimír – Kopřivová Marie – Hnátková Milena – Jelínek Tomáš – Rosen Alexandr – Skoumalová Hana – Vondřička Pavel 2021 Databáze víceslovných jednotek v češtině. In: Janovec Ladi-slav (red.): Svět v obrazech a ve frazeologii II. World in Pictures and in Phraseology II. Praha, Univerzita Karlova, Pedagogická fakulta, 511–528.
Rejzek Jiří 2015 Český etymologický slovník. Praha, Leda.
Rejzek Jiří 2022 My a oni: slovanské *tjudj- ‘cizí’. In:Saicová Římalová Lucie – Wiendl Jan (eds.) Já – ty, my – oni. Člověk jako bytost společenská / Ja – ty, my – oni. Człowiek jako istota społeczna. Praha, Univerzita Karlova, Filozofická fakulta, 42–45.
Rychlý Pavel 2008 A Lexicographer-Friendly Association Score. https://www.sketchengine.eu/wp-content/uploads/2015/03/Lexicographer-Friendly_2008.pdf , přístup 22. 11. 2023.
Saicová Římalová Lucie – Kopřivová Marie – Rejzek Jiří We are my ʻusʼ and they are migranti ʻmigrantsʼ, emigranti ʻemigrantsʼ, přistěhovalci ʻimmigrantsʼ, uprchlíci ʻrefugeesʼ, and others: Othering in the context of migration in Czech. V tisku.
Skoumalová Hana – Kopřivová Marie – Petkevič Vladimír – Jelínek Tomáš – Rosen Alexandr – Vondřička Pavel – Hnátková Milena 2024 Lemur: A lexicon of Czech multiword expressions. In: Giouli Vuola – Mititelu Verginica Barbu (eds.): Multiword expressions in lexical resources: Linguistic, lexicographic, and computational perspectives. Berlin, Language Science Press, 1–37.
Stěpanová Ludmila 2022 Etymologický slovník české frazeologie. Olomouc, Univerzita Palackého.
Stohler Uršula 2016 Téma druhé světové války v českých čítankách v letech 1948–2010. In: Kratochvíl Alexander – Soukup Jiří (eds.): Paměť válek a konfliktů. Praha, Ústav pro českou literaturu AV ČR – Akropolis, 51–58.
Tichý Ondřej–Obstová Zora–Klégr Aleš 2021 A lexico-semantic database of Czech: An interim report. Linguistica Pragensia 31, 93–100.
Wachtarcyková Jana – Garabík Radovan 2022 Vlastné mená a vektorové priestory jako výsledky korpusovej inštrumentalizácie. In: Bánik Tomáš – Bauko Ján (red.): Vlastné mená v interdisciplinárnom kontexte. Nitra, Univerzita Konštantína Filozofa, 78–102.
Benko Vladimír 2018 Aranea. A Family of Comparable Gigaword Web Corpora. Web Corpora & Corpus Linguistics Portal. Bratislava, Slovak Academy of Sciences, Ľ. Štúr Institute of Linguistics [cit. 2024-11-3].
Cvrček Václav – Jeziorský Tomáš – Henyš Jan 2022 ONLINE2_NOW:Monitorovací korpus internetové češtiny. Praha, Ústav Českého národního korpusu FF UK, Praha [cit. 2024-11-3]. http://www.korpus.cz
Kopřivová Marie – Laubeová Zuzana – Lukeš David – Poukarová Petra 2020 ORATOR v2: Korpus monologů. Ústav Českého národního korpusu FF UK, Praha [cit. 2024-11-3]. https://www.korpus.cz
Kopřivová Marie – Laubeová Zuzana – Lukeš David – Poukarová Petra – Škarpová Marie 2020 ORTOFON v2: Korpus neformální mluvené češtiny s víceúrovňovým přepisem. Ústav Českého národního korpusu FF UK, Praha [cit. 2024-11-3]. https://www.korpus.cz
Kopřivová Marie – Laubeová Zuzana – Lukeš David – Poukarová Petra – Waclawičová Martina – Benešová Lucie – Křen Michal 2017 ORAL: Korpus neformální mluvené češtiny. Ústav Českého národního korpusu FF UK, Praha [cit. 2024-11-3]. http://www.korpus.cz
Křen Michal – Cvrček Václav – Henyš Jan – Hnátková Milena – Jelínek Tomáš – Kocek Jan – Kovaříková Dominika – Křivan Jan – Milička Jiří – Petkevič Vladimír – Procházka Pavel – Skoumalová Hana – Šindlerová Jana – Škrabal Michal 2023 Korpus SYN, verze 12. Ústav Českého národního korpusu FF UK, Praha [cit. 2024-11-3]. https://www.korpus.cz
Skoumalová Hana – Bartoň Tomáš – Cvrček Václav – Hnátková Milena – Kocek Jan 2010 Totalita: Korpus jazyka komunistické totality. Praha, Ústav Českého národního korpusu FF UK [cit. 2024-11-3]. https://www.korpus.cz