Čeština a strojový překlad
Ondřej Bojar
Knížka přináší aktuální souborný popis problematiky strojového překladu, různých přístupů k němu a jejich výhod a nevýhod a zabírá se i otázkami vyhodnocování kvality překladu. Čeština jako podkladový jazyk potvrzuje svou vynikající roli: pro podchycení českých jazykových jevů je zapotřebí bohaté teorie, přitom je ale pro češtinu dostatek nástrojů a anotovaných i neanotovaných textových dat. Strojový překlad je výzvou pro lingvisty i filozofy, informatiky i statistiky; pro počítačovou lingvistiku je úplnou výkladní skříní jazykových jevů, zajímavých problémů i postupů. Čeština není v oblasti strojového překladu nijak zanedbaným jazykem, právě naopak. Kromě jazykovědných teorií budovaných českými lingvisty se dnes můžeme opřít také o rozsáhlé sbírky českých nebo i česko-anglických textů, které lingvisté v posledních zhruba deseti letech obohatili o podrobné rozbory, tzv. anotace. Díky tomu představuje čeština vynikající studijní materiál i pro mezinárodní vědeckou veřejnost, ve strojovém překladu mezi češtinou a angličtinou se dokonce každoročně soutěží. Vlastní strojový překladač si dnes může sestavit z volně dostupných součástí každý programátor. Je proto nejvyšší čas souborně představit téma strojového překladu širšímu publiku. Důraz klademe na vysvětlení nejpodstatnějších částí aktuálních teorií, přístupů i algoritmů. Věříme, že četné ilustrace pochopení usnadní. Snad vás téma zaujme, a přiložíte-li ruku k dílu, jistě se nám podaří udržet náskok, který má čeština např. ve srovnání s ostatními slovanskými jazyky.... celý text
Přidat komentář
Díky téhle publikaci jsem napsala bakalářku. Teda, jasně, nejen díky téhle a ne celou, ale strašně moc mi pomohla zorientovat se ve strojovém překladu a v terminologii, která se v tomto oboru v českém prostředí používá (protože to byl pro mě při překladu sakra velký oříšek). Jistě že si pořád nejsem úplně jistá, jak to všechno funguje, navíc té matematické stránce knihy jsem nerozuměla tolik, kolik asi autor předpokládá (koneckonců je to určené převážně počítačovým lingvistům, ne nějaké trubce z fildy). Zároveň jsem po dlouhé době pocítila jistou hrdost, že jsem Češka. Být příslušníkem národa, který se na poli vědy dokáže prosazovat, to je fakt hezký pocit. :)