https://frosthead.com

S líbáním se jazykové bariéry

Po dlouhou dobu byl univerzální překladatel posedlostí popkultury. Star Trek to představuje jako ruční přístroj, připomínající mikrofon, který dokáže okamžitě překládat většinu jazyků . Průvodce stopařů po galaxii se může pochlubit babelskou rybou, tvorem, který, když uvízne v uchu, nabízí okamžitý překlad jakéhokoli jazyka v galaxii.

Nemělo by tedy být žádným překvapením, že se dnešní lidé pokoušejí vytvořit zařízení, které funguje stejně dobře. Existují desítky překladových aplikací pro chytré telefony, ale většina překládá slova jednoduchým způsobem, jeden na jednoho; uživatel napíše nebo vysloví slovo a aplikace se vrátí zpět s překladem. Nyní je cílem a skutečným peněžním neočekávaným úkolem inženýrů a podnikatelů umožnit dvěma lidem konverzovat v různých jazycích, zatímco malé zařízení vyplivuje překlady v reálném čase.

Existující překladové aplikace

Na cestě do Řecka onemocněl anglicky mluvící Andrew Lauder.

"Šel jsem do lékárny a oni nemohli rozumět žádné angličtině, takže nemám žádné léky, " říká Lauder, generální ředitel společnosti Vocre Translate. Drogové štítky byly pro něj doslova řecké. Pro světové cestovatele jsou běžné jazykové bariéry. V cizí zemi se malé transakce, jako je nákup léku nebo získání pokynů - další obtíž, s níž se Lauder potýká - staly herkulovými úkoly.

Když se vrátil do státu, vytvořil Lauder aplikaci Vocre Translate, aplikaci pro překlad hlasu a textu. Začalo to jako text-to-textová aplikace (nazvaná MyLangauge), poté se zpočátku transformovala na model řeči na text, který, stejně jako jiné aplikace včetně SayHi Translate, používal tradiční model, ve kterém se slovo překládá přímo do jiného slova. Řekněte „Ahoj, “ a chytrý telefon nebo tablet cvrlikají zpět automatizovanou „Hola“. „Sbohem“ se stává „Sayonara“. A tak dále, podobně jako textový překladač.

Pro vytvoření jednoduchého zvukového překladu potřebovali tvůrci těchto aplikací data. Vocre vytáhl své informace z veřejně dostupných záznamů a dokumentů, jako jsou staré filmy nebo veřejné slyšení. "V zásadě jsme prosili o přepis hlasové schránky, abychom mohli použít jejich cloud pro rozpoznávání řeči, " říká generální ředitel SayHi Lee Bossier.

Jakmile inženýři měli zvuková a textová data, spárovali zvuk a text, slovo za slovem. Software pro rozpoznávání hlasu rozpoznává „sýr“ a převádí jej na text. To je převedeno na francouzštinu a aplikace najde francouzskou výslovnost pro „fromage“.

To znamená, že pokud uživatel plynule volá něco „syrový“, překladatel nepracuje tak dobře, protože mluvený jazyk není zdaleka tak statický jako psaný jazyk. Kadence, slang, skloňování, výslovnost, dialekt a konverzační tok mohou změnit význam

V průběhu času však Lauder chtěl více konverzační zařízení. V e-mailu říká: „Na základě našich údajů o použití jsme zjistili, že lidé mluví velmi odlišně od způsobu, jakým píšou. Mluvené slovo je mnohem spontánnější a mnohem méně formální a doslovné. “Použil tedy statistický strojový překlad, což je také přístup, který používá Google, který používá data k nalezení běžného užívání slov, a vzdává se tradičního překladového modelu ze slova na slovo. Vocre se v podstatě učí, jak se používá. "Učí se na základě každé konverzace, každé fráze, která jím prochází." Je to něco, co se časem chytřejší, “říká Lauder.

V současné době trvá přeprava obou aplikací několik sekund, ale nepochybně jsou účinné, zejména ve shodě s řečí těla, pro transakční rozhovory, jako je objednání jídla. Koneckonců, lidé si objednávali jídlo v jiných jazycích než celá léta a vždy se jim podařilo stále jíst. Ale nebyli schopni vést důkladné a složité rozhovory.

U programů Vocre a SayHi mohou konverzace strmě klesat, ale není to stejné jako chatování ve vašem rodném jazyce. Google to hodlá úplně změnit.

Přístup Google (statistický strojový překlad)

Když se ve škole učíme nový jazyk, začneme individuálními termíny slovní zásoby. Jazyk je však plynulejší - slova vyžadují kontext.

„Přístup [Google] je obecnější, “ říká Josh Estelle, softwarový inženýr pro Google Translate. "Místo toho, abychom se pokusili všechna tato pravidla zafixovat, snažíme se je naučit pomocí přihlédnutí k datům."

Technologická společnost se vyhýbá individuální metodě „slovo za slovem“ a místo toho používá statistický strojový překlad, nehledě na to, co slova znamenají, ale na to, jak je jazyk modelován, který se učí pomocí dat . Zaměřuje se tedy na les, ne na stromy. Příklad z angličtiny: známe definice slova „break“ a „up“. Fráze „break up“ však není doslovnou kombinací obou slov.

Statistický strojový překlad vyžaduje data. Hory toho. Aby metoda fungovala, nepotřebuje jen skutečnost, že „sýr“ je francouzský sýr, ale 100 příkladů „sýra“ a sýra, které se používají ve skutečných větách.

Estelle říká, že pokud má anglický mluvčí dvě nabídky, totožné s výjimkou skutečnosti, že je vytištěno v angličtině a jedno v čínštině, „můžete pravděpodobně zjistit, co je čínská postava pro„ polévku “.“ Kontext je král. K vytvoření tohoto kontextu však potřebujete přístup k milionům nabídek a ke všem ostatním dokumentům, které si lze představit.

Což je přesně to, co má Google. Bez webového gigantu, který by shromažďoval hromady dat, nemohla babelská ryba existovat. Prochází web a shromažďuje vše - text a zvuk. Poté tato data přenáší do algoritmů, které porovnávají vše se vším ostatním. Tato srovnání pomáhají získat kořen toho, jak jazyk přirozeně funguje.

"Jedna věc, která lidi překvapí, když mluvíme o Překladu, je, že náš tým nemá žádné lingvisty, " říká Estelle. "Spustili jsme 71 jazyků a řekl bych, že náš tým neví, jak mluvit drtivou většinou." Lidský překladatel se nebude moci naučit všechny tyto termíny a věci tak rychle, jak se naše [data] mohou poučit z webu. “

Jaký to má smysl?

Stejně jako Google i Facebook vidí výhody. Zvažte vlastní překlad na sociálních sítích do překladu.

"Posláním Facebooku je propojování celého světa a jednou z překážek propojení světa není to, že všichni mluví stejným jazykem, " říká Tom Stocky, ředitel techniky na Facebooku. "Pokud jde o překlad, myslím si, že opravdu ambiciózní vize do budoucna je, kdybyste mohli Facebook používat ve svém rodném jazyce a komunikovat s jakýmkoli jiným jazykem."

Minulý srpen získal Facebook Jibbigo, aplikaci pro převod řeči na řeč, která je k dispozici pro zařízení Android a iOS.

Uživatelé Keen Facebooku si všimnou, že sociální stránka již používá nějaký překlad. Pokud jste někdy měli španělský příspěvek na vaší anglické stránce, okamžitě jste dostali příležitost jej přeložit do svého rodného jazyka.

Stocky však vidí hlasovou složku jako potenciální měnič her. Vzestup chytrých telefonů a tabletů vítá neustále propojený svět a nárůst softwaru pro rozpoznávání řeči přináší nové způsoby interakce na webu. Stocky předvídá budoucnost, ve které mohou uživatelé jednoduše vyslovit příkaz ke svým smartphonům a komunikovat s ostatními uživateli, kromě jazykových rozdílů.

"Není pochyb o tom, že se to nakonec stane, protože jediná omezení jsou síla jazykového enginu a samozřejmě doba zpracování a síla zpracování, " říká.

Laura Murphy, profesorka katedry globálních zdravotnických systémů a vývoje na Tulane University a přiznaná skeptikka technologií, zpochybňuje hodnotu univerzálního překladatele a nemusí znát více než jeden jazyk.

Myslí si, že by toto zařízení mohlo být užitečné v cestovních, obchodních a mezinárodních vztazích, ale ne průkopnické. Na určité úrovni již máme překladatele (lidi) a většina, kteří pracují v cizích vztazích, zná příslušné jazyky. Podle Murphyho by zařízení mohlo mít negativní důsledky.

"Myslím, že to může lidi zlobit, " říká Murphy. Překlad jazyků může být duševně náročný tím, že nutí mozek - zejména ten, který zná více než dva jazyky -, aby pracoval odlišným způsobem, ale cvičení je přesto prospěšné. Mozek se táhne z místa jazykové empatie, které ani ten nejlepší překladatel hlasu nikdy nedosáhl.

I když by tato univerzální komunikace mohla být pozitivní, uznává Murphy, „mohlo by to vést k tomu, že si lidé myslí, že komunikují, když nejsou.“ Kultura není vždy zcela ztělesněna v jazyce (například sarkazmus) a komunikace není vždy o předávaných informacích.

Kdy můžeme očekávat, že uvidíme tuto technologii?

"V roce 2005 nám trvalo 40 hodin, než jsme překládali 1 000 vět, " říká Estelle z Googlu. "Dnes překládáme ekvivalent 1 000 vět každých 10 milisekund."

Jak skvěle říká Richard Anderson v televizním seriálu Sedmdesát sedmdesátých let, „Máme technologii.“ Nyní je to jen o čekání na sběr a analýzu dat. Jak dlouho to bude trvat, podle Estelle není známo. Ale opatrné odhady daly takové zařízení do našich rukou během deseti let.

Zatímco tvůrci aplikací, jako je Bossier nebo obří společnosti, jako jsou Google a Facebook, nechtějí stavět své vlastní verze Biblické věže Babel, chce to ukončit blábolení. Představuje svět, ve kterém všichni komunikujeme, o medicíně, o politice, o nápadech.

A tento svět nemusí být daleko.

Poznámka editora: Tento příběh jsme aktualizovali 4. dubna 2014, abychom přesně popsali technologii Vocre Translate.

S líbáním se jazykové bariéry