https://frosthead.com

Mluvit se stroji

Software pro rozpoznávání hlasu, který by většina z nás pravděpodobně souhlasila, je docela skvělá věc. Ale mluvení se stroji je součástí - ať už jde o chytrý telefon, televizní obrazovku nebo palubní desku - ale ne tolik. Požádáte o radu zařízení? Reeks of geek. Vyjádření každého slova, abyste byli srozumitelní? Jak skvěle můžete být?

Ale Apple, který je věrný formě, zaujal tuto hlavu tím, že najal ve své poslední reklamní kampani pro Siri, hlas iPhonu 4S, tři hvězdičky. Jsou tu Zooey Deschanel (Adorable Cool) a John Malkovich (Cerebral Cool) a Samuel L. Jackson (Ultimate Cool) a všichni dělají zapojení do wordplay a s telefonem jako sport bohů.

Kritici nicméně poukazují na to, že v reálném životě Siri není ani tak citlivá, ani vševědoucí, jak je vyobrazena v reklamách. I vy jste si jist, že jste šokováni, když to slyšíte. Jiní vidí celou věc jako zralou pro parodii - viz bratra Zooeyho Jooey, jak spolu dělají zábavnou nebo zemní verzi Zooeyho a Siriho deštivého dne.

Nezáleží. Siri se stal vedoucím zpěvákem v robotickém sboru, hlasem „You Got Mail“ nové generace.

V některých kruzích je módní naznačovat, že Siri není hodný Steva Jobse, že kdyby byl ještě naživu, Jobs by to stáhl z trhu nebo by alespoň nikdy takovou profilovou reklamu neschválil. kampaň za chybný produkt.

Ale jako Jobův nástupce Tim Cook řekl tento týden majitelé iPhone 4S jako Siri. Podle průzkumu zveřejněného v březnu téměř 90 procent uvádí, že jej používá alespoň jednou měsíčně. A mějte na paměti, že Siri, jeden z mála produktů Apple, o kterém se uvádí, že byl v době uvedení na trh, nebude oslavovat své první narozeniny až do října. Stále se učí jazyk a co je ještě důležitější, teprve začíná využívat potenciál umělé inteligence.

Siri bude pravděpodobně vrcholem Apple TV, jehož debut se očekává v prosinci. Ale šance jsou, že místo, kde se rozhovory se stroji stanou mainstreamem, je v našich autech.

Řídit, řekla

Jistě, to se už děje, ale pokud chceš porozumět, musíš přece mluvit s robotem. A ani tehdy neexistuje žádná záruka. To se začne měnit letos v létě, když některé nové modely přijdou vybaveny něčím zvaným Dragon Drive!

Je to vynález Nuance Communications, společnosti se sídlem v Massachusetts, která se stala motorem v oblasti rozpoznávání hlasu. (Obecně se předpokládá, že jsou mozky za Sirim.) Nuance a rozpoznávání hlasu v autech minulý týden velký skok kupředu, když firma oznámila, že Dragon Drive! budou moci proniknout do cloudu.

To znamená, že systém dramaticky zvýší výpočetní výkon a schopnost paměti. A to znamená, že hlas v přístrojové desce bude více podobný Siri a umožní vám s ním skutečně hovořit. Už žádné monosyllabické křik. Nastává den, kdy budete moci náhodně zmínit, že máte pocit, že se někteří Allman Brothers objeví, a o pár vteřin později začne „Whipping Post“ čerpat reproduktory.

Klíčem je to, jak dobře jsme schopni učit stroje kontext a pragmatiku - jak se jazyk používá v sociálních situacích. A to je složitá věc. Pro začátečníky i nejnáročnější zařízení pro rozpoznávání hlasu musí čekat, až člověk dokončí mluvení, aby dokázal rozebrat a interpretovat celou větu. Pak existuje „teorie mysli“, schopnost pochopit, že jiní lidé mohou mít jiné přesvědčení a úmysly než naše vlastní. Pokud víme, to mohou dělat jen lidé.

Nedávná studie dvou Stanfordských psychologů vám může poskytnout představu o tom, co je zapojeno do pomoci strojům intuitivně. Vědci Michael Frank a Noah Goodman uspořádali online experiment, ve kterém byli účastníci požádáni, aby se podívali na soubor objektů a poté vybrali, který z nich byl označen za konkrétní slovo. Jedna skupina účastníků například viděla modrý čtverec, modrý kruh a červený čtverec. Otázka pro tuto skupinu byla: Představte si, že s někým mluvíte a chcete odkazovat na prostřední objekt. Jaké slovo byste použili, „modrý“ nebo „kruh“?

Druhá skupina byla položena: Představte si, že s vámi někdo mluví a používá slovo „modrý“ k označení jednoho z těchto objektů. O jakém objektu mluví?

Odpovědi pomohly vědcům získat jasnější představu o tom, jak posluchač rozumí mluvčímu a jak řečník rozhoduje, co říct. Od té doby vyvinuli druh matematického modelu, který může rozšířit a zdokonalit počítačový proces myšlení.

Frank řekl: „Bude to trvat roky práce, ale sen je o počítači, který opravdu přemýšlí o tom, co chcete a co máte na mysli, nikoli jen o tom, co jste řekl.“

Způsob řeči

Zde je několik nejnovějších poznatků v rozpoznávání hlasu:

  • Siri mlčí: IBM má sklon být opravdu nervózní z podnikového tajemství, než se dostat ven, takže nyní svým zaměstnancům zakazuje používat veřejné weby pro přenos souborů, jako je Dropbox. Má však také zákaz používání Siri v kanceláři, protože bezpečnost vyvolává obavy, že někdo při rozhovoru s telefonem může odhalit citlivé informace, které končí na serverech Apple.
  • Berte na to, Apple !: Společnost Samsung uvedla tento týden v Londýně svůj nový chytrý telefon Galaxy X III, a zatímco jeho velký dotykový displej si zaslouží velkou pozornost, obsahuje také nový software pro rozpoznávání hlasu a obličeje.
  • Udělejte, co říkám, ne to, co dělám: A Samsung se tam nezastaví. Nedávno podala patentovou přihlášku na robota, který rozumí lidské řeči. Robot by byl schopen upravit své „naslouchací“ schopnosti tak, aby zohledňovaly okolní hluk, který by mohl přerušit nebo narušit příkazy, které mu byly dány. Bylo by také možné rozpoznat, kdo s tím mluví, i když je hluk pozadí velmi hlasitý.

Infographic bonus: Myslíte si, že vaše auto je nyní počítačové. Počkejte, až bude úplně připojen k Internetu. Získejte snížení, co může připojené auto dělat.

Mluvit se stroji