https://frosthead.com

Úsměv, zamračení, grimasa a úšklebek - váš výraz obličeje je další hranicí ve velkých datech

Lidská tvář je poháněna, v závislosti na tom, jak je spočítáte, mezi 23 a 43 svaly, z nichž mnohé se připevňují na kůži, a neslouží žádné zřejmé funkci pro přežití. Cizinec zkoumající izolovaný lidský exemplář by nevěděl, co z nich udělat. Svaly na čele, obočí, rtech a tvářích vysílaly velké množství informací o našem emočním stavu, úrovni zájmu a bdělosti. Je to pozoruhodně účinný prostředek komunikace - téměř okamžité, obvykle přesné, překračující většinu jazykových a kulturních překážek. Někdy jsou však data ztracena, ignorována nebo nesprávně interpretována. Pokud se těžař v lese usmívá a nikdo ho nevidí, byl vlastně šťastný?

Z tohoto příběhu

[×] ZAVŘÍT

Tak dlouhé emotikony. Vědec vyvíjí technologii, která dokáže detekovat a číst naše výrazy

Video: Smithsonian Ingenuity Awards 2015: Rana el Kaliouby

Související čtení

Preview thumbnail for video 'Emotional Intelligence: Why It Can Matter More Than IQ

Emoční inteligence: Proč se to může týkat více než IQ

Koupit

Rana el Kaliouby nesnáší, když tyto informace plýtvají. Když jsem se setkal s el Kaliouby ve své malé kanceláři ve Walthamu v Massachusetts, viděl jsem, jak se jí stahuje hlavní sval zygomaticus, zvedá rohy úst a její okrouhlý oculi a krouží vnější rohy jejích očí. Usmála se a usuzuji, že mě vítá, ještě než dostane slovo „ahoj“. Dnes však dochází k mnoha společenským výměnám bez vzájemné osobní komunikace v reálném čase. Tam přichází el Kaliouby a její společnost.

El Kaliouby, který má 37 let, se často usmívá. Má kulatou, příjemnou, výraznou tvář a pečlivou cestu, která jí zakládá pozici spoluzakladatele rychle rostoucího technologického startu - anti-Bezos, un-Zuckerberg. Její společnost Affectiva, kterou založila v roce 2009 s tehdejší kolegou v MIT Media Lab, Rosalind Picard, zaujímá špičkové místo v technologii, aby pomocí počítačů mohla detekovat a interpretovat výrazy obličeje. Toto pole, známé jako „afektivní výpočetní technika“, se snaží uzavřít komunikační mezeru mezi lidmi a stroji přidáním nového způsobu interakce, včetně neverbálního jazyka úsměvu, úšklebků a zvednutých obočí. "Předpokladem toho, co děláme, je, že emoce jsou důležité, " říká el Kaliouby. "Emoce nenarušují naše racionální myšlení, ale vedou a informují ho." Chybí jim však naše digitální zkušenost. Váš smartphone ví, kdo jste a kde jste, ale neví, jak se cítíte. Naším cílem je opravit to. “

Proč potřebuje váš smartphone vědět, jak se cítíte? El Kaliouby má řadu odpovědí, vše vypovídajících o zdánlivě bezmezné integraci počítačů do každodenních životů. Představuje „technologii pro ovládání osvětlení, teploty a hudby v našich domovech v reakci na naše nálady“, nebo aplikace, které mohou přizpůsobit obsah filmu na základě vašich podvědomých reakcí na něj, zatímco budete sledovat. Představuje si programy, které mohou sledovat váš výraz, když řídíte a varujete před nepozorností, ospalostí nebo hněvem. Usměje se při zmínce o svém oblíbeném nápadu - „ledničce, která může cítit, když jste vystresovaní a zamrznou zmrzlinu.“

Zejména si myslí, že Affectiva a technologie, kterou pomáhá proniknout do hlavního proudu, bude přínosem pro zdravotní péči. Vědec, který testuje nový lék, nebo terapeut, který léčí pacienta, získává zpětnou vazbu pouze v určitých intervalech, přičemž podléhá všem problémům se sebeposouzením - touha v bezvědomí potěšit například lékaře, nebo selektivní stažení, které upřednostňuje nejnovější vzpomínky . El Kaliouby předpokládá program běžící na pozadí notebooku nebo telefonu subjektu, který by mohl sestavit momentální záznam jeho nálady v průběhu časového období (den, měsíc) a korelovat jej s čas nebo cokoli jiného, ​​co vaše zařízení dokáže měřit nebo sledovat. "Nemuselo by to být ani součástí léčebného programu, " přemítá. "Dalo by se to mít jen na telefonu a řekne ti to, pokaždé, když X volá, máš negativní výraz, a to ti řekne něco, co jsi možná nevěděl."

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Přihlaste se k odběru časopisu Smithsonian za pouhých 12 USD

Tento příběh je výběr z prosincového čísla časopisu Smithsonian.

Koupit

El Kaliouby podporuje afektivní práci s počítačem jako logický další krok v postupu z klávesnice na myš, dotykovou obrazovku a rozpoznávání hlasu. Na jaře vydala společnost Affectiva svou první komerční sadu pro vývoj softwaru, kterou mohou vývojáři, kteří se zajímají o emoční stavy uživatelů v reálném čase, začlenit do svých vlastních programů - například hudebních přehrávačů nebo herních či seznamovacích aplikací. A právě letos na podzim spustila společnost Affectiva Emotion jako službu, cloudový program, do kterého mohou zákazníci nahrávat videa pro analýzu. Kdo by to mohl použít? Kandidát, který má být vyslán na pracovní místo, který se obává, že se objeví úzkostně nebo znuděně nebo se příliš usmívá. Nebo letecká společnost najímající letušky, se stovkami videoprogramů, které se prosadí při hledání těch, kteří dokážou přesvědčit úsměv při rozloučení s cestujícími. (Skutečný úsměv, který zahrnuje kontrakci svalů v rozích očí, se nazývá „Duchenne“ úsměv, pojmenovaný pro anatomistu z 19. století; jeho opak, vynucený úsměv, který používá jen ústa, je ve skutečnosti někdy nazval úsměv „Pan Am“.)

A zařízení provozující tento software jsou samozřejmě připojena k internetu, takže informace, které shromažďují, jsou okamžitě agregovány, prosévány a propojeny do sítě tak, aby aplikace sociálních médií identifikovaly oblíbená témata nebo osobnosti. Možná je zkompilován do něčeho, jako je Affectiva Mood Index, číselný údaj o hrubém národním štěstí, nebo rozčleněný na regiony, kde se v současnosti smějí úsměvy nebo mračení.

DEC2015_H05_TechnologyRanaElKaliouby-WEB-RESIZE.jpg Základní program Affectivy analyzuje tvář 20krát za sekundu pro 46 lokalizovaných projevů štěstí, smutku, překvapení, strachu, hněvu, znechucení a pohrdání, plus zájmu a zmatku. (Naomi Shavin / Smithsonian)

Až dosud byli hlavními zákazníky společnosti Affectiva reklamní, marketingové a mediální společnosti. Jeho software automatizuje proces vedení ohniskové skupiny, těžkopádný rituál shromáždění desítek lidí v místnosti, aby mohli vyjádřit svůj názor na nový produkt, televizní seriál nebo reklamní kampaň; zaznamenává reakce přímo, aniž by účastník musel v reakci na prezentaci otáčet číselníkem nebo odpovídat na dotazník. Software navíc rozšiřuje potenciální fokusní skupinu do celého světa nebo alespoň jeho podstatnou část, která má počítač nebo mobilní zařízení s webovou kamerou.

Zpětná vazba od vytrvalého, vševidoucího oka Affectivy pomohla utvářet síťovou televizní komedii, čímž se dvě postavy zapomněly na hřích, že se diváci neusmáli. (El Kaliouby neidentifikuje show ani postavy.) Jeho software byl použit k vybudování „vzorkovače úsměvu“, což je stroj, který rozdával bonbóny zákazníkům, kteří se usmáli do kamery. S větším výzkumem by to mohlo být užitečné pro sledování davu na letištích nebo pro identifikaci potenciálních krádeží nebo jako detektor lži.

Ale el Kaliouby těmto tajným aplikacím odolával, ať už jsou lukrativní lukrativní. Myslí si, že afektivní výpočetní technika změní svět, mimo jiné včetně prodeje cukrovinek. „Étos naší společnosti, “ říká, „je používat tuto technologii ke zlepšení života lidí a pomoci jim lépe komunikovat, nejen pomoci inzerentům prodávat více produktů.“

**********

Na rozdíl od mnoha technických podnikatelů nebylo zbohatnutí na El Kalioubyho původní agendě. Narodila se v Káhiře egyptským rodičům, kteří oba pracují v technice. Vystudovala informatiku na Americké univerzitě v Káhiře, kde promovala v roce 1998, kdy se počítače staly dostatečně silnými, aby vědci přemýšleli o tom, že je dotují tím, co je z lidského hlediska nazývána emoční inteligence.

Pokračovala ve studiu informatiky na University of Cambridge a dorazila těsně po útocích na Ameriku 11. září 2001. Její rodiče si mysleli, že kvůli svému dědictví riskuje, že bude zatčena, obtěžována nebo horší. Přestože muslimskou pokrývku hlavy nosila až před několika lety, ani v Cambridge v Anglii, ani v Cambridge, Massachusetts, kam se v roce 2006 přestěhovala, aby se připojila k MIT Media Lab, byla obtěžována svým náboženstvím nebo vystoupením . "Myslím, že je to proto, že se hodně usmívám, " řekla s úsměvem.

DEC2015_H07_TechnologyRanaElKaliouby.jpg Francouzský anatomista Duchenne zveřejnil významné studie výrazů lidské tváře. (Bridgeman Images)

V Cambridge se začala zajímat o problém autismu, konkrétně o potíže, které mají autistické děti při čtení výrazů obličeje. Navrhla vybudovat „emocionální naslouchátko“, které by se mohlo nosit, aby bylo možné číst tváře a narážet na vhodné chování nositele. Zpočátku byla odmítnuta pro grant od National Science Foundation z důvodu, že projekt byl příliš obtížný, a ona a její kolegové postavili prototyp, skládající se z dvojice brýlí vybavených malou kamerou, blikajících světel a sluchátek, na rozdíl od dřívější verze Google Glass. Druhá žádost o grant byla úspěšná a poté, co se přestěhovala do MIT, pracovala s jejím týmem další tři roky, aby ji zdokonalila a otestovala ve škole na ostrově Rhode Island. El Kaliouby to popisuje jako „výzkumný projekt a úspěšný“ - autistické děti, které jej využívaly, měly ohromně pozitivní zkušenosti - ale v roce 2008, kdy grant skončil, čelila chvíli zúčtování. Obchodní zájem o afektivní výpočetní techniku ​​rostl a chtěla vidět, jak se rozšiřuje a vzkvétá; její úsilí o vývoj brýlí by ji omezilo na nepatrný kousek jeho možného využití. Takže spolu s Picardem odstartovala Affectivu, zatímco doufala, že jiná společnost zvedne emocionální naslouchátko a uvede ji na trh.

Když byla vytvořena společnost Affectiva, každý z hrstků „členů týmu“, kteří tvořili společnost, si vybral hodnotu, kterou chtěli ztělesnit, jako je „učení“ nebo „sociální odpovědnost“ nebo „zábava“. Hers, jako vedoucí strategie a vědecký pracovník, byla „vášeň“. Společnost s 20 osobami je vedena jako kvazi-demokracie, s pololetními schůzkami, na nichž zaměstnanci volí priority, které mají sledovat v příštích šesti měsících. V její kanceláři je tabule pokrytá kresbami mladé dcery jednoho z jejích kolegů; má šestiletého syna Adama a dvanáctiletou dceru Jana, která s ní žije na předměstí Bostonu (jejich otec žije v Egyptě). Její způsob je mírný a ohleduplný; hodinu do ranního setkání, které nabízí, aby si pro návštěvníka objednala sendvič, i když sama oběd vynechává. "Je to pro mě Ramadán, " říká s úsměvem, "ale není to pro vás Ramadan."

Sedí návštěvníky u stolu, čelí monitoru a webové kameře; software vyhledá tvář návštěvníka a nakreslí kolem něj rámeček na obrazovce. Identifikuje soubor bodů ke sledování: rohy očí a úst, špičku nosu atd. Dvacetkrát za sekundu software hledá „akční jednotky“, často prchavou hru svalů po tváři. Existuje 46 z nich, podle standardního systému klasifikace, systém kódování obličejové činnosti (FACS). Zahrnují vnitřní a vnější obočí, zeslabovače, mrknutí, mrknutí a zvrásnění rtů, trychtýře, kompresory a saje. Affectiva standardně vzorkuje asi 15 z nich kdykoli a analyzuje je na vyjádření sedmi základních emocí: štěstí, smutek, překvapení, strach, hněv, znechucení a pohrdání, plus zájem a zmatek. Úsměv, a můžete vidět míru štěstí střílet; stočte si rty do úšklebku a program si všimne vašeho znechucení.

Nebo přesněji, váš výraz znechucení. Celý předpoklad afektivní práce na počítači spočívá v tom, co znamená skok víry, že úsměv vyvolá pocit štěstí, potěšení nebo pobavení. Lidské bytosti jsou samozřejmě ve stejné pozici: Můžeme být oklamáni falešným úsměvem nebo předstíraným hněvem, takže od počítačového programu nemůžeme opravdu čekat víc, alespoň ještě ne.

V průběhu času vytvořila společnost Affectiva archiv více než tří milionů videí tváří, nahraných uživateli internetu přijatými z přibližně 75 zemí celého světa. Stovky tisíc z nich byly analyzovány vyškolenými pozorovateli a kódovány pro akční jednotky FACS - monumentální závazek, protože videa se průměrně pohybují kolem 45 sekund a každé zpracování trvá asi pětkrát. Výsledky z lidských kodérů byly zase použity k „zaškolení“ algoritmů společnosti, které zbytek zpracovaly v reálném čase. Celá databáze nyní obsahuje asi 40 miliard „datových bodů emocí“, což je zdroj, který se může pochlubit el Kaliouby, který odlišuje Affectiva od ostatních společností ve stejném oboru, jako je Emotient se sídlem v Kalifornii, pravděpodobně jeho nejbližší konkurent.

smile.chart.jpg (Graf: 5W Infographics; Zdroj: Daniel McDuff, MIT Media Lab, Affectiva)

Daniel McDuff, který nastoupil do společnosti Affectiva z MIT Media Lab a slouží jako ředitel výzkumu, neustále zkoumá tento trend, aby získal další vhled do vyjádření emocí. Jak se liší podle věku, pohlaví a kultury? (Možná překvapivě, McDuff zjistil, že starší lidé jsou výraznější, zejména pozitivní emoce než mladší.) Můžeme spolehlivě měřit pohrdání, rozpaky, nudu, úzkost? Kdy brázda obočí signalizuje zmatek a kdy to znamená koncentraci? Jak můžeme rozlišit mezi výrazem strachu a výrazem, který znamená překvapení? (Tip: Akční jednotka 1, „vnitřní zvedák na obočí“, je indikátorem strachu; akční jednotka 2, „vnější zvedák na obočí“, naznačuje překvapení.) Říká se, že má každý důvod se domnívat, že program bude pokračovat aby se lépe odhalovaly výrazy (i když to nikdy nemůže úplně překonat největší překážku ze všech: Botox).

Na mou žádost, McDuff dal programu jeden z velkých klasických problémů detekce emocí, Mona Lisa, jejíž záhadný kvazi-úsměv přitahuje diváky 500 let. S výhradou, že software pracuje nejlépe na řazení výrazů, nikoli na statických obrazech, uvedl, že nenašel žádný důkaz skutečného úsměvu La Giocondy, ale spíše nějakou kombinaci akční jednotky 28 (rty) a 24 (rty stlačené dohromady)., možná naznačující určitou míru nepohodlí.

**********

"Teď s tebou mluvím, " říká El Kaliouby, "a dívám se, jak měříš svůj zájem o to, co říkám." Měl bych zpomalit a vysvětlit více? Mám jít na jiné téma? Představte si, že dávám webinář velké skupině, kterou nevidím ani neslyším. Nemám žádnou zpětnou vazbu, neexistuje způsob, jak zjistit, zda vtip pracoval nebo padl na rovinu, pokud jsou lidé zasnoubeni nebo znuděni. Nebylo by skvělé získat tuto zpětnou vazbu v reálném čase, souhrnně, od okamžiku k okamžiku, kdy jdu? “

Hraje reklamu na Jibo, „sociálního robota“, který je k dispozici na předobjednávku na webu pro financování davu Indiegogo a který vyvinula bývalá kolegyně MIT Cynthia Breazeal. Vypadá něco jako high-tech lávová lampa, Jibo sedí na stole a prohledává své okolí, identifikuje jednotlivce podle tváře a komunikuje s nimi - předává zprávy, vydává připomenutí, provádí běžné telefonní hovory, dokonce i chatuje. Toto je další potenciální aplikace pro software společnosti Affectiva - společnosti vedou rozhovory - a je to „velmi vzrušující vyhlídka“, říká el Kaliouby.

Pro některé je vzrušující, ale vyhlídky robotů na zpracování emocí jsou pro ostatní alarmující. Sherry Turkleová, která již dlouho studovala, jak se lidé vztahují k počítačům, varuje ve své nové knize Rekultivace konverzace: The Power of Talk v digitálním věku, o „robotickém okamžiku“, kdy stroje začínají nahrazovat lidskou společnost. Turkle věří, že vědci jako el Kaliouby a její tým dokážou dělat to, co říkají. "Všichni jsou skvělí, nadaní lidé, kteří dělají skvělou práci, " říká. A souhlasí s tím, že v určitých kontextech - nebezpečných prostředích, jako je kosmický prostor nebo kolem těžkých strojů, ve kterých chcete zahrnout všechny možné způsoby komunikace - má hrát roli afektivní výpočetní technika. "Ale další krok, " říká, "vůbec nenásleduje." Dalším krokem je, pojďme se stát přítelem robota. Rozhovor jsem s rodiči, kteří jsou šťastní, že jejich děti mluví se Sirim, a myslím, že nás to nevede dolů po silnici, kam chceme jít. Vymezujeme se jako lidské bytosti, s nimiž se sdružujeme, a nedává mi smysl, abych vytvořil tvůj pocit sebeúcty ve vztahu ke stroji. Proč chcete, aby počítač věděl, jestli jste smutní? “

Dokonce i el Kaliouby má sklon souhlasit s tím, že „s našimi zařízeními trávíme více času, než bychom měli“, samozřejmě s ohledem na její nedospělou dceru, jejíž pohled se zamkne na obrazovce smartphonu.

Trend směřující k stále větší konektivitě však považuje za nevratný a domnívá se, že zatímco uživatelé by se měli vždy muset přihlásit, můžeme z toho také udělat to nejlepší. Předpovídá, že naše zařízení budou mít „emoční čip a sadu aplikací, které jej používají způsobem, který přidává dostatečnou hodnotu pro naše životy, která převažuje nad obavami lidí o sdílení těchto dat.“ Kreslí analogii k zařízením GPS: Afektivní výpočetní technika může pomozte nám navigovat emocionální prostor stejným způsobem, jak nám aplikace telefonu pomáhají obcházet se ve fyzickém prostoru. "Všichni se obávali zařízení pro snímání polohy, když poprvé vyšli také: Napadli naše soukromí, neustále nás sledovali, " říká. "Teprve teď bychom byli všichni ztraceni bez Map Google na našich telefonech." Myslím, že to bude stejné. “

**********

Úsměv, zamračení, grimasa a úšklebek - váš výraz obličeje je další hranicí ve velkých datech