https://frosthead.com

Velká data nebo příliš mnoho informací?

Všichni víme, že v našich světech je mnohem více informací, než tomu bylo dříve. Pokud jde o to, o co víc, většina z nás je docela bezradná.

Související obsah

  • Infografika v průběhu věků Zdůrazněte vizuální krásu vědy
  • Proč chřipkové trendy Google nemohou chřipku sledovat (zatím)

Tady je neocenitelná nugeta o všech těch informacích, komplimenty Dave Tureka, chlapa zodpovědného za vývoj superpočítačů v IBM: Od roku 2003 a zpětně na začátek lidské historie jsme vygenerovali podle výpočtů IBM pět exabytů - to je pět miliard gigabajtů informací. V loňském roce jsme vypouštěli tolik dat každé dva dny. Do příštího roku předpovídá Turek, budeme to dělat každých 10 minut.

Jak je to možné? Jak se z dat stala taková digitální kudzu? Jednoduše řečeno, pokaždé, když váš mobilní telefon rozešle své GPS umístění, pokaždé, když něco koupíte online, pokaždé, když kliknete na tlačítko Like na Facebooku, vkládáte do láhve další digitální zprávu. A teď jsou s nimi oceány skoro pokryty.

A to je jen část příběhu. Textové zprávy, záznamy zákazníků, transakce ATM, obrázky z bezpečnostních kamer… seznam pokračuje a dále. Buzzword, které to popisuje, je „Big Data“, i když to jen těžko odpovídá spravedlnosti velikosti monstra, kterou jsme vytvořili.

Je to nejnovější příklad technologie, která vyzařuje naši schopnost ji používat. V tomto případě jsme nezačali dohánět naši schopnost shromažďovat informace, a proto je v současné době oblíbeným tropem manažerských vědců to, že budoucnost patří společnostem a vládám, které dokážou pochopit všechna data, která jsou sbírání, nejlépe v reálném čase.

Podniky, které dokážou interpretovat každou digitální strouhanku, kterou zákazníci zanechávají, budou mít výhodu, myšlení jde nejen to, kdo si koupil, kde v minulé hodině, ale zda se o to tweetli nebo zveřejnili fotku někde ve víru sociálních sítí. Totéž platí pro města, která mohou shromažďovat data z tisíců senzorů, které nyní dotýkají městskou krajinu a proměňují mlhy městského života, jako je například dopravní tok, na vědu.

Není překvapivé, že politické kampaně již berou ponořená, zuřivě těžební data jako součást svého zaměření na „nanotargeting“ voliče, aby věděli přesně, jak je posadit za své hlasy a peníze. Mezi závěry, které podle analytiků New York Times Thomas Edsall vyvodili analytici, je to, že republikáni preferují restaurace „The Office“ a Cracker Barrel, zatímco demokraté budou s větší pravděpodobností sledovat „Late Night With David Letterman“ a jíst v Chuck E Sýr.

Tento spěch k interpretaci digitálního flotsamu vysvětluje, proč Google minulý týden oznámil, že začne prodávat produkt, který nazývá BigQuery, software, který dokáže skenovat terabajty informací během několika sekund. A proč startup s názvem Splunk, který má technologii, která dokáže analyzovat obrovské množství údajů o zákaznících a transakcích, viděl, jak se hodnota jeho akcií prudce zvýšila o 90 procent v den, kdy byla zveřejněna minulý měsíc. To pro společnost, která loni ztratila 11 milionů dolarů.

Vzestup datového vědce

Ale ani přístup k nejlepším nástrojům pro dešifrování dat není zárukou velké moudrosti. Jen velmi málo společností má lidi, kteří mají školení nejen pro vyhodnocení horských dat - včetně spousty nestrukturovaných útržků z milionů stránek na Facebooku a chytrých telefonů -, ale také s tím skutečně něco dělají.

V loňském roce vydala společnost McKinsey Global Insitute zprávu popisující „Big Data“ jako „další hranici inovací“, ale také předpovídá, že do roku 2018 budou mít společnosti v USA vážný nedostatek talentu, pokud jde o nezbytné analytické dovednosti - tolik 190 000 lidí. A tvrdí, že dalších 1, 5 milionu manažerů bude třeba vyškolit, aby činili strategická rozhodnutí s proudem dat přicházejících na jejich cestu.

Ne každý je však věřící v kouzlo Big Data. Peter Fader, profesor marketingu na Penn's Wharton School of Business, není přesvědčen, že více dat je lepší. Ne že by si myslel, že by se společnost neměla snažit naučit co nejvíce o svých zákaznících. Je to jen to, že se nyní tolik soustředí na agregaci všech bitů dat, že si myslí, že objem je oceněn skutečnou analýzou.

Tady je Faderův pohled z nedávného rozhovoru s technologickou revizí společnosti MIT : „I s nekonečnou znalostí minulého chování často nebudeme mít dostatek informací, abychom mohli smysluplně předpovídat budoucnost. Ve skutečnosti, čím více údajů máme, tím více falešné důvěry budeme mít ... Důležitou součástí je pochopit, jaké jsou naše limity, a použít nejlepší možnou vědu k vyplnění mezer. Všechna data na světě nikdy nedosáhnou tohoto cíle pro nás. “

Kdo jsou tvá data?

Zde je ukázka toho, jak se velká data používají k řešení velkých problémů:

  • Vědí, kdy byli špatní nebo dobří: Zatímco většina společností se zaměřuje na analýzu svých zákazníků, Amazon získává body pomocí Big Data, aby jim pomohl.
  • Studie hřebců: Chcete vědět, kteří býci plodí nejproduktivnější mléčné krávy? Mlékárenský průmysl vymyslel způsob, jak tyto počty rozdrtit.
  • Diagnóza podle dat: Vědci ze společnosti SUNY Buffalo analyzují obrovské soubory dat ve snaze zjistit, zda existuje souvislost mezi roztroušenou sklerózou a faktory prostředí, jako je nedostatečné vystavení slunečnímu světlu.
  • Hledání potíží: Společnost s názvem Recorded Future je těžba informací ze sociálních sítí a vládních a finančních stránek, aby mohla předpovědět, jak by růst populace, nedostatek vody a extrémní počasí mohly vést k budoucím politickým nepokojům a terorismu.

Video bonus: Zachytávání dat je jedna věc. To, aby to vypadalo přitažlivě a srozumitelně, je další výzva. David McCandless voskuje o síle „informačních map“ v této přednášce TED.

Velká data nebo příliš mnoho informací?