https://frosthead.com

Svět podle Twitteru v Mapách

Tweety z celého světa, vykreslené podle místa jako součást nové studie. Klikni pro zvětšení. Obrázek přes první pondělí / Leetaru et. al.

Je těžké ocenit, jak rychle a důkladně Twitter převzal svět. Před sedmi lety, v roce 2006, to byl nápad načrtnutý na papíře. Nyní tuto službu využívá odhadem 554 milionů uživatelů - počet, který představuje téměř 8 procent všech lidí na planetě - a bylo posláno odhadem 170 miliard tweetů, přičemž tento počet stoupá každý den zhruba o 58 milionů. .

Všechny tyto tweety poskytují neocenitelný zdroj zpráv, zábavy, konverzace a spojení mezi lidmi. Ale pro vědce jsou také cenné jako něco docela jiného: surová data.

Protože Twitter obsahuje otevřené API (které umožňuje stahovat tweety jako surová, analyzovatelná data) a mnoho tweetů je geotagovaných, mohou vědci použít miliardy těchto tweetů a analyzovat je podle umístění, aby se dozvěděli více o geografii lidí na celé planetě. Loni na podzim, v rámci Global Twitter Heartbeat, University of Illinois tým analyzoval jazyk a umístění více než miliardy tweety z celé USA, aby vytvořil sofistikované mapy věcí, jako jsou pozitivní a negativní emoce vyjádřené během hurikánu Sandy, nebo podpora pro Baracka Obama nebo Mitt Romney během prezidentských voleb.

Jak poznamenal Joshua Keating na blogu o zahraniční politice War of Ideas, členové téže skupiny vedené Kalevem Leetaru nedávno šli o krok dále. Jak bylo publikováno v nové studii začátkem tohoto týdne v internetovém časopise First Monday, analyzovali umístění a jazyky 46 672 798 tweetů zveřejněných mezi 23. říjnem a 30. listopadem minulého roku, aby vytvořili ohromující portrét lidské činnosti kolem planety, zobrazený na horní část příspěvku. Využili rozpadu Twitteru, datového proudu, který zachycuje náhodně 10 procent všech tweetů po celém světě v kterémkoli daném čase (které v daném časovém období činilo 1 535 929 521), a jednoduše se zaměřily na tweety s přidruženými geografickými daty.

Jak vědci poznamenávají, geografická hustota tweetů v mnoha regionech - zejména v západním světě, kde jsou počítače, mobilní zařízení a Twitter používány na nejvyšší úrovni - úzce odpovídá míře elektrifikace a použití osvětlení. Výsledkem je, že mapy tweetů (jako je detailní pohled na kontinentální USA, níže) vypadají v noci podobně jako satelitní snímky umělého světla.

Klikni pro zvětšení. Obrázek přes první pondělí / Leetaru et. al.

Jako test, jak dobře sladili použití umělého světla s tweety, vytvořili níže kompozitní mapu, ve které se tweety zobrazují jako červené tečky a noční osvětlení se zobrazuje jako modré. Oblasti, ve kterých odpovídají frekvencí (a ve skutečnosti se navzájem ruší), jsou zobrazeny jako bílé a oblasti, kde jeden převáží nad druhým, zůstávají červené nebo modré. Mnoho oblastí nakonec vypadá docela bíle, až na některé klíčové výjimky: Írán a Čína, kde je Twitter zakázán, jsou znatelně modré, zatímco mnoho zemí s relativně nízkou mírou elektrifikace (ale kde je Twitter stále populární) se jeví jako červené.

Klikni pro zvětšení. Obrázek přes první pondělí / Leetaru et. al.

Projekt byl ještě zajímavější, když vědci použili automatizovaný systém k rozdělení tweety podle jazyka. Nejběžnějším jazykem na Twitteru je angličtina, která je zastoupena v 38, 25 procentech všech Tweetů. Poté přišli Japonci (11, 84 procenta), Španělština (11, 37 procenta), Indonéština (8, 84 procenta), Norština (7, 74 procenta) a Portugalci (5, 58 procenta).

Tým vytvořil mapu všech tweetů napsaných v 26 nejoblíbenějších jazycích, přičemž každý z nich je znázorněn jinou barvou:

Klikni pro zvětšení. Obrázek přes první pondělí / Leetaru et. al.

Zatímco tweety většiny zemí ovládají jejich oficiální jazyky, mnoho z nich obsahuje tweety v různých jiných jazycích. Podívejte se dostatečně pozorně a ze šedých teček (anglické tweety), které přikrývají USA, uvidíte duhovou barvu jemně vystupující:

Klikni pro zvětšení. Obrázek přes první pondělí / Leetaru et. al.

Výzkumný tým se mimo jiné zabýval také geografií retweeting a referencí - průměrnou vzdáleností mezi uživatelem a někým, kdo retweets, a také průměrnou vzdáleností mezi tímto uživatelem a někým, koho jednoduše odkazuje v tweetu. V průměru byla vzdálenost pro retweet 1, 115 mil a 1 118 pro referenci. Naproti tomu existuje pozitivní vztah mezi počtem případů, kdy daný uživatel přesměroval nebo odkazoval na jiného uživatele, a jejich vzdáleností: Dvojice uživatelů s pouze hrstkou interakcí byly celkově s větší pravděpodobností bližší k sobě (500 - 600 mil od sebe) než ty s desítkami zpráv a odkazů mezi nimi.

To znamená, že uživatelé, kteří žijí daleko od sebe, častěji používají Twitter k pravidelné komunikaci. Jedním vysvětlením by mohlo být, že subjekty s nejvíce následovníky - a tedy nejvíce odkazy a retweety - jsou často celebrity, organizace nebo korporace, uživatelé, se kterými jsou lidé obeznámeni, ale ve skutečnosti s nimi nemají osobní vztah. Globální mapa zpráv mezi uživateli je níže:

Klikni pro zvětšení. Obrázek přes první pondělí / Leetaru et. al.

Příspěvek se podrobněji zaměřil na další údaje související s tweety: poměr mezi běžným zpravodajstvím a počtem tweetů v zemi (Evropa a USA mají nepřiměřené mediální pokrytí, zatímco Latinská Amerika a Indonésie jsou přehlíženy), místa, která má Twitter přidali nejvíce uživatelů v poslední době (Střední východ a Španělsko) a místa, kde uživatelé mají v průměru nejvíce sledovatelů (Jižní Amerika a západní pobřeží).

Pro všechna tato data existuje několik upozornění. Pro jednoho, ačkoli analyzované tweety byly v desítkách milionů, stále jsou to jen 0, 3 procenta všech odeslaných tweetů, takže nemusí adekvátně reprezentovat všechny vzory Twitteru, zejména pokud se uživatelé, kteří umožňují geotagování, chovají jinak než ostatní. Navíc v rychle se měnícím světě Twitteru se některé trendy mohly od minulého podzimu výrazně změnit. Ale s tím, jak Twitter stále roste a jak bude více dat k dispozici, je logické, že tento druh analýzy se stane populárnější pouze pro demografy, počítačové vědce a další výzkumníky.

Svět podle Twitteru v Mapách