VAŠE TWEETY MOHOU PŘEDVÍDAT, KDY DOSTANETE CHŘIPKU

V roce 1854 představil britský lékař John Snow v reakci na ničivou epidemii cholery, která probíhala Londýnem, revoluci v oblasti veřejného zdraví: epidemiologická mapa. Zaznamenáním případů cholery v různých čtvrtích města a jejich vykreslením do mapy založené na sídlech pacientů zjistil, že za velkou část infekcí je odpovědná jediná kontaminovaná vodní pumpa.

Mapa ho přesvědčila - a nakonec i orgány veřejné moci -, že teorie miasmatu nemoci (která tvrdila, že se choroby šíří škodlivými plyny) byla nepravdivá, a že teorie zárodků (která správně tvrdila, že mikroorganismy mají vinu) byla pravdivá. Umístili zámek na rukojeť pumpy odpovědné za ohnisko, signalizující posun paradigmatu, který trvale změnil způsob, jakým se zabýváme infekčními chorobami, a tím i sanitací.

Technologie mapování je zcela odlišná, stejně jako nemoc, ale existuje určitá podobnost mezi Snowovou mapou a novým projektem prováděným skupinou vědců pod vedením Henryho Kautze z University of Rochester. Vytvářením algoritmů, které dokážou zjistit chřipkové trendy a vytvářet předpovědi na základě klíčových slov ve veřejně dostupných geotagovaných tweety, zaujímají nový přístup ke studiu přenosu nemocí - ten, který by mohl změnit způsob studia a sledování pohybu nemocí ve společnosti .

"Můžeme myslet na lidi jako na senzory, které se dívají na svět kolem sebe a poté reportují, co vidí a zažívají na sociálních médiích, " vysvětluje Kautz. "To nám umožňuje provádět podrobná měření na stupnici populace a nevyžaduje aktivní účast uživatelů."

Jinými slovy, když jsme pípali, že nás právě přišel bolestivý kašel a horečka, nevědomky poskytujeme bohatá data pro obrovský experiment v oblasti veřejného zdraví, informace, které mohou vědci použít ke sledování pohybu nemocí, jako je chřipka ve vysokém rozlišení a v reálném čase.

Projekt Kautz, nazvaný SocialHealth, využil tweety a další druhy sociálních médií ke sledování řady otázek veřejného zdraví - nedávno začali používat tweety ke sledování případů otravy jídlem v restauracích New York City tím, že protokolovali všechny odeslané geotagované tweety z restaurace, které pak sledovaly jejich tweety po dobu dalších 72 hodin a kontrolovaly zmínky zvracení, průjem, bolesti břicha, horečku nebo zimnici. Tím odhalili 480 pravděpodobných případů otravy jídlem.

Ale jak se sezóna mění, je to jejich práce, která sleduje virus chřipky, který je nejvíc otevřený. Chřipkové trendy Google se podobně snažily pomocí vyhledávačů Google sledovat pohyb chřipky, ale model značně nadhodnocil loňské propuknutí, pravděpodobně proto, že mediální pokrytí chřipky přimělo lidi začít dělat dotazy týkající se chřipky. Twitter analýza představuje nový datový soubor s několika kvalitami - vyšším geografickým rozlišením a schopností zachytit pohyb uživatele v průběhu času - který by mohl přinést lepší předpovědi.

Při zahájení projektu sledování chřipky se vědci SocialHealth podívali konkrétně na New York a shromažďovali přibližně 16 milionů geotagovaných veřejných tweety měsíčně od 600 000 uživatelů po dobu tří měsíců. Níže je časová prodleva jednoho newyorského Twitteru, kdy různé barvy představují různé frekvence tweety v tomto místě (modrá a zelená znamenají méně tweetů, oranžová a červená znamenají více):

Aby využil všechna tato data, jeho tým vyvinul algoritmus, který určí, zda každý tweet představuje zprávu o příznakech chřipky. Dříve to ostatní vědci jednoduše dělali hledáním klíčových slov v tweety (například „nemocní“), ale jeho tým zjistil, že tento přístup vede k falešným pozitivům: Mnoho dalších uživatelů píší, že jsou domácí úkoly nemocní, než jsou cítit se špatně.

Abychom to vysvětlili, algoritmus jeho týmu hledá tři slova v řadě (namísto jednoho) a zvažuje, jak často daná posloupnost indikuje nemoc, na základě sady tweety, které ručně označily. Například věta „nemocná s chřipkou“ silně souvisí s nemocí, zatímco „nemocná a unavená“ je méně. Některá konkrétní slova - bolesti hlavy, horečka, kašel - jsou silně spojeny s nemocí, bez ohledu na to, jakou tříslovnou sekvenci jsou součástí.

Jakmile budou tyto miliony tweety zakódovány, mohli s nimi vědci udělat několik zajímavých věcí. Pro začátek se dívali na změny v chřipkách souvisejících s chřipkou v průběhu času a porovnávali je s hladinami chřipky, jak je uvádí CDC, čímž potvrdili, že tweety přesně zachytily celkový trend v míře chřipky. Na rozdíl od dat CDC je však k dispozici téměř v reálném čase, a ne za týden či dva.

Ale také šli hlouběji a zkoumali interakce mezi různými uživateli - jak je reprezentováno dvěma uživateli tweeting ze stejného místa (rozlišení GPS je asi polovina městského bloku) ve stejné hodině - modelovat, jak je pravděpodobné, že zdravý člověk onemocní poté, co přijde do kontaktu s někým s chřipkou. Je zřejmé, že dva lidé tweeting ze stejného bloku 40 minut od sebe nemusí nutně osobně setkat, ale šance, že se setkali, jsou mírně vyšší než dva náhodní uživatelé.

Výsledkem je, že když se podíváte na dostatečně velký datový soubor interakcí, objeví se obrázek přenosu. Zjistili, že pokud zdravý uživatel narazí na 40 dalších uživatelů, kteří se hlásí jako nemocní s příznaky chřipky, jeho šance na příznaky chřipky se příští den zvýší z méně než jednoho procenta na 20 procent. Při 60 interakcích se tento počet zvýší na 50 procent.

Tým také zkoumal interakce na samotném Twitteru, izoloval páry uživatelů, kteří se navzájem sledovali a nazývali je „přátelstvím“. Přestože mnoho vztahů na Twitteru existuje pouze na webu, některé odpovídají interakcím v reálném životě a zjistili, že uživatel kdo má deset přátel, kteří se hlásí jako nemocní, je o 28 procent vyšší pravděpodobnost, že se příští den onemocní. Celkově, s použitím obou těchto typů interakcí, jejich algoritmus dokázal předpovědět, zda by zdravý člověk onemocněl (a tweetoval o tom) s přesností 90 procent.

Jsme stále v raných stádiích tohoto výzkumu a existuje spousta omezení: Většina lidí stále neužívá Twitter (ano, opravdu), ai když ano, nemusí tweetovat o tom, že onemocní.

Pokud by se však tento druh systému mohl dále rozvíjet, je snadné si představit nejrůznější aplikace. Váš smartphone by vás mohl automaticky varovat, například pokud jste strávili příliš mnoho času na místech obsazených lidmi s chřipkou, což vás přimělo jít domů a přestat se dostat do cesty infekce. Obyvatelé celého města by mohli být dokonce varováni, kdyby byli na pokraji ohniska.

Navzdory 150 letům, které jsme odstranili z průlomu mapování nemocí Johna Snowa, je jasné, že stále existují aspekty informací o nemoci, kterým úplně nerozumíme. Nyní, stejně jako tehdy, by mapování dat mohlo pomoci poskytnout odpovědi.