https://frosthead.com

Použití matematiky k prozkoumání výsledků íránských voleb

Statistici a politologové vedli terénní den s výsledky z íránských voleb začátkem tohoto měsíce. Byly volby zmanipulovány? Možná to nikdy nebudeme vědět, ale v matematice je dost pohřbených, abychom si mysleli, že by to tak mohlo být. I tehdy je však dost, abychom si mysleli, že vše je legitimní. Zde je několik analýz, které mi připadají obzvláště zajímavé:

Čistá data

Bezprostředně po volbách byly vzneseny pochybnosti o legitimitě údajů, protože pokaždé, když byla zveřejněna nová série výsledků hlasování (vyjdou po částech v Íránu, podobně jako ve Spojených státech), procento hlasů jde prezidentovi Mahmúdovi Ahmadínedžádovi bylo to samé: 67 procent. Data obvykle nejsou čistá a někteří se začali ptát, zda byly výsledky zpracovány.

Analýza matematické profesorky University of Wisconsin Jordan Ellenberg ve Slate se však ponoří hlouběji do údajů, aby ukázala, že to bylo ve skutečnosti poselejší, než by se dalo očekávat. Výsledky nevycházely z města na město, ale ve velkých dávkách kombinovaly údaje z několika oblastí, což znamenalo, že Ahmadínežádovy hlasovací hlasy byly opravdu průměry. A zákon velkých čísel diktuje, jak Ellenberg psal:

Průměry nejrůznějších veličin mohou a obvykle přinášejí výsledky, které vypadají téměř dokonale jednotně. Vzhledem k dostatečnému množství údajů mají odlehlí lidé tendenci se navzájem rušit.

Ellenberg dochází k závěru, že data jsou „určitě dost chaotická, aby to byla pravda.“

Benfordův zákon

Několik analýz se zaměřilo na první číslice výsledků íránských voleb, aby zjistily, zda jsou v souladu s Benfordovým zákonem, který je:

V seznamech čísel z mnoha (ale ne všech) zdrojů dat v reálném životě je vedoucí číslice distribuována specifickým, nejednotným způsobem. Podle tohoto zákona je první číslice 1 téměř jedna třetina času a větší číslice se vyskytují jako vedoucí číslice s nižší a nižší frekvencí, do bodu, kdy 9 jako první číslice se vyskytuje méně než jednou za dvacet. Toto rozdělení prvních číslic vzniká logicky, kdykoli je logaritmicky distribuována sada hodnot.

Jedna analýza používající tento směr, Boudewijn Roukema z Univerzity Nicolaus Copernicus v Polsku, dospěla k závěru, že bylo téměř dvakrát tolik hlasů, počínaje číslicí 7 pro Mehdi Karroubi, než by se očekávalo u Benfordova zákona. Kromě toho Roukema měl podezření, že výsledky pro Ahmadínedžáda, ve kterých bylo méně 1s a více 2s a 3s, než se očekávalo, by byly pravděpodobné, kdyby se někdo rozhodl manipulovat s výsledky změnou 1s na začátku hlasování celkem na 2s a 3s. To by také vedlo k přeceňování Ahmadínedžádových součtů několika miliony hlasů.

Walter Mebane, politolog a statistik na Michiganské univerzitě, ve své analýze použil také Benfordův zákon, ve kterém také zjistil několik nepravidelností ve výsledcích íránských voleb. Ale i on připouští, že ačkoli jeho výsledky jsou „slučitelné s rozšířeným podvodem“, jsou také „kompatibilní s tím, že Ahmadínedžád skutečně vyhrál“.

Poslední dvě číslice

Dva postgraduální studenti politologie na Columbia University vzali data ještě třetí. V analýze, kterou shrnuli ve Washington Post op-ed, prozkoumali poslední dvě číslice počtu hlasů od 29 provincií pro každého ze čtyř kandidátů (např. Pokud někdo obdržel 14 579 hlasů, pouze 7 a 9 bylo zvažováno v analýza).

Poslední dvě číslice ve výsledcích voleb jsou náhodný šum a rozložení číslic by mělo být rovnoměrné - každá číslice by se měla objevit kolem 10 procent času. Lidé jsou však chudí generátoři náhodných čísel a když vytváříme čísla, máme sklon vybírat některá čísla častěji než jiná. Ve výsledcích Iránu končí pouze číslice 5 číslem 5, zatímco číslice 7 se objevuje 17 procent času. Výsledky, které se tolik odchylují, by se daly očekávat přibližně ve čtyřech ze 100 voleb.

Lidé mají také problémy s vytvářením čísel, která mají nesousední číslice (tj. Je méně pravděpodobné, že přijdete s 72 než s 23), ale tato čísla by také měla odpovídat náhodným vzorům a asi 70 procent párů by mělo sestávat z nesousedících číslice. Ve výsledcích z Íránu to však činí pouze 62 procent. Tyto výsledky by se opět daly očekávat přibližně ve 4 z každých 100 voleb. Kombinace těchto dvou výsledků by se však očekávala pouze v 1 z každých 200 voleb. Pravděpodobně, ale ne nemožné, nepravděpodobné.

Kde nás to nechává? Možná nikdy nebudeme vědět, zda jsou hlášené výsledky skutečné nebo ne. Můj osobní oblíbený kousek dat z toho všeho však nevyžaduje žádné výpočty, které by vedly k otázkám volební legitimity. Tato citace od Abbase-Aliho Kadkhodaeiho, mluvčího íránské rady strážců, by přiměla téměř každého, aby si dvakrát rozmyslel:

Statistiky poskytnuté Mohsenem Resaei, v nichž tvrdí, že více než 100% oprávněných osob odevzdalo svůj hlasovací lístek ve 170 městech, nejsou přesné - k incidentu došlo pouze v 50 městech.

(Další informace o analýzách výsledků íránských voleb naleznete v dokumentu Nate Silver na adrese fivethirtyeight.com)

Použití matematiky k prozkoumání výsledků íránských voleb