https://frosthead.com

Matematiikan avulla tutkitaan Iranin vaalituloksia

Tilastotieteilijät ja politologit ovat pitäneet kenttäpäivää aiemmin tässä kuussa pidettyjen Iranin vaalien tulosten kanssa. Oliko vaalit takila? Emme ehkä koskaan tiedä, mutta matematiikkaan on haudattu tarpeeksi, jotta me ajattelemme, että se olisi saattanut olla niin. Silloinkin on myös tarpeeksi saada meidät uskomaan, että kaikki on laillista. Tässä on muutama analyysi, joka piti erityisen mielenkiintoisena:

Puhtaat tiedot

Välittömästi vaalien jälkeen tietojen laillisuudesta herättiin epäilyksiä, koska joka kerta, kun uusi erä äänestystuloksia julkaistaan ​​(ne ilmestyvät palasina Iranissa, kuten Yhdysvalloissa), presidentti Mahmoud Ahmadinejadille annetuista äänistä oli sama: 67 prosenttia. Tiedot eivät yleensä ole puhtaita, ja jotkut alkoivat ihmetellä, oliko tulokset valmistettu.

Wisconsinin yliopiston matematiikan professori Jordan Ellenbergin Slatessa tekemä analyysi kuitenkin syventää tietoja osoittaakseen, että se oli todella sotkuisempaa kuin voidaan odottaa. Tulokset eivät tulleet ulos kaupungeittain, vaan suurina erinä, joissa yhdistettiin useiden alueiden tiedot, mikä tarkoitti, että Ahmadinejadin äänimäärä oli todella keskiarvo. Ja suurten numeroiden laki sanelee, kuten Ellenberg kirjoitti:

Erittäin vaihtelevien määrien keskiarvot voivat ja yleensä tuottaa tuloksia, jotka näyttävät melkein täysin yhdenmukaisilta. Koska tietoja on tarpeeksi, poikkeajat pyrkivät peruuttamaan toisensa.

Ellenberg päättelee, että tiedot ovat ”ehdottomasti sotkuisia ollakseen totta”.

Benfordin laki

Useissa analyyseissä on tarkasteltu Iranin vaalitulosten ensimmäisiä numeroita nähdäkseen, ovatko ne Benfordin lain mukaisia:

Monien (mutta ei kaikkien) tosielämän tietolähteiden numeroluetteloissa johtava numero on jaettu erityisellä, epäyhtenäisellä tavalla. Tämän lain mukaan ensimmäinen numero on 1 melkein kolmasosa ajasta, ja suurempia numeroita esiintyy johtavana numerona alemmalla ja alemmalla taajuudella pisteeseen, jossa 9 ensimmäisenä numerona esiintyy vähemmän kuin kerran kahdestakymmenestä. Tämä ensimmäisten numeroiden jakauma syntyy loogisesti aina, kun arvojoukko jaetaan logaritmisesti.

Yhdessä Puolan Nicolaus Copernicus -yliopiston Boudewijn Roukeman analyysissä, jossa tätä ottelua käytettiin, pääteltiin, että Mehdi Karroubin numerolla 7 alkavia äänimääriä oli melkein kaksi kertaa niin paljon kuin Benfordin lailla voitaisiin odottaa. Lisäksi Roukema epäili, että Ahmadinejadin tulokset, joissa oli vähemmän kuin yksi ja enemmän 2 ja 3 odotettua, olisivat olleet todennäköisiä, jos joku olisi päättänyt manipuloida tuloksia muuttamalla äänestyksen alussa 1: n kokonaismääräksi 2 ja 3s. Se olisi myös johtanut yliarvioimaan Ahmadinejadin kokonaismäärät miljoonalla äänellä.

Michiganin yliopiston politologi ja tilastotieteilijä Walter Mebane käytti analyysissään myös Benfordin lakia, jossa hän havaitsee myös useita väärinkäytöksiä Iranin vaalituloksissa. Mutta jopa hän myöntää, että vaikka hänen tuloksensa ovat "yhteensopivia laajalle levinneiden petosten kanssa", ne ovat myös "yhteensopivia Ahmadinejadin tosiasiallisen voiton kanssa".

Kaksi viimeistä numeroa

Kaksi Columbian yliopiston valtiotieteen jatko-opiskelijaa otti vielä kolmannen tutkimuksen. Analyysissä, jonka he tekivät yhteenvedon Washington Postin op-toimituksessa, he tutkivat 29 provinssin äänimäärien kaksi viimeistä numeroa jokaisesta neljästä ehdokkaasta (esimerkiksi jos joku sai 14 579 ääntä, vain 7 ja 9 otettiin huomioon analyysi).

Vaalitulosten kaksi viimeistä numeroa ovat satunnaista kohinaa, ja numeroiden jakautumisen tulisi olla melko tasaista - kunkin numeron tulisi näkyä noin 10 prosenttia ajasta. Ihmiset ovat kuitenkin huonoja satunnaislukugeneraattoreita, ja kun muodostamme lukuja, meillä on tapana valita joitain numeroita useammin kuin toisia. Iranin tuloksissa vain 4 prosenttia numeroista päättyy numeroon 5, kun taas numero 7 näyttää 17 prosenttia ajasta. Tuloksia, jotka poikkeavat paljon, odotetaan tapahtuvan noin neljässä jokaisesta 100 vaalista.

Ihmisillä on myös ongelmia sellaisten numeroiden luomisessa, joissa ei ole vierekkäisiä numeroita (ts. Olet todennäköisesti keksimässä 72 kuin 23), mutta näiden lukujen tulisi myös noudattaa satunnaismalleja ja noin 70 prosenttia parista tulisi muodostua ei-vierekkäisistä numeroa. Iranin tuloksissa vain 62 prosenttia tekee niin. Näitä tuloksia odotetaan jälleen noin neljässä jokaisesta 100 vaalista. Mutta näiden kahden tuloksen yhdistelmää odotetaan vain yhdestä jokaisesta 200 vaalista. Ehkä mahdotonta, mutta ei mahdotonta.

Mihin se jättää meidät? Emme voi koskaan tietää, ovatko ilmoitetut tulokset todellisia vai eivät. Henkilökohtainen suosikki vähän tietoja kaikesta tästä ei kuitenkaan vaadi laskelmia, jotka johtavat vaalien legitiimiyttä koskeviin kysymyksiin. Tämä Iranin vartijaneuvoston edustajan Abbas-Ali Kadkhodaein tarjous sai lähes ketään ajattelemaan kahdesti:

Mohsen Resaein toimittamat tilastot, joissa hänen mukaansa yli 100% tukikelpoisista on äänestäneet 170 kaupungissa, eivät ole tarkkoja - tapahtuma on tapahtunut vain 50 kaupungissa.

(Lisätietoja Iranin vaalitulosanalyyseistä saat Nate Silver-sivustosta osoitteessa fivethirtyeight.com)

Matematiikan avulla tutkitaan Iranin vaalituloksia