Twiitit ympäri maailmaa, piirretty sijainnin mukaan osana uutta tutkimusta. Klikkaa suurentaaksesi. Kuva ensimmäisen maanantai / Leetaru et. ai.
On vaikea arvioida sitä, kuinka nopeasti ja perusteellisesti Twitter on vallannut maailman. Vain seitsemän vuotta sitten, vuonna 2006, se oli idea, joka luonnosteltiin paperityynylle. Nyt palvelua käyttää arviolta 554 miljoonaa käyttäjää - määrä, joka on lähes 8 prosenttia kaikista planeetan ihmisistä - ja lähetetty on arviolta 170 miljardia tweettiä, joiden lukumäärä nousee noin 58 miljoonalla päivässä. .
Kaikki nämä tweetit tarjoavat korvaamattoman lähde uutisia, viihdettä, keskustelua ja yhteyksiä ihmisten välillä. Mutta tutkijoille he ovat arvokkaita myös jonkin verran erilaisina: raakatiedot.
Koska Twitterissä on avoin sovellusliittymä (jonka avulla tweetit voidaan ladata raa'ana, analysoitavana datana) ja monille tweeteille on maantieteellinen merkintä, tutkijat voivat käyttää miljardeja näitä tweettejä ja analysoida niitä sijainnin mukaan oppiaksesi lisää ihmisten maantieteestä maapallolla. Viime syksynä osana globaalia Twitter Heartbeat -tapahtumaa Illinoisin yliopiston tiimi analysoi yli miljardin tweetin kieltä ja sijaintia kaikkialta Yhdysvalloista luodakseen hienostuneita karttoja asioista, kuten Sandy-hurrikaanin aikana ilmaistut positiiviset ja negatiiviset tunteet tai tuki Barackille. Obama tai Mitt Romney presidentinvaalien aikana.
Kuten Joshua Keating totesi ulkopolitiikan Ideasota-blogissa, saman ryhmän jäsenet, jota johtaa Kalev Leetaru, ovat äskettäin menneet askeleen pidemmälle. Kuten julkaistiin uudessa tutkimuksessa aiemmin tällä viikolla verkkolehdessä Ensimmäinen maanantai, he analysoivat 46 672 798 tweetin sijainnit ja kielet viime vuoden 23. lokakuuta ja 30. marraskuuta välisenä aikana luodakseen upea muotokuva ihmisen toiminnasta planeetan ympärillä, joka näytetään viestin yläosa. He käyttivät Twitter decahosea, tietovirtaa, joka kaappaa satunnaisesti 10 prosenttia kaikista tweeteistä maailmanlaajuisesti milloin tahansa (joka oli 1 535 929 521 ajanjaksona), ja keskittyivät yksinkertaisesti tweetteihin ja niihin liittyviin maantieteellisiin tietoihin.
Kuten tutkijat huomauttavat, tweettien maantieteellinen tiheys monilla alueilla - etenkin länsimaissa, joissa tietokoneita, mobiililaitteita ja Twitteriä käytetään kaikki huipputasolla - vastaa läheisesti sähköistys- ja valaisinkäyttöastetta. Tämän seurauksena tweettikartat (kuten alla oleva manner-Yhdysvaltain yksityiskohtakuva) näyttävät olevan paljon kuin keinotekoisen valon satelliittikuvat yöllä.
Klikkaa suurentaaksesi. Kuva ensimmäisen maanantai / Leetaru et. ai.
Kokeena nähdäkseen kuinka tweetit sopivat keinotekoisen valon käyttöön, he loivat alla olevan yhdistelmäkartan, jossa tweetit näkyvät punaisina pisteinä ja yövalot näkyvät sinisinä. Alueet, joissa ne vastaavat taajuutta (ja poistavat tosiasiallisesti toisistaan), näkyvät valkoisina, ja alueet, joissa toinen ylittää toisen, pysyvät punaisina tai sinisinä. Monet alueet näyttävät näyttävän melko valkoisilta, lukuun ottamatta joitain tärkeitä poikkeuksia: Iran ja Kiina, joissa Twitter on kielletty, ovat huomattavasti sinisiä, kun taas monet maat, joissa sähköistysaste on suhteellisen alhainen (mutta Twitter on edelleen suosittu), näkyvät punaisina.
Klikkaa suurentaaksesi. Kuva ensimmäisen maanantai / Leetaru et. ai.
Projekti muuttui entistä mielenkiintoisemmaksi, kun tutkijat käyttivät automaattista järjestelmää tweetsien jakamiseen kielen mukaan. Twitterissä yleisin kieli on englanti, jonka osuus kaikista twiitteistä on 38, 25 prosenttia. Sen jälkeen tulivat japanilaiset (11, 84 prosenttia), espanjalaiset (11, 37 prosenttia), indonesialaiset (8, 84 prosenttia), norjalaiset (7, 74 prosenttia) ja portugalilaiset (5, 58 prosenttia).
Ryhmä rakensi alla olevan kartan kaikista tweetsistä, jotka on kirjoitettu 26 suosituimmalla kielellä, ja jokainen niistä on erivärinen:
Klikkaa suurentaaksesi. Kuva ensimmäisen maanantai / Leetaru et. ai.
Vaikka useimpien maiden tweetit hallitsevat niiden virallisia kieliä, monien paljastetaan sisältävän tweetit useilla muilla kielillä. Katso tarkkaan tarkkaan, ja näet värien sateenkaaren hienovaraisesti esiin harmaista pisteistä (englantilaiset tweetit), jotka peittävät Yhdysvaltoja:
Klikkaa suurentaaksesi. Kuva ensimmäisen maanantai / Leetaru et. ai.
Muiden analyysien joukossa tutkimusryhmä tarkasteli jopa uudelleensuuntaamisen ja viittaamisen maantieteellistä tilannetta - käyttäjän ja käyttäjän uudelleentwiittaaman käyttäjän keskimääräinen etäisyys sekä käyttäjän ja käyttäjän, jota hän yksinkertaisesti viittaa twiitissä, välinen etäisyys. Keskimäärin etäisyys retweetistä oli 1 115 mailia ja 1, 118 viite. Mutta toisin kuin positiivisesti, tietyn käyttäjän uudelleentwiittaaman tai viittaamisen toiseen käyttäjään ja heidän etäisyytensä välillä oli positiivinen suhde: Käyttäjäparit, joilla on vain kourallinen vuorovaikutusta, olivat todennäköisemmin lähempänä toisiaan (500- 600 mailin päässä toisistaan) kuin niillä, joilla on kymmeniä uudelleentwiittauksia ja viitteitä niiden välillä.
Tämä osoittaa, että kaukana toisistaan asuvat käyttäjät käyttävät todennäköisemmin Twitteriä vuorovaikutukseen säännöllisesti. Yksi selitys voi olla, että eniten seuraajia - ja siten eniten viittauksia ja uudelleentwiittauksia - muodostavat useimmiten kuuluisuudet, organisaatiot tai yritykset, käyttäjät, jotka ihmiset tuntevat, mutta joilla ei todellisuudessa ole henkilökohtaista suhdetta. Alla on globaali käyttäjien välinen uudelleentwiittauskartta:
Klikkaa suurentaaksesi. Kuva ensimmäisen maanantai / Leetaru et. ai.
Artikkelissa tutkittiin vielä yksityiskohtaisemmin muita tweetteihin liittyviä tietoja: valtavirran uutisoinnin ja tweetsien lukumäärän suhde maassa (Eurooppa ja USA saavat suhteettoman paljon tiedotusvälineitä, kun taas Latinalainen Amerikka ja Indonesia jätetään huomioimatta), paikoissa, joissa Twitter on lisäsi viime aikoina eniten käyttäjiä (Lähi-itä ja Espanja) ja paikkoja, joissa käyttäjillä on keskimäärin eniten seuraajia (Etelä-Amerikka ja länsirannikko).
Kaikissa näissä tiedoissa on muutama huomautus. Yhden osalta, vaikka tweetit analysoivat kymmenien miljoonien lukumäärää, ne ovat silti vain 0, 3 prosenttia kaikista lähetetyistä tweeteistä, joten ne eivät välttämättä edusta kaikkia Twitter-malleja riittävästi, varsinkin jos geotunnisteiden mahdollistavat käyttäjät käyttäytyvät eri tavalla kuin muut. Lisäksi Twitterin nopeasti muuttuvassa maailmassa jotkut suuntaukset ovat saattaneet jo muuttua merkittävästi viime syksyn jälkeen. Mutta Twitterin kasvaessa ja datan saataessa lisää, on perusteltua, että tällainen analyysi tulee suosituksi vain demografien, tietotekijöiden ja muiden tutkijoiden keskuudessa.