https://frosthead.com

Kuinka tietokoneohjelma voi oppia kaiken sinusta vain Facebook-suosikkeistasi

Kertoimet ovat, kun päätit “pitää” televisio-ohjelmasta, bändistä, paikallisesta yrityksestä tai tuotteesta Facebook-sivulla, et usko, että napsautuksella olisi paljon seurauksia. Se saattaa näyttää ystävillesi hieman kiinnostuksestasi ja saattaa joskus saada sivun tilapäivityksiä näkymään uutissyötteessäsi.

Tykkäykset ovat kuitenkin julkisesti kaikkien nähtävissä Facebookissa, jopa ihmisille, joita et ole hyväksynyt ystäväksi. Ja uudelle tutkimukselle, joka tänään julkaistaan Kansallisen tiedeakatemian julkaisussa Proceedings of the National Academy of Sciences, ryhmä tutkijoita loi tietokoneohjelman, joka pystyy ottamaan käyttäjän "tykkäämisensä" ja päättämään tarkasti valtavan määrän tietoja hänestä - mukaan lukien ikä, etnisyys, IQ, poliittiset taipumat, huumeiden käytön taso ja jopa seksuaalinen suuntautuminen.

Tutkimusta varten tutkimusryhmä - Cambridgen yliopiston Psychometrics Labin ja Microsoft Research Cambridge -yhteistyön välinen kumppanuus - analysoi 58 000 amerikkalaisen Facebook-käyttäjän tietoja, jotka olivat päättäneet toimittaa profiilinsa ja tykkään analysoitavaksi Facebookin myPersonality-sovelluksen kautta. Tutkijat syötivät nämä "tykkäämiset" algoritmiin, joka on rakennettu erityisesti tätä hanketta varten, ja vertasivat sitten mallin ennusteita monista ominaisuuksista siihen, mitä he tiesivät tietyistä käyttäjistä, jotka olivat lähettäneet Facebook-profiiliensa sisällön analysoitavaksi yhtä hyvin.

Jokaisesta tutkitusta ominaisuusparista - esimerkiksi valkoihoinen, afroamerikkalainen, demokraatti tai republikaani - tutkijat valitsivat parin käyttäjiä, joista yksi kuului jokaiseen luokkaan, ja algoritmin oli sokeasti valittava, mikä käyttäjä sopii mihin luokkaan pelkästään perustuen heidän ”tykkäämisensä”. Se ei ollut sataprosenttisesti täydellinen päätellen mitään luokkaa, mutta se oli epämääräisesti tarkka ennakoida monia, mukaan lukien joitain ominaisuuksia, joita et todennäköisesti oletettaisi olevan, voidaan arvata “tykkäämissi” perusteella.

Se päätteli oikein esimerkiksi, mikä käyttäjä oli valkoihoinen ja afrikkalainen amerikkalainen 95 prosenttia ajasta, demokraatti ja republikaani 88 prosenttia ajasta ja kristitty ja muslimi 82 prosenttia ajasta. Sen tarkkuuden erittely monien tarkasteltujen piirteiden ennustamisessa (muistutuksena, arvo 1 tarkoittaa, että malli on sataprosenttisesti tarkka) on alla.

Malli ennusti käyttäjän ominaisuuksia vaihtelemattomalla tarkkuudella. Malli ennusti käyttäjän ominaisuuksia vaihtelemattomalla tarkkuudella. (Kuva PNAS / Kosinskin ym. Kautta)

Suurimmalle osalle käyttäjistä tämä tarkkuustaso ei riippunut ilmeisistä "tykkäämisistä", jotka voisivat linkittää tarkasteltuun ominaisuuteen. Esimerkiksi vähemmän kuin 5 prosenttia homoiksi tunnistetuista käyttäjistä oli ”pitänyt” homo-avioliitosta tai muista asiaan liittyvistä sivuista.

Sen sijaan algoritmi yhdisti tonneja näennäisesti toisiinsa liittymättömiä "tykkää" ryhmitellä käyttäjät luokkiin, joilla oli ennustettavissa olevat yhtäläisyydet. Vertaamalla tykkäämisiä persoonallisuustestin tuloksiin (jotka ovat myös osa myPersonality-sovellusta) tutkijat havaitsivat, että käyttäjät, jotka "pitävät" "ukkosta", "Colbertin raportista", "tiede" tai "curly fries", ovat kaikki hieman todennäköisemmin korkea IQ kuin niillä, jotka eivät. Samoin mieskäyttäjät, jotka “pitivät” “Mac Cosmetics” tai “Wicked The Musical”, olivat hieman todennäköisemmin homoja, kun taas “Wu-Tang Clan” tai “Shaq” pitävät miehet olivat hieman vähemmän todennäköisiä.

Käyttäjän kaikkien tykkäysten analysointi mahdollisti algoritmin luoda kokonaismuotokuvan heistä, mutta sen tarkkuuteen vaikutti voimakkaasti käyttäjän tykkäysten lukumäärä. Niille, jotka olivat alhaisessa asemassa, 1–10 tykkäystä, ennusteet eivät olleet parempia kuin mahdollisuus, mutta niille, joilla oli 150–300 tykkäystä, algoritmi pystyi parantamaan kykyään arvata käyttäjien piirteitä entistä paremmin. .

Tutkijat suorittivat ensisijaisesti tutkimuksen osoittaakseen, kuinka paljon julkisesti saatavilla oleva tieto voi kertoa meistä. Et ehkä julkaise seksuaalista suuntautumistasi, poliittisia näkemyksiäsi tai käytätkö huumeita, mutta tällainen ohjelma voi analysoida tykkääsi ja tehdä melko tarkkoja arvauksia riippumatta.

Vaikka käyttäjät olivat lähettäneet tykkäämisensä ja profiilinsa analysoitavaksi kolmannen osapuolen sovelluksen kautta, Facebookin oletusasetusasetukset tarkoittavat, että tykkäämiset ovat julkisia kaikille. Jo Facebookin omat algoritmit käyttävät näitä tykkäyksiä sanelemaan, mitä tarinoita loppuu käyttäjien uutissyötteisiin, ja mainostajat voivat käyttää niitä selvittääkseen, mitkä ovat tehokkaimpia mainoksia, joita voit näyttää selatessasi.

Kuinka tietokoneohjelma voi oppia kaiken sinusta vain Facebook-suosikkeistasi