Suuret tiedot ovat tulossa niin suuriksi, että ne liukastelevat Maan surkeita siteitä.
Orbital Insight -niminen startup, joka keräsi äskettäin lähes 9 miljoonaa dollaria rahoitusta, käyttää satelliittikuvia ja huipputekniikkatekniikoita maailman öljyylijäämän arvioimiseksi, satovajeiden ennustamiseen ennen sadonkorjuuaikaa ja vähittäiskaupan suuntausten seuraamiseen seuraamalla autojen määrää iso laatikko parkkipaikat. Ohjelmiston pitäisi myös olla mahdollista kouluttaa havaitsemaan laiton metsäkato varhaisessa vaiheessa ja seuraamaan paremmin ilmastonmuutosta.
Yhtiö käyttää koneoppimistekniikoita ja laskentaverkkoja, jotka matkivat ihmisen aivoja havaitakseen kuvioita valtavissa määrin visuaalista tietoa. Facebook käyttää samanlaisia tekniikoita tunnistaaksesi ladattujen kuvien kasvot ja tunnistaaksesi sinut ja ystäväsi automaattisesti. Kasvojen etsimisen sijaan Orbital Insight hyödyntää satelliittikuvien kasvavaa määrää pienten, edullisten satelliittien nousun ansiosta, ja opettaa verkkojaan tunnistamaan automaatiot, kuten ajoneuvot, Kiinan rakennusnopeuden ja kelluvien kansiöljysäiliöiden valetut varjot, jotka muuttuvat sen mukaan, kuinka täynnä ne ovat.
Ihmisten olisi tietysti mahdotonta seuloa säännöllisesti päivitettävien maailmanlaajuisten satelliittikuvien kautta. Orbital Insight pyrkii toimittamaan massiivisesti rinnakkaisia tietokoneita ja edistyneitä kuvontunnistustekniikoita toimittamaan tietotyyppejä, joita ei ole aiemmin ollut käytettävissä. Esimerkiksi nykyiset maailmanlaajuiset öljy-arviot ovat jo kuuden viikon ikäisiä, kun ne julkaistaan. Orbitalin avulla sadontuoton analyysi voitaisiin toimittaa kauden puolivälissä - tärkeitä tietoja siitä, olitpa korkean tason Yhdistyneiden Kansakuntien työntekijä, joka yrittää päästä eteenpäin ruokakriisistä, tai hyödykekauppias, joka työskentelee hedge-rahastossa.
Orbital Insight ei ole ollut kauan aikaa sitten - se perustettiin loppuvuodesta 2013, ja se tuli vasta viime vuoden lopulla “varkaustilasta”. Yrityksen perustajalla James Crawfordilla on kuitenkin paljon kokemusta yhteensopivista aloista. Entinen autonomian ja robotiikan päällikkö NASA: n Ames-tutkimuskeskuksessa hän vietti kaksi vuotta myös teknisenä johtajana Google Booksissa kääntämällä arkistoidut painetut sivut etsittäväksi tekstiksi.
Useat yritykset, kuten Spire ja Inmarsat ja jopa Teslan Elon Musk, työskentelevät laitteistoilla - suunnittelevat ja käynnistävät uusia satelliittiverkkoja -, mutta Crawfordin mukaan Orbital Insight keskittyy sen sijaan puhtaasti ohjelmistoihin.
"Joillakin tavoin näen, mitä teemme täällä tämän yrityksen vauhdissa", sanoo Crawford, "opiskelee paljon [Googlessa] siitä, kuinka tehdä suuria tietoja, kuinka soveltaa [tekoälyä], kuinka soveltaa koneoppimista näihin kuvateksteihin ja soveltaa sitä satelliittitilaan. ”
Crawfordin yritys voi olla yksi harvoista, jotka käyttävät nousevia ohjelmistotekniikoita, kuten keinotekoisia hermoverkkoja ja koneoppimista satelliitin jäsentämiseen. kuvastoa. Mutta hänen käyttämänsä tekniikka, joka tunnetaan myös nimellä syvä oppiminen, räjähtää teknologiatilassa tällä hetkellä. Vakiintuneet yritykset, kuten Facebook, Google ja Microsoft, käyttävät syvällisiä oppimistekniikoita esimerkiksi automaattiseen kuvan merkitsemiseen ja parannettuun puheentunnistukseen ja kääntämiseen. IBM osti äskettäin myös syväoppimisyhtiön, nimeltään AlchemyAPI, parantaakseen Watson-tietokonejärjestelmäänsä.
Syvällä oppimisella, tehokkaat tietokoneet ja useita kerroksia samanaikaisesti käynnissä olevaa kuvailutunnistusta (siis "syvä" syvässä oppimisessa) matkivat ihmisen aivojen hermoverkkoja. Tavoitteena on saada tietokone “oppimaan” tunnistamaan malleja tai suorittamaan tehtäviä, jotka olisivat liian monimutkaisia ja aikaa vieviä “opettaa” perinteisen ohjelmiston avulla.
Syvän oppimisen yksityiskohdat ovat teknisiä, mutta aivan perustasolla se on yllättävän yksinkertaista. Kun tarkastellaan vähittäismyyntisuuntausten mittaamista parkkipaikkaliiketoiminnalla, Crawford sanoo, että yrityksellä on ensin työntekijöitä, jotka merkitsevät autot manuaalisesti muutaman sadan parkkipaikalle punaisilla pisteillä. "Sitten syötät jokaisen auton neuroverkkoon, ja se yleistää valon ja pimeyden kuviot, auton pikseleiden kuviot", Crawford sanoo. "Ja kun [tietokone] tarkastelee uutta kuvaa, se, mitä se tekee, on pääosin melko hienostunut, mutta pohjimmiltaan silti kuvion vastaavuus."
Crawford arvioi vähittäiskaupan toimintaa arvioidessaan paljon paremmin, että ketjun menestys tapahtuu kansallisella tasolla mittaamalla, kuinka täydet pysäköintialueet ovat ajan myötä ja vertaamalla sitä, kuinka samat erät olivat aikaisempina vuosineljänneksinä vanhoja kuvia käyttämällä, kuin yksittäisen kaupan terveyden mittaaminen.
Hän myöntää, että monilla jälleenmyyjillä on jo tapoja seurata näitä tietoja omille myymälöilleen, mutta he tietäisivät mielellään, kuinka heidän kilpailijoillaan menee kuukausia ennen taloudellisten tulosten julkistamista. Sama pätee hedge-rahastoihin, jotka Crawfordin mukaan ovat yrityksen varhaisimpia asiakkaita. On helppo nähdä, kuinka tällainen tieto voisi antaa sijoittajille jalan ylös. Satelliittikuvat ovat jo saatavilla, ja Orbital Insight on juuri jäsentämässä niitä, joten on epätodennäköistä, että ne herättäisivät sisäpiirikauppoja.
Jos verkko tekee satunnaisen virheen, esimerkiksi sekoittaen auton kaatopaikan, se ei ole paljon ongelma, Crawford selittää, koska virheet yleensä poistavat toisiaan suuressa mittakaavassa. Öljyarviointien kaltaisissa asioissa, vaikka ne ovatkin useita prosenttiyksiköitä, on silti parempi kuin odottaa kuusi viikkoa konkreettisempia tietoja.
Vaikka käynnistyminen näyttää keskittyvän ensin tiedon tarjoamiseen markkinasijoittajille, yrityksen tekemä voitaisiin myös käyttää altruistisempaan käyttöön. "Olemme utelias tulevaisuudessa käyttämään tätä metsien hävittämisen havaitsemiseen ja sellaisten asioiden havaitsemiseen, kuten tienrakennus, jotka voivat olla metsien häviämisen edeltäjiä", Crawford sanoo. "On myös todella mielenkiintoisia asioita, joita voidaan tehdä ympäröimällä lumipakkauksia, vettä ja muita ilmastomuutoksen näkökohtia." Hänen mukaansa ne tutkivat myös kolmannen maailman maataloutta ja sanovat, että monispektriset kuvat ovat hyvä tapa kertoa kuinka terveet kasvit ovat, ennakoidakseen sadon epäonnistumisia.
Tietysti mikä tahansa suuren datan osa, joka sisältää myös satelliittikuvia, herättää tietosuojaongelmia. Mutta Orbital Insight ei ota valokuvia, he etsivät ja analysoivat jo saatavilla olevia kuvia. Ja kuten Crawford huomauttaa, Yhdysvaltojen nykyisissä kaupallisten kuvantamissatelliittien säännöksissä määrätään, että et voi olla alle 20 cm pikseliä kohti. Tuossa päätöslauselmassa tavallinen ihminen ilmestyisi muutamana pisteenä. Joten olisi vaikeaa erottaa yksittäisiä ihmisiä ollenkaan, puhumattakaan henkilön identiteetistä tai jopa sukupuolesta.
Crawford sanoo, että suuri osa syvän oppimisen tekniikoiden lyhytaikaisesta edistymisestä yleensä liittyy algoritmien (eli autojen tai maissipeltojen merkitsemisen vähemmän manuaaliseen merkitsemiseen) yksinkertaistamiseen ja automatisointiin, jotta yritykset voivat nopeammin soveltaa koneoppimista uusille alueille.
Erityisesti Orbital Insightin tulevaisuudesta yrityksen perustaja ei todellakaan puhu pieninä. Hän vetoaa siihen, mitä yritys tekee, luodakseen ”makroskoopin”, joka voisi vaikuttaa maailmaan samalla tavalla kuin mikroskooppi muutti biologian.
”Monet siitä, mitä näemme maapallolla, olivatpa sitten maissisatoa, metsien häviämistä tai öljyvarastoja, ovat niin suuria, että et voi nähdä niitä ihmisen silmällä, koska joudut käsittelemään miljoona kuvaa kerralla, Crawford sanoo. "Se muuttaa lopulta tavan, jolla katsomme maata, ajattelumme siitä ja ajattelemme sen hallintaa."