https://frosthead.com

Ohjelmisto luo yhden kuvan, joka kertoo kaiken

Joka päivä käyttäjät lataavat yli 350 miljoonaa kuvaa Facebookiin. Tämä kuvien lisäys on saanut analyytikot arvioimaan, että 10 prosenttia maailman 3, 5 triljoonasta valokuvasta on otettu viime vuonna. Kaikki tämä Web-tulviva tieto tarkoittaa, että jos etsit tiettyä kuvaa tai objektia - esimerkiksi miltä oranssi harppu kissa näyttää -, olet positiivisesti tulvinut hakutuloksille.

Viime kuussa Berkeleyn Kalifornian yliopiston tutkijat julkistivat uuden ohjelmiston, AverageExplorerin, jonka avulla käyttäjät voivat nähdä ”keskimääräisen” kuvan, joka edustaa etsimäänsä. Tuhan sanan arvoisen kuvan sijaan se on tuhannen tai enemmän kuvan arvoinen.

"Kun kirjoitat Google-kuvahakuun, selaat sivuja ja kuvasivuja", selittää UC Berkeleyn jatko-opiskelija ja pääkirjailija Jun-Yan Zhu, joka esiteltiin tämän vuoden kansainvälisessä tietokonegrafiikan konferenssissa ja näyttelyssä. ja interaktiiviset tekniikat Vancouverissa. ”Se on valtava ja vaikea tiivistää; et saa käsitystä siitä, mitä tapahtuu. ”

Alkuperäiseksi tarjoukseksi Zhu ja hänen tiiminsä keräsivät valokuvia Flickrin, Googlen ja Bingin kuvahakujen kautta. Ohjelmisto on riittävän vähän virtaa, jotta sitä voidaan käyttää keskimääräisellä työpöydällä, ja se voi romahtaa noin 10 000 kuvaa samanaikaisesti.

Käyttäjät tarkentavat hakuaan parilla eri tavalla. He voivat piirtää ja värittää muotoa, joka on samanlainen kuin Adobe Photoshopissa tai Illustratorissa piirretty, terävöittää keskimääräistä kuvan tulosta. Esimerkiksi Eiffel-tornin keskimääräisen kuvan taustan väritys valitsee itsestään keskimääräisen kuvan vetääksesi vain yöllä otettuja kuvia. Tai voit piirtää kulmaviivoja perhosen suunnan hallitsemiseksi komposiitissa.

Huokausten silta, päivästä iltaan Tarkentamalla VäriExplorer-kuvan Hiusten silta -väreissä voit vaihtaa kohtauksen päivästä hämärään yöhön. (Kohteliaisuus UC Berkeley)

Kun keskimääräinen kuva on luotu, prosessi, joka voi viedä jopa minuutin, käyttäjät voivat tarkentaa tulosta edelleen käyttämällä ryhmää Explorer-tilaan kutsuttamaa. Tässä tilassa napsauttamalla tiettyä kuvan osaa - esimerkiksi kissan nenää - paljastaa muita paikan yleisiä vaihtoehtoja tai tarkennuksia - ehkä siniset tai mustat nenät tai ne, jotka on pyöristetty kulman sijasta. Esimerkiksi esittelyvideossa joukkue tarkensi kuvaa joulupukin sylissä olevista lapsista valitsemalla vain sellaisille kuville, joissa joulupukilla on yksi lapsi jokaisessa käsivarressa.

Missä järjestelmästä tulee erityisen tehokas, Zhu sanoo, että se on työkalu tietokoneenäköalgoritmien kouluttamiseen, kuten Google Gogglesin tai Amazon Firefly -sovellusten käyttämät, ja jotka pystyvät tunnistamaan, mitä kamera osoittaa. "Tietokonenäköalalla ihmiset käyttävät paljon rahaa esineiden merkitsemiseen", hän selittää. ”Nyt voit käyttää merkintää keskimääräiseen kuvaan. Ajatuksena on, että sinun täytyy työskennellä vain yhden kuvan kanssa levittääksesi kaikkia tietojoukon kuvia. "

Kissarotujen löytäminen Tarkentamalla hakutuloksen muotoja tutkijat voivat löytää tiettyjä kissanrotuja, mukaan lukien (vasemmalta oikealle) Ragdoll, Siiami, Maine Coon ja Sphinx. (Kohteliaisuus UC Berkeley)

Taideteosten luominen on AverageExplorer-sovelluksen heikot hedelmät. Ryhmä sai inspiraatiota uusmedia-taiteilijoilta, kuten Jason Salavonilta, joka on huolellisesti luonut keskiarvoiset valokuvat käsin. Sitä voidaan käyttää myös Facebook-laajennuksen luomiseen, jonka avulla käyttäjät voivat harkita keskimääräistä kuvaa itsestään.

Tutkijoiden toiveet ovat vielä laajemmat ja vaikuttavampia. Sosiologit voisivat käyttää järjestelmää sosiaalisten suuntausten havaitsemiseen ja tutkimiseen; esimerkiksi keskiarvoinen kuva voisi osoittaa, että morsiamet seisovat useimmiten sulhanen oikealla puolella muotokuvissa. AverageExplorer voi myös olla hyödyllinen työkalu media-analyytikoille, jotka yrittävät leikata televisiolähetyksiä - muuttuuko Stephen Colbertin asento puhuttaessa George W. Bushista Barack Obaman kanssa?

Antamalla käyttäjien olla vuorovaikutuksessa visuaalisen datan kanssa sen sijaan, että yrittäisivät kirjoittaa oikeita avainsanoja, käyttäjät voivat silittää, mitä Zhun neuvonantaja ja AverageExplorer-luoja, Aleksei Efros kutsuu "kielen pullonkaulaksi".

Ryhmä kuvittelee joukon räätälöityjä työkaluja, jotka on suunniteltu erityisiin, vaikeasti artikuloitaviin tehtäviin. Esimerkiksi ostossovellus mahdollistaisi käyttäjän hämärtää verkkoa kantapään parille, jonka väri, koron muoto ja korkeus ovat tarkat. Zhu harkitsee työkalua, joka integroituu poliisin luonnostelijoiden taiteen työnkulkuun, jolloin todistaja voi etsiä kasvotietokannoista tekijöitä vastaavia piirteitä ja rakentaa yhdistelmäkuvan.

BasicExplorer-version perusversio julkaistaan ​​syksyllä.

Ohjelmisto luo yhden kuvan, joka kertoo kaiken