Australialainen laulaja ja ääninäyttelijä Karen Jacobsen sai keikan vuonna 2000 pian saapuessaan New Yorkiin. Tuottajat - yritystyypit - lähettivät hänet äänitysstudioon kolmen viikon ajan, missä hän vietti neljä tuntia päivässä sanomalla esimerkiksi seuraavassa risteyksessä käänny vasemmalle ja laskemalla uudelleen. Loppujen lopuksi se ei ollut hänen äänensä. se oli kireää. ”Sanoin” noin ”noin 186 kertaa”, Jacobsen muistelee. "Tällainen asia voi saada sinut menemään silmiin."
Asiaan liittyvä sisältö
- Ptolemaiosta GPS: hen, karttojen lyhyt historia
Kaksi vuotta myöhemmin hän sai puhelun ystävältä. ”Karen”, hänen kaverinsa räpytti. “Ostin aviomiehelleni yhden niistä uusista GPS-asioista, ja laitoimme sen australialaiselle äänelle. Se olet sinä! ”Näin Jacobsen sai selville, että hänen äänensä antoi ohjeita 400 miljoonalle ihmiselle ympäri maailmaa.
Hänen työnsä korostaa veren ja tekniikan hybridiä, joka menee nykyään kaikkialle kuuluviin ääniin, jotka kertovat meille, mihin kääntyä: Yli miljardi ihmistä luottaa Google Mapsiin kuukausittain, ja 80 prosenttia aktivoi äänivaihtoehdon.
Äänisynteesin varhaisina päivinä - ajattele 1970-luvun lopun Speak & Spell -sovelluksen robottiääniä - algoritmi muunsi tekstin yksisävyiseksi virtaksi. Sitten tietokantojen kasvaessa voit tallentaa Jacobsenin kaltaisen ääninäyttelijän, joka lausuu tavujen ja sanojen kokonaisuuden, jota algoritmit yhdistivät ja muuttavat perussääntöjen mukaan. Äskettäin ohjelmistokooderit yrityksissä, kuten Nuance, joka suunnittelee navigointirajapintoja autoihin, ovat kehittäneet kolmannen lähestymistavan - syvän oppimisen soveltamisen puhesynteesiin. Se sekoittaa tallennetut sanat ja syntetisoidut katkelmat luottaen tekoälyyn tehdäkseen ääntämisen entistä inhimillisemmäksi. "Ne kuulostavat äärettömästi luonnollisilta", sanoo Nuancen teknologiajohtaja Vlad Sejnoha.
Tietenkin kielen virheet ovat edelleen haaste äänijärjestelmille. "Ajattele" kovaa "vastaan" ostettua "tai" lukea "tai" lukea ", " Googlen tiedottaja sanoo. ”Mutta toivottavasti käyttäjä voi aina arvata, mitä tarkoitimme.” Nyt kun AI opettaa auton navigointijärjestelmiä puhumaan älykkäämmin, seuraavaksi se etsii online-maailmaa ja selvittää mihin haluat mennä jo ennen kuin teet.
Tilaa Smithsonian-lehti nyt vain 12 dollarilla
Tämä artikkeli on valikoima Smithsonian-lehden heinä-elokuun numeroa
Ostaa