https://frosthead.com

Suudella kieli esteitä hyvästi

Universal-kääntäjä on jo pitkään ollut popkulttuurin pakkomielle. Star Trek esittelee sen kämmentietokoneena, joka muistuttaa mikrofonia, joka pystyy kääntämään useimmat kielet heti . Hitchhiker's Guide to the Galaxy ylpeilee Babel-kalalla, olennolla, joka korvaan takertuessaan tarjoaa välittömän käännöksen mistä tahansa galaksin kielestä.

Joten ei pitäisi olla yllättävää, että nykypäivän ihmiset yrittävät luoda laitteen, joka toimii yhtä hyvin. Kymmeniä käännös älypuhelinsovelluksia on olemassa, mutta suurin osa kääntää sanoja yksinkertaisella, yksi-toiselle-pohjalta; käyttäjä kirjoittaa tai puhuu sanan, ja sovellus palautuu käännökseen. Nyt tavoite ja todellinen rahamääräinen odotus on, että insinöörit ja yrittäjät voivat antaa kahdelle ihmiselle mahdollisuuden keskustella eri kielillä, kun taas pieni laite sylkee käännökset reaaliajassa.

Nykyiset käännössovellukset

Kreikkamatkalla englanninkielinen Andrew Lauder sairastui.

"Kävin apteekissa, ja he eivät voineet ymmärtää mitään englantia, joten en saanut lääkkeitä", kertoo Vocre Translate -yrityksen toimitusjohtaja Lauder. Lääkeetiketit olivat hänelle kirjaimellisesti kreikkalaisia. Kieliesteet ovat yleisiä maailmanmatkustajille. Ulkomailla pienistä transaktioista, kuten lääkkeen ostamisesta tai ohjeiden saamisesta - toinen vaikeus, jonka Lauder kohtaa -, tulee herkeäisiä tehtäviä.

Palattuaan osavaltioon, Lauder loi ääni- ja tekstinkääntämissovelluksen Vocre Translate. Se alkoi tekstistä tekstiin -sovelluksena (nimeltään MyLangauge), sitten muuttui aluksi puheeksi tekstimuotoksi, joka, kuten muut sovellukset, mukaan lukien SayHi Translate, käytti perinteistä mallia, jossa sana kääntyy suoraan toiseen sanaan. Sano "Hei", ja älypuhelin tai tabletti piippaa automaattisen "Holan". "Hyvästi" tulee "Sayonara". Ja niin edelleen, aivan kuten tekstikääntäjä.

Yksinkertaisen äänen käännöksen luomiseksi näiden sovellusten luojat tarvitsivat tietoja. Vocre veti tietonsa julkisissa tallenteissa ja asiakirjoissa, kuten vanhoissa elokuvissa tai julkisissa kuulemisissa. "Pyysimme pohjimmiltaan vastaajapalvelun kopiointipalvelua voidaksemme käyttää heidän pilviään puheentunnistukseen", sanoo SayHi: n toimitusjohtaja Lee Bossier.

Kun insinööreillä oli ääni- ja tekstitiedot, he parittivat äänen ja tekstin, sanasta sanaan. Äänentunnistusohjelma tunnistaa ”juuston” ja muuntaa sen tekstiksi. Se muunnetaan ranskaksi, ja sovellus löytää ranskan ääntämisen sanalle “fromage”.

Kääntäjä ei siis toimi, jos käyttäjä kutsuu toisinaan jotain "juustomaista", koska puhuttu kieli ei ole läheskään yhtä staattista kuin kirjoitettu kieli. Poljinnopeus, slängi, käänne, ääntäminen, murre ja keskusteluvirrat voivat muuttaa merkitystä

Ajan myötä Lauder kuitenkin halusi keskustelukykyisemmän laitteen. Sähköpostiviestissä hän sanoo: ”Olemme havainneet käyttötietojemme perusteella, että ihmiset puhuvat hyvin eri tavalla kuin kirjoittamisessaan. Puhuttu sana on paljon spontaanempaa ja vähemmän muodollista ja kirjaimellista. ”Joten hän käytti tilastollista konekäännöstä, myös Googlen käyttämää lähestymistapaa, joka käyttää tietoja yleisen sanakäytön löytämiseen, luopuen perinteisestä sanasta sanalle -muuntamismalliin. Periaatteessa Vocre oppii käytettynä. ”Se oppii jokaisen keskustelun, jokaisen sen läpi käyvän lauseen perusteella. Se on jotain, joka tulee älykkäämmäksi ajan myötä ”, Lauder sanoo.

Silti tällä hetkellä molempien sovellusten kääntäminen vie muutaman sekunnin, mutta ovat epäilemättä tehokkaita, etenkin kehon kielen kanssa, tapahtumakeskusteluissa, kuten aterian tilaamisessa. Ihmiset ovatkin jo vuosien ajan tilanneet ruokia muilla kielillä ja aina onnistuneet syömään. Mutta heillä ei ole ollut mahdollisuutta käydä perusteellisia, monimutkaisia ​​keskusteluja.

Vocren ja SayHin kanssa keskustelut voivat jäykkyä pitkin, mutta se ei ole sama kuin jutteleminen omalla äidinkielelläsi. Google aikoo muuttaa tätä kokonaan.

Googlen lähestymistapa (tilastollinen konekääntäminen)

Kun opimme uutta kieltä koulussa, aloitamme yksilöllisillä sanastoilla. Mutta kieli on sujuvampaa - sanat tarvitsevat kontekstin.

"[Googlen] käyttämä lähestymistapa on yleisempi lähestymistapa", sanoo Google Translate -sovelluksen insinööri Josh Estelle. "Sen sijaan, että yritämme koodata kaikki nämä säännöt, yritämme oppia säännöt tarkastelemalla tietoja."

Teknologiayritys välttää yksitoikkoista, sanasta sanaan -menetelmää, ja sen sijaan käyttää tilastollista konekäännöstä, katsomalla ei sitä, mitä sanat tarkoittavat, vaan sitä, kuinka kieli on mallinnettu, minkä se oppii tiedon kautta . Joten, se on tarkoitettu metsälle, ei puille. Englanninkielinen esimerkki: tiedämme sanan ”break” ja “up” määritelmät. Mutta ilmaus “break up” ei ole näiden kahden sanan kirjaimellinen yhdistelmä.

Tilastollinen konekäännös vaatii tietoja. Sen vuoret. Jotta menetelmä toimisi, sen ei tarvitse olla vain se, että ”fromage” on ranskan kieli juustojen lisäksi myös 100 esimerkkiä sekä “fromage” että juusto käytöstä todellisissa lauseissa.

Estelle sanoo, että jos englanninkielisellä kielellä on kaksi valikkoa, identtiset lukuun ottamatta sitä, että yksi on painettu englanniksi ja toinen kiinaksi, ”voit todennäköisesti selvittää, mikä kiinalainen merkki tarkoittaa” keittoa ”.” Asiayhteys on kuningas. Mutta luodaksesi tämän kontekstin, sinun on käytettävä miljoonia valikoita ja kaikkia muita mahdollisia asiakirjoja.

Mikä on tarkalleen mitä Googlella on. Ilman verkkojättilää keräämään kasaan dataa, reaalimaailman Babel-kaloja ei voisi olla olemassa. Se indeksoi verkkoa ja kerää kaiken - tekstiä ja ääntä. Sitten se syöttää nämä tiedot algoritmeihin, jotka vertaa kaikkea kaikkeen muuhun. Nämä vertailut auttavat pääsemään juureen siihen, miten kieli luonnollisesti toimii.

"Yksi asia, joka ihmettelee kääntäjää puhuttaessa, on, että joukkueessamme ei ole kielitieteilijöitä", Estelle sanoo. ”Olemme käynnistäneet 71 kieltä, ja sanoisin, että ryhmämme ei osaa puhua valtaosaa niistä. Ihmiskääntäjä ei tule oppimaan kaikkia näitä termejä ja asioita niin nopeasti kuin [tietomme] voi oppia verkosta. "

Mitä järkeä?

Kuten Google, myös Facebook näkee etuja. Mieti sosiaalisen median sivuston omaa käännöstä käännökseksi.

"Facebookin tehtävä on yhdistänyt koko maailman, ja yksi maailman yhdistämisen esteistä ei ole, että kaikki puhuvat samaa kieltä", sanoo Facebookin suunnittelujohtaja Tom Stocky. "Käännöspuolen mielestäni todella kunnianhimoinen tulevaisuuden visio on, jos voisit käyttää Facebookia äidinkielelläsi ja olla vuorovaikutuksessa minkä tahansa muun kielen kanssa."

Facebook osti tämän elokuun aikana Jibbigon, puhe puheeksi -sovellussovelluksen, joka on saatavana Android- ja iOS-laitteille.

Innokkaat Facebook-käyttäjät huomaavat, että sosiaalisessa sivustossa on jo jonkinlainen käännös. Jos sinulla on koskaan ollut espanjalaista viestiä englanninkielisellä sivullasi, sinulle on heti annettu mahdollisuus kääntää se äidinkielellesi.

Mutta Stocky näkee äänikomponentin potentiaalisena pelinvaihtajana. Älypuhelimien ja tablet-laitteiden nousu on tervetullut jatkuvasti toisiinsa liitettyyn maailmaan, ja puheentunnistusohjelmistojen nousu kutsuu uusia keinoja verkkoyhteyteen. Stocky suunnittelee tulevaisuutta, jossa käyttäjät voivat vain puhua komennon älypuhelimilleen ja olla vuorovaikutuksessa muiden käyttäjien kanssa, kielelliset erot sivuun.

"Ei ole kysyttävää, mitä tapahtuu lopulta, koska ainoat rajoitukset ovat kielimoottorin teho ja tietysti käsittelyaika ja käsittelyteho", hän sanoo.

Tulanen yliopiston globaalien terveydenhuoltojärjestelmien ja kehityksen laitoksen professori, tunnustettu tekniikan skeptikko Laura Murphy asettaa kyseenalaiseksi universaalin kääntäjän arvon eikä tarvitse tuntea useampaa kuin yhtä kieltä.

Hänen mielestään laite voisi olla jonkin verran hyödyllinen matka-, liike- ja kansainvälisissä suhteissa, mutta ei uraauurtavaa. Tietyllä tasolla meillä on jo kääntäjiä (ihmisiä) paikallaan, ja suurin osa ulkomaan suhteista työskentelevistä osaa sopivat kielet. Murphy uskoo, että laitteella voi olla kielteisiä seurauksia.

"Mielestäni se voi tehdä ihmisistä laiskoja", Murphy sanoo. Kielten kääntäminen voi olla henkisesti haastavaa pakottamalla aivot - etenkin sellaiset, jotka osaavat enemmän kuin kaksi kieltä - työskentelemään eri tavalla, mutta harjoitus on kuitenkin palkitsevaa. Aivot vetävät kielellisen empatian paikasta, johon edes hienoin äänitulkki ei koskaan pystynyt saavuttamaan.

Vaikka tämä yleinen viestintä voi olla positiivinen, Murphy myöntää, että "se voi johtaa siihen, että ihmiset ajattelevat kommunikoivansa, kun eivät ole." Kulttuuri ei aina ole täysin kielen ruumiillistuma (ota esimerkiksi sarkasmi), eikä viestintä ole aina siirrettävistä tiedoista.

Milloin voimme odottaa näkevänsä tämän tekniikan?

"Vuonna 2005 meillä kului 40 tuntia kääntää 1000 virkettä", Estelle sanoo Googlesta. "Kääntämme tänään 1 000 lauseen vastineen 10 millisekunnin välein."

Kuten Richard Anderson sanoo kuuluisasti 1970-luvun kuuden miljoonan dollarin miehen tv-sarjassa ”Meillä on tekniikka.” Nyt on vain odotettavissa tietojen keräämistä ja analysointia. Estelle väittää, kuinka kauan se vie. Mutta varovaiset arviot ovat antaneet tällaisen laitteen käsiimme kymmenen vuoden sisällä.

Vaikka sovellusten luojat, kuten Bossier, tai jättiläisyritykset, kuten Google ja Facebook, eivät halua rakentaa omia versioitaan Babelin Raamatun tornista, se haluaa lopettaa vainon. Se kuvastaa maailmaa, jossa me kaikki kommunikoimme lääketiedestä, politiikasta ja ideoista.

Ja tuo maailma ei ehkä ole kaukana.

Toimittajan huomautus: Päivitimme tämän tarinan 4. huhtikuuta 2014 kuvaamaan tarkkaan Vocre Translate -tekniikkaa.

Suudella kieli esteitä hyvästi