https://frosthead.com

Voivatko tietokoneet salata 5000-vuotisen kielen?

Indus-sivilisaatio, joka kukoisti koko kolmannen vuosituhannen eKr., Oli aikansa laajin yhteiskunta. Korkeudellaan se kattoi yli puolen miljoonan neliökilometrin alueen, jonka keskipisteenä on nykyinen Intian ja Pakistanin raja. Indus-jäännöksiä on löydetty niin kaukana pohjoisesta kuin Himalaja ja etelään kuin Mumbai. Se oli mantereen varhaisin tiedossa oleva kaupunkikulttuuri, ja siinä oli kaksi suurta kaupunkia, toinen Harappa ja toinen Mohenjo-daro. Huolimatta koostaan ​​ja pitkäikäisyydestään ja lähes vuosisadan arkeologisista tutkimuksista huolimatta, paljon Industa on edelleen salaperäinen.

Se mitä vähän tiedämme, on peräisin 1920-luvulla alkaneista arkeologisista kaivoksista, jotka jatkuvat edelleen. Arkeologit ovat vuosikymmenten ajan keksineet paljon esineitä, kuten postimerkkitiivisteitä, amuletteja ja pieniä tabletteja. Monet näistä esineistä kantavat sitä, mikä näyttää olevan kirjoitusnäyte - kaiverrettuja hahmoja, jotka muistuttavat muun muassa siivekäshevosia, piikkipyöriä ja pystyssä olevia kaloja. Mitä tarkalleen nämä symbolit saattavat tarkoittaa, pysyy kuitenkin yhtenä kuuluisimmista ratkaisemattomista arvoituksista muinaisten sivilisaatioiden tutkinnassa.

Historiassa on ollut muita vaikeita koodeja. Kannetut egyptiläiset saivat onnekkaan tauon löydettäessä kuuluisan Rosetta-kivin vuonna 1799, joka sisälsi tekstiä sekä egyptiläiseksi että kreikkalaiseksi. Mayalaisten hieroglifioiden tutkiminen hidastui, kunnes venäläinen kielitieteilijä nimeltä Yury Knorozov käytti taitavasti nykyaikaista puhuttua mayaa 1950-luvulla. Mutta Indusin Rosetta-kiveä ei ole, ja tutkijat eivät tiedä, mitkä kielet ovat mahdollisesti laskeneet indusien puhuman kielen perusteella.

Noin 22 vuotta sitten Intiassa Hyderabadissa kahdeksas luokan oppilaana nimeltä Rajesh Rao käänsi historian oppikirjan sivun ja sai ensin tietää tästä kiehtovasta sivilisaatiosta ja sen salaperäisestä käsikirjoituksesta. Seuraavina vuosina Raon koulutus ja ammatti veivät hänet toiseen suuntaan - hän lopetti jatkaakseen tietotekniikkaa, jota hän opettaa tänään Washingtonin yliopistossa, Seattlessa -, mutta hän seurasi Indus-stipendejä huolellisesti pitämällä välilehtiä kymmenillä epäonnistuneilla yrittää tehdä käsityksen käsikirjoituksesta. Jopa opiskellessaan tekoälyä ja robotiikkaa, Rao keräsi pienen kirjaston kirjoja ja monografioita Induksen käsikirjoituksesta, noin 30 niistä. Läheisessä kirjahyllyssä hän säilytti myös arvostetun kahdeksannen luokan historian oppikirjan, joka esitteli hänet indusille.

"Oli aivan mahtavaa nähdä kuinka monta ihmistä ehdotti", hän sanoo. Jotkut tutkijat väittivät, että kirjoittaminen oli eräänlainen sumerilainen käsikirjoitus; toiset sijoittivat sen dravidilaiseen perheeseen; vielä muiden mielestä se liittyi pääsiäisaaren kieleen. Rao ymmärsi, että tämä oli ”luultavasti yksi antiikin historian haastavimmista ongelmista”.

Koska yritys yrityksen jälkeen epäonnistui skriptin salaamiseen, jotkut asiantuntijat alkoivat menettää toivoa, että se voitaisiin purkaa. Vuonna 2004 kolme tutkijaa väitti kiistanalaisessa lehdessä, että indus-symboleilla ei ollut lainkaan kielellistä sisältöä. Sen sijaan symbolit ovat saattaneet olla vähän enemmän kuin piktogrammit, jotka edustavat poliittisia tai uskonnollisia henkilöitä. Kirjoittajat menivät niin pitkälle, että ehdottivat, että indusit eivät olleet lainkaan lukutaitoinen sivilisaatio. Joillekin kentällä koko pyrkimys löytää kieli näiden Induksen kaiverrusten takana alkoi muistuttaa turhuuden harjoittelua.

Muutamaa vuotta myöhemmin Rao aloitti taisteluohjelman. Siihen asti kirjoitusta tutkineet ihmiset olivat arkeologeja, historioitsijoita, kielitieteilijöitä tai kryptologeja. Mutta Rao päätti houkutella Indus-käsikirjoituksen salaisuudet parhaiten osaamansa työkalun avulla - tietotekniikka.

Indus-sivilisaation kiehtoo kahdeksannesta luokasta lähtien, Rajesh Rao käyttää tietotekniikkaa ja "ehdollisen entropian" nimistä käsitettä Induksen komentosarjan purkamiseen. (David Zaxin kohteliaisuus) Arkeologit ovat vuosikymmenien ajan löytäneet suuren osan Induksen sivilisaation esineitä, mukaan lukien postimerkkitiivisteet, amuletit ja pienet tabletit. (Robert Harding / Robert Harding maailmankuvat / Corbis) Rao ja hänen yhteistyökumppaninsa julkaisivat havaintonsa Science- lehdessä toukokuussa. He eivät tulkineet kieltä, mutta löytönsä lisäsi ymmärrystä siitä. (Robert Harding / Robert Harding maailmankuvat / Corbis) Rao ja hänen kollegansa tarkastelevat nyt pidempiä merkkijonoja kuin mitä tiedepaperissa analysoitiin. Kuvioiden löytäminen auttaisi puolestaan ​​määrittämään, mihin kieliryhmiin skripti voi kuulua. (David Zaxin kohteliaisuus)

Kesäpäivänä Seattlessa Rao toivotti minut tervetulleeksi toimistoonsa osoittamaan minulle, kuinka hän ja hänen kollegansa suhtautuivat ongelmaan. Hän asetti kokoelman jäljennöksiä savitiivisteominaisuuksista, jotka arkeologit ovat esittäneet Induksen kohteilta. Ne ovat pieniä - kuten pieniä neliömäisiä suklaita - ja useimmissa niistä on kuva eläimestä Indus-symbolien sarjan alla. Suurin osa Indus-käsikirjoituksen näytteistä on tällainen miniatyyri, joissa on vain muutama merkki; suuria monoliitteja ei ole löydetty. Tutkijat ovat epävarmoja pienten sinettien toiminnasta, Rao kertoi minulle, mutta yksi teoria on, että niitä on mahdollisesti käytetty todistamaan vaihdettujen tavaroiden laatua. Toinen ehdottaa, että sinetit ovat saattaneet olla keino varmistaa, että elinkeinonharjoittajat maksoivat veroja saapuessaan kaupunkiin tai poistuessaan kaupunkiin - porttitalojen raunioista on löydetty monia sinettejä, jotka ovat saattaneet toimia kuin muinaiset tietullikopit.

Rao ja hänen kollegansa eivät pyrkineet tekemään ihmeitä - he tiesivät, että heillä ei ollut tarpeeksi tietoa muinaisen käsikirjoituksen salaamiseksi -, mutta he oletsivat, että laskennallisia menetelmiä käyttämällä he voisivat ainakin alkaa selvittää, millaista kirjoitusta indusit kirjoittavat käsikirjoitus oli: koodasiko se kieltä vai ei? He tekivät tämän käsitteellä nimeltään ”ehdollista entropiaa”.

Mahdollisesta nimestä huolimatta ehdollisen entropian käsite on melko yksinkertainen: se on sekvenssin satunnaisuuden määrän mitta. Mieti aakkosemme. Jos ottaisit Scrabble-laattoja ja heität niitä ilmaan, saatat löytää vanhoja kirjeitä kääntymään muiden perässä. Mutta todellisissa englanninkielisissä sanoissa tietyt kirjaimet esiintyvät todennäköisemmin toisten jälkeen. Englanninkielistä q seuraa melkein aina u . T: tä voi seurata r tai e, mutta on vähemmän todennäköistä, että seuraa n tai b .

Rao ja hänen yhteistyökumppaninsa - kansainvälinen ryhmä, joka sisältää tietokone tutkijoita, astrofysiikkoja ja matemaatikkoa - käyttivät tietokoneohjelmaa Indus-käsikirjoituksen ehdollisen entropian mittaamiseen. Sitten he mittasivat muun tyyppisten järjestelmien ehdollisen entropian - luonnolliset kielet (sumeri, tamili, sanskriti ja englanti), keinotekoinen kieli (tietokoneohjelmointikieli Fortran) ja ei-kielelliset järjestelmät (ihmisen DNA-sekvenssit, bakteeriproteiinisekvenssit ja kaksi keinotekoista tietojoukkoa, jotka edustavat ehdollisen entropian korkeita ja matalia ääripäitä). Kun he vertasivat Indus-komentosarjan satunnaisuuden määrää muiden järjestelmien määrään, he havaitsivat, että se muistutti lähinnä luonnollisista kielistä löytyviä määriä. He julkaisivat havaintonsa toukokuussa Science- lehdessä.

Jos se näyttää kieltä, ja se toimii kuin kieli, niin se todennäköisesti on kieli, heidän paperinsa ehdottaa. Havainnot eivät tietenkään tulkitse käsikirjoitusta, mutta ne terävöittävät ymmärrystämme siitä ja ovat antaneet vakuutuksen niille arkeologeille, jotka olivat työskennelleet olettaen, että Induksen kirjoitus koodaa kieltä.

Lehden julkaisemisen jälkeen Rao sai yllätyksen. Kysymys mihin kieliperheeseen käsikirjoitus kuuluu, osoittautuu herkkä: indus-sivilisaation iän ja merkityksen vuoksi monet nykyajan ryhmät Intiassa haluaisivat väittää sen olevan suora esi-isänsä. Esimerkiksi eteläisen tamilinkieliset intialaiset mieluummin oppivat, että indusinkirjoitus oli eräänlainen proto-dravidialainen, koska tamili on syntynyt proto-dravidialaisesta. Hindin puhujien pohjoisessa mieluummin se olisi sanskritin vanha muoto, Hindin esi-isä. Raon artikkelissa ei päätetä, mihin kieliperheeseen käsikirjoitus kuuluu, vaikka se kuitenkin toteaa, että ehdollisen entropian tapa on samanlainen kuin vanhassa tamilissa - aiheuttaen joidenkin kriitikkojen syyttävän "meitä dravidalaisten kansallismielisinä", Rao sanoo. "Syyntöjen ja hyökkäysten raivo oli täysin odottamaton."

Rao on toisinaan helpotusta palaamalla vähemmän raivokkaasti neurotieteen ja robotiikan maailmaan. Mutta Indus-käsikirjoituksen kutsu on houkutteleva, ja "se, mikä oli aiemmin harrastus, monopolisoi nyt yli kolmanneksen ajasta", hän sanoo. Rao ja hänen kollegansa tarkastelevat nyt pidempiä merkkijonoja kuin mitä tiedepaperissa analysoitiin. "Jos on malleja", Rao sanoo, "voisimme keksiä kielioppisääntöjä. Se puolestaan ​​rajoittaisi millaisia ​​kieliryhmiä ”käsikirjoitus voisi kuulua.

Hän toivoo, että tulevat havaintonsa puhuvat puolestaan, innostaen vähemmän vastustajia, jotka juurtuvat yhdestä Intian alueesta toiseen. Omalta osin, kun Rao puhuu siitä, mitä Indus-kirjoitus tarkoittaa hänelle, hän pyrkii puhumaan koko Intian kannalta. "Intian perintö rikastuisi huomattavasti, jos kykenisimme ymmärtämään Induksen sivilisaatiota", hän sanoo. Rao ja hänen yhteistyökumppaninsa työskentelevät sen parissa, yksi lähdekoodirivi kerrallaan.

Voivatko tietokoneet salata 5000-vuotisen kielen?