https://frosthead.com

Miljoona sana maaliskuu

Aikaisemmin asiantuntija lähteenä siitä, mikä oli sana tai ei ollut sanaa, oli koulun niitti: sanakirja. American Heritage, Websterin kolmas, Oxford English: Pelissä oli muutama luotettu pelaaja.

Mutta entä jos nuo pelaajat menettävät reunansa?

Ota sana "staycation". Oleskelu, joka tarkoittaa lomaloman viettämistä kotona, ilmestyi äskettäin New York Times, USA Today ja MSNBC -lehdissä . Mutta se ei todennäköisesti ilmesty milloin tahansa sanakirjaan. Sama koskee "bracketology" (NCAA March Madness vedonlyönnin tiede) Facebookia ja Wikipediaa .

"Yritämme kattaa houkuttelevimmat" sanat ", sanoo American Heritage Dictionary -toimituksen päätoimittaja Joe Pickett." Mitä koulutetun maallikon on tiedettävä? "

Sanakirjoja tekeviä ihmisiä kutsutaan sanakirjoittajiksi ("sanakirjojen kirjoittajat tai toimittajat." Kiitos, Merriam-Webster). Ja heillä on aikatestattu menetelmä valita, mitkä uudet sanat varmennetaan ja mitkä heitetään ennen sanakirjan seuraavan verkkosivuston seuraavaa julkaisua tai päivitystä.

Sanakirjan toimittajaryhmät tarkkailevat tiettyjä aihealueita, kirjaamalla uuden sanan osumat. "Osuma" on maininta kirjassa, sanomalehdessä tai verkkosivustolla. Sitten he laittavat osumat tietokantaan ja vertaa uusia termejä sanoilla, joita heillä on jo. Joten vaikka Facebook ei ole tuotemerkki, se ei kelpaa, jokainen sana Shakespearen näytelmissä kuuluu - mukaan lukien cap-a-piirakka ("päästä jalka") ja Fardel ("taakka"). Luovan kielitieteen isoisäna Shakespeare keksi yli 1700 sanaa. Kaikki ne ilmestyvät lyhentämättömään sanakirjaan.

Sanakirjat hylkäävät sanat liian teknisistä (jopa kaikkein raskaimman "Grey's Anatomy" -fanin ei tarvitse koskaan tietää, mikä on mammosomatotrofi) tai liian liian nuorten (oleskelupaikka).

He eivät laske tuotemerkkejä (koksi, Facebook, Wikipedia) tai useimpia vieraita sanoja ja lauseita.

"Emme yritä olla Wikipedia", Pickett sanoi.

Joten kuka on? Kuka seuraa, laskee ja lajittelee englanninkielisten päivittäin käyttämiä sanoja?

Texin Austin on seurannut sanoja viimeisen viiden vuoden ajan. He sanovat, että englanti lisää omia asiantuntijaryhmiä ja omaa algoritmia 98 minuutin välein uuden sanan. Tämä tarkoittaa, että maailmassa on yli 900 000 englanninkielistä sanaa, ja miljoonaosa ilmestyy joskus huhtikuussa 2009.

Sen sijaan useimmissa tavanomaisissa sanakirjoissa on noin 200 000 sanaa, lyhentämättömissä sanakirjoissa noin 600 000 sanaa.

Mutta Monitor on niin varma numeroistaan, että se on aloittanut miljoonan sanan maaliskuun, miljoonan sanan laskennan.

"Palasimme keskikielen englanniksi ja huomasimme, että sanan määritelmä oli" puhuttu ajatus ", " sanoi Monitor J: n presidentti ja sanananalyytikko Paul JJ Payack, "mikä tarkoittaa, että jos sanon sanan, ja ymmärrät minä, se on oikea sana. "

Payack laskee yöpymisen, Facebookin ja Wikipedian sanoiksi. Mutta hän noudattaa myös joitain vanhoja sääntöjä. Esimerkiksi sanat, jotka ovat sekä substantiivi että verbi, kuten "vesi", lasketaan vain kerran. Hän ei laske kaikkia kemikaalien nimiä, koska niitä on satoja tuhansia.

Kun näyttö on tunnistanut sanan, se seuraa sitä ajan myötä ja tarkkailee nähdäkseen, missä sana ilmestyy. Tämän mittauksen perusteella he päättävät, onko sana "vauhtia", käytännössä siitä, onko siitä tulossa suositumpaa vai onko kielellisen maailman yhtenäinen ihme.

Ensi silmäyksellä tämä vaikuttaa paljon sanakirjan järjestelmältä.

"Se on sama kuin vanha [menetelmä], vain uuden todellisuuden tunnistaminen", Payack sanoi. Monitorin menetelmä antaa paljon enemmän painoarvoa verkkoviittauksille.

Mutta onko Payackin "uusi todellisuus" hyvin totta? Hän väittää, että nopea tiedonkulku ja globaalin englannin kielen tulo ovat muuttaneet tapaa, jolla ihmiset käyttävät sanoja. Ja että ero ihmisten käyttämien sanojen ja sanakirjoissa olevien sanojen välillä saattaa olla kasvussa.

"On käynyt ilmi, että kun joku saapuu Internetiin, se on kuin kammio", sanoi Payack. Ensimmäisen selaimen ilmestymisen jälkeen vuonna 1991 Internet on lisännyt paljon sanoja englannin kielelle - dot-com, blogi - ja lisännyt nämä sanat nopeasti. Web on myös ottanut nykyiset sanat uusiin korviin.

"90-luvun puolivälissä parin tuhannen selaimen osuman saaminen sanasta sai meidät taipuvaiseen kirjoittamaan sanaan; nyt kynnys on muuttunut", Pickett sanoi. "Löydät niin paljon todisteita epäselvistä sanoista ja ilmaisuista."

Mutta sanakirjat ovat tottuneet pelaamaan kiinniottoa. Loppujen lopuksi on vaikea määritellä sanaa ennen kuin se kehitettiin.

Payackin mukaan Internet ei ole kiireellisin haaste perinteiselle sananlaskentamenetelmälle. Se on hänen mielestään "globaalia englantia".

Englannilla on melkein 400 miljoonaa äidinkielenään puhuttavaa, mikä tuo sen toiseksi maailmassa, mutta siinä on 1, 3 miljardia puhujaa, mikä tekee siitä maailman laajimmin ymmärrettävän kielen, Payack selittää. Sitä puhuu yli 300 miljoonaa ihmistä Intiassa toisena kielenä ja ainakin monien toisten puhujien Kiinassa.

"Jokainen, joka puhuu nyt englantia, tuntuu omistavansa sen", Payack sanoo. Katso esimerkiksi adjektiivia "brokeback". Sen jälkeen kun ohjaaja Ang Lee kutsui elokuvaa kahdesta rakastuvasta cowboysta "Brokeback Mountain", sana "brokeback" muutti tiensä englannin kieleen synonyyminä "homolle". Vaikka "välitys" voi olla ohi kunniapäivänsä Yhdysvalloissa, sana, jolla on tämä uusi merkitys, on edelleen suosittu Kiinassa, Payack sanoi. Se näkyy blogeissa ja Web-sivustoissa, mikä tarkoittaa, että sillä on vauhtia, mikä tarkoittaa sanaa.

"Nykyään ihmisliikennettä kulkee paljon enemmän kaikkiin suuntiin ympäri maailmaa", kertoi Chicagon yliopiston kielitieteen professori Salikoko Mufwene, joka on tutkinut alueellisten murteiden kehitystä. Se, muuttuuko esimerkiksi kiinalaisista sanoista tulee osa amerikkalaista englantia, "riippuu siitä, kuinka säännöllisesti amerikkalaiset aikovat olla vuorovaikutuksessa aasialaisten kanssa englanniksi", hän sanoi.

Ja jos he tekisivät, olisiko amerikkalaisista keskimäärin enemmän sanallisia? Keskimääräiset amerikkalaiset käyttävät noin 7500 sanaa päivässä ja tietävät noin 20 000 sanaa. Jopa Shakespeare tiesi vain noin 60 000.

Joten englanninkielisten sanojen lukumäärä on aina paljon, paljon enemmän kuin kukaan ihminen tietää tai käyttää.

Sekä Mufwene että American Heritage's Pickett sanoivat, että englannilla voisi hyvinkin olla miljoona sanaa. Sanojen laskeminen on loppujen lopuksi epätarkkaa tiedettä.

Se ei myöskään ole sanakirjan tiede. Mufwene sanoi, että sanakirjojen työ on aina ollut "kuvastaa sitä, kuinka ihmiset puhuvat, ei opettaa heille puhetta". Jos sanakirjan pohdinta kapenee, se voi silti olla arvokas.

"Tarvitset ihmisiä muokkaamaan sanakirjaa ja ottamaan vastuun siitä, jotta se olisi luotettava", Pickett sanoi. "Ja en usko, että se muuttuu."

Miljoona sana maaliskuu