https://frosthead.com

Yksi kirjoittaja käytti tilastoja paljastaakseen salaisuudet siitä, mikä tekee mahtavasta kirjoittamisesta

Useimmista yliopistotason kirjallisuuskursseista löydät opiskelijat, jotka dissektoivat pieniä osia kirjallisuusklassikoita: Shakespearen yksinpuhelut, Joycen tietoisuuden virta ja Hemingwayn staccato-lauseet. Epäilemättä on niin paljon, mitä voidaan oppia kirjailijasta, hänen käsityöstään ja tarinan merkityksestä tämän tyyppisen läheisen lukemisen avulla.

Mutta Ben Blatt antaa vahvan argumentin toiselle lähestymistavalle. Keskittymällä tiettyihin lauseisiin ja kappaleisiin, hän kirjoittaa uudessa kirjassaan, Nabokovin suosikkisana on Mauve, lukijat laiminlyövät kaikki muut sanat, jotka keskipitkällä romaanilla ovat kymmeniä tuhansia datapisteitä.

Toimittaja ja tilastotieteilijä loi tietokannan tekstistä 1900-luvun klassikoiden ja bestsellereiden sekoituksista vastaamaan kvantitatiivisesti lukuisiin kiinnostaviin kysymyksiin. Hänen analyysinsä paljasti joitain omituisia malleja, jotka saattavat muuten jäädä huomaamatta:

Numeroiden mukaan parhaat romaanien avauslauseet ovat yleensä lyhyitä. Lupaavan kirjailijan James Pattersonin keskiarvo on 160 klišisiä 100 000 sanasta (eli 115 enemmän kuin arvostettu Jane Austen), ja Vladimir Nabokov käytti sanaa mauve 44 kertaa useammin kuin kahden viime vuosisadan keskimääräinen kirjailija.

Smithsonian.com keskusteli Blattin kanssa hänen menetelmästään, joistakin hänen keskeisistä havainnoistaan ​​ja miksi iso data on tärkeä kirjallisuuden tutkimuksessa.

Olet käyttänyt tilastollista lähestymistapaa tutkimaan kaikkea Mistä Waldo - Seinfeld, pikaruoan liitoksista pop-kappaleisiin. Voitko selittää menetelmääsi ja miksi teet mitä teet?

Olen datatoimittaja ja tarkastelen popkulttuurin ja taiteen asioita. Pidän todella tarkastelemasta asioita kvantitatiivisesti ja puolueettomasti, joissa on paljon tietoa, jota ihmiset eivät ole käyneet läpi. Jos haluat oppia siitä, millainen tyypillinen ihminen on Yhdysvalloista, se olisi hyödyllistä, mutta et vain puhu yhden henkilön kanssa, tiedät kaiken heistä ja oletat sitten, että kaikki Yhdysvaltain ihmisistä on sama. Mielestäni yksi asia tällaisen eksymisen kirjoittamisessa on se, että voit keskittyä yhteen kirjoittajan lauseeseen, erityisesti luovien kirjoitusten luokissa, tai yhteen kohtaan, ja menetät suuremman kuvan nähdäksesi nämä yleiset kuviot ja trendit, joita kirjoittajat käyttävät yhä uudelleen satoja ja ehkä tuhansia kertoja omassa kirjoituksessaan.

Preview thumbnail for video 'Nabokov's Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing

Nabokovin suosikkisana on vaalea: Mitä numerot paljastavat klassikoista, bestsellereistä ja omasta kirjoittamisesta

Ostaa

Joten mikä sai sinut kääntymään kirjallisuuden puoleen?

Taustani on matematiikassa ja tietotekniikassa, mutta olen aina rakastanut lukemista ja kirjoittamista. Kirjoittaessani yhä enemmän kiinnostuin siitä, kuinka erilaiset kirjoittajat ja ihmiset antavat kirjoitusneuvoja. Siellä on paljon asiaa, joka näytti olevan järkevää, mutta jota ei tuntunut tukevan tieto, ja paljon sitä, joka oli ristiriidassa keskenään. Ajattelin vain, että oli oltava tapa ottaa nämä aiheet kirjallisesti, että ihmiset olivat jo hyvin tietoisia ja puhuttiin niistä ja testata niitä suurille kirjailijoille ja suosituille kirjailijoille nähdäkseen, onko tämä neuvo todellinen vai onko kyse lääkkeiden määräämisestä, t todella tarkoita mitään oikeissa kirjoissa ja oikeilla sivuilla.

Mikä oli ensimmäinen kysymys, jonka halusi kysyä kirjallisuusklassikoista ja bestsellereistä?

Kirjan ensimmäisessä luvussa on neuvoja siitä, pitäisikö käyttää - tai adverbeja. Tämä on myös ensimmäinen luku, jonka kirjoitin aikajärjestyksessä. Se on pääosin Stephen Kingin neuvoa olla käyttämättä –erien sananlaskuja kirjassaan Kirjoittaminen, joka monille kirjoittajille on kirjoituskirja. Mutta monet muut kirjoittajat - Toni Morrison, Chuck Palahniuk - ja kaikki luovat kirjoituskurssit suosittelevat käyttämättä –ly-adverbia, koska se on tarpeeton sana ja merkki siitä, että et ole ytimekäs. Sen sijaan, että sanot: "Hän juoksi nopeasti", voit sanoa: "Hän sprinni."

Joten halusin tietää, onko tämä todella totta? Jos tämä on niin hyvä neuvo, luulet, että suuret kirjoittajat todella käyttävät sitä vähemmän. Voit olettaa, että amatöörikirjoittajat käyttävät sitä enemmän kuin julkaistuja kirjoittajia. Halusin todellakin tietää tyylillisesti ensin, jos Stephen King noudatti omia neuvojaan, ja sitten jos se koskee kaikkia muita suuria ja arvostettuja kirjoittajia.

Joten mitä löysit?

Itse asiassa on olemassa suuntaus, jonka mukaan tekijät, kuten Hemingway, Morrison ja Steinbeck, parhaimmat kirjat, jotka pidetään kiinni ja kiinnittävät heihin nyt eniten huomiota, ovat kirjat, joissa on vähemmän määrä –verheilmaisuja. Jos verrataan amatööri- ja kaunokirjallisuutta sekä online-kirjoittamista, jota ei ole muokattu viime aikojen bestsellereiden ja Pulitzer-palkinnon saajien kanssa, on ristiriita, jossa julkaistujen kirjoittajien käyttämät sanat-adverbit ovat vähäisempiä. En ole niin yksipuolinen, että mielestäni voit vain ottaa irti adververit kunnossa olevasta kirjasta ja siitä tulee hieno kirja. Se ei tietenkään ole miten se toimii. Mutta on jotain tosiasiassa, että erittäin suoraan kirjoittavat kirjoittajat tuottavat kirjoja, jotka elävät kaiken kaikkiaan pisimpään.

p13 - Adverbit.JPG

Kuinka luit tietokannan kirjallisista teoksista?

Käytin monissa kysymyksissä samoja 50 kirjailijaa, jotka olin valinnut jonkin verran mielivaltaisesti. Pohjimmiltaan se perustui kirjailijoihin, jotka olivat bestseller-listan kärjessä, kirjailijoihin, jotka olivat kaikkien aikojen luetteloiden suurimpien kirjailijoiden kärkeen, ja kirjailijoihin, jotka vain eräänlaisena edustivat erilaisia ​​genrejä ja aikoja sekä lukijoita. Tällä tavoin voit verrata näitä kirjailijoita koko teoksen läpi ja tuntea heidät.

Minulle oli erittäin tärkeää, että jos sanoin jotain, ”Toni Morrison käyttää tätä sanaa tällä nopeudella”, puhuin jokaisesta hänen koskaan kirjoittamastaan ​​romaanista eikä vain kolmesta romaanista, joita minulla jo on. Kirjassani on 50–100 kirjailijaa, joihin viitataan kaikkialla. Löysin heidän kirjallisuutensa ja löysin sitten kaikki heidän romaani, jotka he olivat kirjoittaneet siihen mennessä, kokonaisena tietueenaan. Tietyllä tavalla se on vähän kuin urheilutilastojen pitäminen, jossa jokainen kirja on kuin kausi ja sitten kaikki nämä vuodenajat tai kirjat tulevat yhteen urana. Voit nähdä, kuinka kirjoittajat muuttuvat ajan myötä ja miten he tekevät asioita yleisesti. Kun kaikki kirjat on arkistossa, vastata näihin kysymyksiin, jotka ovat tietyllä tavalla hyvin pelottavia, on erittäin suoraviivaista.

Ja kuinka käsittelisit koko tuon tekstin?

On olemassa ohjelmointikieli, nimeltään Python, ja siinä on joukko työkaluja, nimeltään Natural Language Toolkit, usein lyhennettynä NLTK. Tähän osallistuvat työkalut ovat vapaasti kaikkien käytettävissä. Voit ladata paketin verkossa ja käyttää sitä Pythonilla tai muilla kielillä. Et voi saada monta kirjoituskysymystä, mutta voit sanoa, kuinka monta kertaa tämä sana esiintyy tekstissä? Se voi käydä läpi ja tunnistaa missä lauseet päättyvät ja missä lauseet alkavat ja puheosat - adjektiivi vs. adverbi vs. verbi. Joten kun sinulla on nämä työkalut, voit saada tiedot.

Mitä tilastoja kootit manuaalisesti? Mikä oli tylsin?

Yhdessä osiossa katson aloittavan lauseita. Elmore Leonard, joka oli erittäin menestyvä kirjailija, oli sanonut: ”Älä koskaan avaa kirjaa säällä.” Tämä on neuvo myös monista kirjoitusoppaista. Joten kävin läpi satojen kirjoittajien nähdä kuinka usein he avaavat kirjansa säästä. Esimerkiksi Danielle Steel, uskon, että 45 prosenttia hänen kirjojensa ensimmäisistä lauseista on säästä. Monta kertaa se on vain "Se oli upea päivä" tai "Se oli kirkas ja aurinkoinen", sellaiset asiat. Sitä varten ei ollut mitään keinoa tehdä sitä automaattisesti ilman mitään virheitä, joten käyn vain läpi kaikki teostiedostot ja merkitsin, onko kyseessä sää. Voit sanoa, että se oli tylsiä, koska se oli kerätty paljon tietoja, mutta oli hauskaa käydä läpi ja lukea satoja avauslauseita kerralla. On myös muita malleja, jotka selvästi ilmenevät kirjoittajilta ajan myötä.

P207 --- Weather.jpg

Kuten sanot, joillekin ikävä, toisille hauskaa. Jotkut saattavat ajatella, että tämä analyyttinen lähestymistapa on tylsää, mutta väität, että se voi olla “huvittava” ja “usein jopa suoraan hauska.” Mikä oli hauskin havaintosi?

Kirjan otsikko, Nabokovin suosikkisana on vaalea, kertoo kuinka numeroiden perusteella sana, jota hän käyttää korkeimmalla tahdilla kuin englanti, on vaalea. Se lopulta tekee paljon järkeä, jos katsot hänen taustaaan, koska hänellä oli syntestiikka. Hän puhui omaelämäkerrassaan siitä, kuinka kuullessaan erilaisia ​​kirjaimia ja ääniä, hänen aivonsa loivat automaattisesti värit.

Toistin tämän kokeilun 100 muulle kirjailijalle nähdäksesi mikä heidän suosikkisana on. Seurauksena on, että saat kolme sanaa, jotka edustavat heidän kirjoitustaan ​​sanoilla, joita he käyttävät eniten. Civility, fancying ja harkitsemattomuutta. Tuo on Jane Austen. Luulen, että jos näit nuo sanat, Jane Austen saattaa olla yksi ensimmäisistä arvauksista. Ja sitten sinulla on kirjoittaja, kuten John Updike, joka on vähän rakeisempi, todellinen ja eri aika. Hänen suosikki sanansa ovat reunat, piikki ja munaa. Mielestäni on erittäin mielenkiintoista nähdä persoonallisuus tulevan läpi näiden yksinkertaisten matemaattisten kysymysten perusteella. Jos sinulla on suosikki kirjailija, sen läpi käyminen paljastaa tavallaan jotain heidän persoonallisuudestaan, jota et ole ehkä huomannut aiemmin.

Ray Bradbury oli kirjoittanut, että hänen suosikki sanansa oli kaneli. Numeroiden perusteella hän käyttää sitä paljon. Hänen selityksensä miksi hän piti kanelista, oli, että se muistutti häntä isoäitinsä ruokakomeroista. Joten kävin läpi ja löysin muita maustesanoja ja haisusanoja, jotka voitiin yhdistää isoäidin ruokakomeroon, ja Ray Bradbury käyttää suurimpaa osaa näistä sanoista erittäin nopealla tahdilla. Jossain mielessä voit saada tämän outon, Freudian tutkimaan jotain kirjoittajien lapsuudesta. Jos Ray Bradbury ei olisi sanonut sitä, ehkä voisit silti selvittää sen.

Verratit amerikkalaisia ​​ja brittiläisiä kirjailijoita, mikä vahvisti stereotyypin, jonka mukaan amerikkalaiset ovat äänekäs. Voitko selittää tämän?

Tämä perustuu tosiasiallisesti alun perin tutkimukseen, jonka suoritti jatko-opiskelija Stanfordissa. Hän oli yksilöinyt sanat, joita käytetään kuvaamaan vuoropuhelua kirjoissa, ja kuvasi ne ääneen, neutraaliksi tai hiljaiseksi. ”Kuiskasi” ja “mutisi” olisi hiljaista. Neutraali olisi "hän sanoi" tai "hän sanoi" ja äänekäs olisi "hän huudahti" tai "huusi". Kävin läpi 50 katsomani kirjailijaa, samoin kuin suuret näytteet fanifiktioista, ja löysin, ei hullu marginaalilla, mutta merkityksellisellä marginaalilla, että amerikkalaisilla on korkeampi äänenvoimakkuuden ja hiljaisten sanojen suhde. Siellä on muutama selitys. Voi olla, että näin amerikkalaiset puhuvat koko elämänsä ajan, niin kirjoittajat kuvaavat tapaa puhua usein. Voisit vain nähdä sen, että amerikkalaiset kirjailijat mieluummin enemmän toimintapohjaisia, thrilleriä, korkean tempon tarinoita verrattuna hienovaraisempiin. Amerikkalaiset ovat todellakin kovempia numeroiden perusteella.

Blatt_author photo_Credit Sierra Katow.JPG Ben Blatt, Nabokovin suosikkisanan kirjoittaja on Mauve (Sierra Katow)

Miksi matematiikan soveltaminen kirjoittamiseen on mielestäsi hyvä tapa opiskella kirjallisuutta?

En todellakaan kannata sitä, että tämän pitäisi olla ensimmäinen tapa opiskella kirjallisuutta, jos yrität parantaa kirjoitustasi. Mutta jopa keskipitkä romaani on todennäköisesti 50 000 sanaa, ja se on 50 000 datapistettä. Et vain kykene liottamaan kaikkia kerralla, ja tulee joitain kysymyksiä, joihin et vain osaa vastata lukemalla itse. On hyvä nähdä suurempi kuva. Jos istut ja opiskelet yhtä kappaletta, olet luovassa kirjoituskurssissasi puhumassa professorisi kanssa, jos siihen on tietty tapa tarkastella, näet vain kaiken. Mutta tietojen kanssa sellainen vapauttaa sinut siitä, ja voit vastata joihinkin kysymyksiin ilman näitä harha-asioita ja saada todella uutta tietoa.

Mainitsit, että mietit jatkuvasti takaisin Roald Dahlin ”Suurten grammatisoijaan”.

On hieno Roald Dahl -tarina, jossa insinööri suunnittelee tapaa kirjoittaa tarinan. Tässä tuomiopäivän skenaariossa joku voi vain antaa koneelle tontin ja se sylkee lopullisen romaanin. Siellä on vihje, että he tuottavat niin muodollisia ja perusajallisia romaaneja. Tarinan päähenkilö päättää olla liittymättä koneen toimintaan ja taistelee sitä vastaan ​​luomalla oman kirjoituksensa ja taiteensa.

Uskon ehdottomasti, että tämä kirja, jos kirjoitat, vastaa moniin kysymyksiin sinulle ja muuttaa ehdottomasti ajattelutapaa, mutta viime kädessä ei todellakaan korvata ideoita, jotka saavat ihmiset ajattelemaan, ja kohtauksia, jotka saavat ihmiset peloissaan tai olla yhteydessä hahmoihin. Tässä kirjassa tarkastellaan kirjoittamista eikä välttämättä sitä, miten luoda ikimuistoisen tarinan. Tämä kirja ei yritä suunnitella täydellistä romaania, ja en usko, että olemme siihen niin lähellä kuin jotkut ihmiset saattavat pelätä.

Yksi kirjoittaja käytti tilastoja paljastaakseen salaisuudet siitä, mikä tekee mahtavasta kirjoittamisesta