Pneumonia asettaa miljoonan aikuisen amerikkalaisen sairaalaan vuosittain ja tappaa 50 000. Jos lääkäri epäilee potilaalla keuhkokuumetta, hän yleensä tilaa rintakehän. Tietysti lääkärin on tulkittava nämä röntgenkuvat. Mutta nyt, Stanfordin tutkijat ovat kehittäneet algoritmin, jonka mukaan he voivat diagnosoida keuhkokuumeen röntgenkuvat paremmin kuin kokeneet radiologit.
"Algoritmin etuna on, että se voi oppia satoista tuhansista rinnan röntgensäteistä ja niitä vastaavista diagnooseista muilta asiantuntijoilta", sanoo Stanfordin koneoppimisryhmän jatko-opiskelija Pranav Rajpurkar, joka johti tutkimusta. "Milloin radiologit saavat koskaan mahdollisuuden oppia satojen tuhansien muiden radiologien diagnooseista ja löytää kuvioita diagnooseihin johtavissa kuvissa?"
Algoritmi, nimeltään CheXNet, voi diagnosoida myös 13 muuta sairautta, mukaan lukien emfyseema ja pneumotooraks (keuhkojen ja rintakehän väliin jäänyt ilma). Ryhmä rakensi algoritmin käyttämällä National Institutes of Healthin (NIH) julkista tietojoukkoa, joka sisälsi yli 100 000 rintakehän röntgenkuvaa, joissa oli 14 mahdollista tilaa. Aineisto julkaistiin yhdessä alkuperäisen diagnoosialgoritmin kanssa, jota NIH rohkaisi muita tutkijoita etenemään.
Rajpurkar ja hänen muut koneoppimisryhmän jäsenet päättivät vastata haasteeseen. Tutkijoilla oli neljä Stanfordin radiologia, jotka merkitsivat mahdolliset keuhkokuumeen indikaatiot 420 kuvasta. Tietoja käyttämällä he loivat viikon sisällä algoritmin, joka pystyi diagnosoimaan tarkasti 10 tilaa. Kuukauden sisällä algoritmi voisi ylittää aiemmat algoritmit diagnosoidessaan kaikki 14 tilaa. Tässä vaiheessa CheXNet-diagnoosit sopivat radiologien enemmistön mielipiteeseen useammin kuin minkään radiologin yksilöllinen mielipide.
Tutkimus julkaistiin tässä kuussa tieteellisessä preprint-verkkosivustossa arXiv .
Muut diagnostiset algoritmit ovat tuoneet uutisia viime aikoina. Kanadan ja italian joukkueet ovat kehittäneet algoritmeja Alzheimerin taudin diagnosoimiseksi aivaskannauksilla. Sairaudelle ominaisten plakkien jakautuminen aivoissa on liian hienovaraista paljaalle silmälle, mutta tutkijoiden mukaan AI-tekniikka pystyy havaitsemaan epänormaalit kuviot. Rajpurkar ja hänen tutkijansa Stanfordin koneoppimisryhmässä ovat myös kehittäneet algoritmin sydämen rytmihäiriöiden diagnosoimiseksi, analysoidessaan tuntien tietoja puettavista sykemittarista. NIH-tiedoista on kehitetty muita keuhkokuumealgoritmeja, mutta Stanfordin menetelmä on toistaiseksi tarkin.
CheXNet voisi olla erityisen hyödyllinen paikoissa, joissa ihmisillä ei ole helppoa pääsyä kokeneille radiologeille, tiimi kertoo. Se voisi olla hyödyllinen myös eräänlaisena triasiana, jonka avulla voidaan tunnistaa, mitkä tapaukset todennäköisesti tarvitsevat hätäapua ja mitkä eivät. Ryhmä kehitti myös työkalun, joka tuottaa mahdollisten keuhkokuumeiden indikaattoreiden röntgenkuvien kartan, joka antaa kätevän visuaalisen oppaan lääkärille.
Vaikka joukkue suhtautuu optimistisesti CheXNetin diagnostiikkakykyyn, he ovat varovaisia sen rajoissa.
"AI on tehokas työkalu, mutta se vie vuosien kokemuksen ja monia vaikeita tunteja siitä, kuinka sitä hallitaan, ja on yhtä vaikea määrittää, missä voimme käyttää sitä positiivisimpaan vaikutukseen", Rajpurkar sanoo.
Vaikka kehitteillä on useita syvällisiä oppimisalgoritmeja, yksikään ei ole vielä käynyt läpi tiukaa testaus- ja hyväksymisprosessia, jota tarvitaan todellisten potilaiden käyttöön.
Radiologian professori ja Chicagon yliopiston radiologian laitoksen varapuheenjohtaja Paul Chang kuulostaa skeptisen huomautuksen CheXNetistä ja vastaavista syvän oppimisen ohjelmista. Lääkärit käyttävät jo algoritmeja avustaakseen monien sairauksien diagnosoinnissa, Chang sanoo. Nämä algoritmit luottavat esimuotoiltuun malliin, millainen tila näyttää: syövät ovat suurempia ja piikkisempiä kuin esimerkiksi hyvänlaatuiset massat. Sitä vastoin syvän oppimisen ohjelmien tarkoituksena on selvittää, mitkä ominaisuudet ovat itsessään merkittäviä, purkamalla valtavia määriä tietoja. Mutta tämä tarkoittaa myös, että he voivat ottaa vääriä vinkkejä. Chang antaa esimerkin syvällisestä oppimisalgoritmista, joka oppi erot röntgenkuvatyyppien välillä: kädet, jalat, mammografiat. Mutta tutkijat havaitsivat, että ohjelma oli yksinkertaisesti oppinut tunnistamaan mammografiat sillä, että pääkuva oli elokuvan puolella eikä keskellä (koska rinnat kiinnitetään rintakehän seinämään, ne näkyvät elokuvan reunalla) kädet tai jalat sen sijaan näkyvät röntgenkuvion keskellä). Algoritmi ei oppinut mitään merkittävää rinnoista, vain heidän asemastaan näytöllä.
"Tämä on hyvin varhaista aikaa", sanoo Chang, joka huomauttaa, että CheXNet-tuloksia ei ole tarkistettu. ”Syvällä oppimisella on suuri potentiaali, mutta lääketieteessä ja radiologiassa olemme yleensä hype-syklin varhaisessa vaiheessa, mutta hyväksyminen vie kauemmin. Opimme kuinka sitä kulutetaan asianmukaisesti. ”