{"id":505,"date":"2021-09-26T15:18:14","date_gmt":"2021-09-26T15:18:14","guid":{"rendered":"http:\/\/science.ekqvist.fi\/blogi\/?p=505"},"modified":"2021-09-26T15:18:14","modified_gmt":"2021-09-26T15:18:14","slug":"rekisteritutkimus-ja-ryhmittelyanalyysit-apuun-taistelussa-sars-cov2-virusta-vastaan","status":"publish","type":"post","link":"https:\/\/science.ekqvist.fi\/blogi\/covid-19\/rekisteritutkimus-ja-ryhmittelyanalyysit-apuun-taistelussa-sars-cov2-virusta-vastaan\/","title":{"rendered":"Rekisteritutkimus ja ryhmittelyanalyysit apuun taistelussa SARS-CoV2 -virusta vastaan"},"content":{"rendered":"\n<p>Tilastomatemaattisilla menetelmill\u00e4 voidaan tuottaa reaaliaikaisesta tietoa koronaviruksen aiheuttamasta taudista ja niiden avulla pystyt\u00e4\u00e4n saamaan varsin luotettavasti tietoa niist\u00e4 varhaisen vaiheen oireista, jotka ennustavat parhaiten vakavaa tautimuotoa COVID-19 sairaudesta. T\u00e4ss\u00e4 artikkelissa kuvaan pintaraapaisuna, mit\u00e4 mahdollisuuksia data-analyysit voisivat tuoda t\u00e4h\u00e4n vallitsevaan tilanteeseen. N\u00e4kemykseni on ett\u00e4 SARS-CoV2 -virus sel\u00e4tet\u00e4\u00e4n&nbsp;<strong>hyvin organisoidulla rekisteritutkimuksella<\/strong>, joka on&nbsp;<strong>koordinoitu maailmanlaajuisesti.<\/strong>&nbsp;Tukimustietoa tarvitaan viel\u00e4 runsaasti niist\u00e4 riskitekij\u00f6ist\u00e4, jotka altistavat COVID-19 potilaat tehohoitoon.<\/p>\n\n\n\n<p>Eri l\u00e4hteiss\u00e4 on jo tehty n\u00e4it\u00e4 COVID-19 potilaiden oireisiin liittyvi\u00e4 analyysej\u00e4 ja varsin luotettavana voisi pit\u00e4\u00e4&nbsp;<strong><a href=\"https:\/\/www.businessinsider.com\/coronavirus-serious-cases-signs-symptoms-body-aches-2020-3?r=US&amp;IR=T\">New Yorkin yliopistossa<\/a><\/strong>&nbsp;tehty\u00e4 analyysi\u00e4 niist\u00e4 oireista, jotka luotettavasti ennustivat taudin etenemist\u00e4 vaikeaan tilaan.&nbsp;<strong>ALT entsyymin kasvu (alaniiniaminotransferaasi<\/strong>)<strong>, kova lihaskipu (MYALGIA). Kolmantena selitt\u00e4v\u00e4n\u00e4 muuttujana todettiin t\u00e4ss\u00e4 tutkimuksessa olleen korkea hemoglobiiniarvo (B-Hb).&nbsp;<\/strong>ALT -arvon nousu on siin\u00e4 mieless\u00e4 mielenkiintoinen muuttuja, koska siin\u00e4 tapahtuu muutos yleens\u00e4&nbsp;<strong>hyvin varhaisessa vaiheessa<\/strong>, ennen kuin muut elimelliset oireet alkavat.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img decoding=\"async\" src=\"http:\/\/vaalit.ekqvist.fi\/wp-content\/uploads\/2020\/04\/Koronapandemia_viikko-14_1-1.png\" alt=\"\" class=\"wp-image-2459\"\/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Toimenpiteiden m\u00e4\u00e4r\u00e4ytyminen varhaisten signaalien perusteella<\/h3>\n\n\n\n<p>Mit\u00e4 hy\u00f6ty on sitten tiet\u00e4\u00e4 varhaisessa vaiheessa olevan COVID-19 sairauden kehittymist\u00e4 vaikeaan tautimuotoon? Suurin hy\u00f6ty lienee se, ett\u00e4 n\u00e4in l\u00e4\u00e4k\u00e4rit pystyv\u00e4t n\u00e4iden merkkien perusteella ryhmittelem\u00e4\u00e4n suuren joukon tartunnan saaneita ja liev\u00e4sti oirehtivia potilaita jo ennalta. Hoidon ja tarvittavan laitekapasiteetin suunnittelu helpottuu ja pystyt\u00e4\u00e4n paremmin antamaan oikea-aikaista hoitoa n\u00e4ille ryhmille.<\/p>\n\n\n\n<p><strong>Ryhmittelyanalyysit&nbsp;<\/strong>ovat varsin arkip\u00e4iv\u00e4isi\u00e4 asioita tilastoanalyysien tekij\u00f6ille. Olen itsekin n\u00e4it\u00e4 ryhmittelyit\u00e4 tehnyt suurelle potilasjoukolle ja tuolloin yll\u00e4tyin itsekin menetelm\u00e4n tehokkuudesta varsinkin, kun data-aineiston alkutilanteessa oli tarvetta tutkia kymmenien taustamuuttujien vaikutusta haluttua muuttujaa vasten. K\u00e4yt\u00e4nn\u00f6ss\u00e4 analysonti data-aineiston suhteen etenee aina tietyn proseduurin mukaan. Tarvitaan vain tieto, mit\u00e4 muuttujaa vasten halutaan saada selitt\u00e4j\u00e4muuttujien analyysi. Yleens\u00e4 t\u00e4h\u00e4n vaiheeseen osallistuu suuri joukko asiantuntijoita, joiden asiantuntemusta k\u00e4ytet\u00e4\u00e4n parvi\u00e4lytyyppisesti. Asiantuntijajoukko luo ja m\u00e4\u00e4ritt\u00e4\u00e4 reunat muuttujavalinnoille ja data-analyytikko tuottaa sitten alustavat tulokset n\u00e4iden m\u00e4\u00e4ritysten mukaisesti.<\/p>\n\n\n\n<p>On toki tullut itsellekin tilanteita vastaa, joissa t\u00e4m\u00e4k\u00e4\u00e4n l\u00e4hestymistapa ei tuota onnistunutta lopputulosta vaan joudutaan tekem\u00e4\u00e4n iteratiivista data-analyysi\u00e4 usealla eri muuttujayhdistelm\u00e4ll\u00e4. T\u00e4h\u00e4n ja muihinkin data-analyysien tekoon l\u00f6ytyv\u00e4t huikeat ty\u00f6kalut mm.&nbsp;<a href=\"https:\/\/www.r-project.org\/about.html\">R-ohjelmakirjastoista<\/a>.<\/p>\n\n\n\n<p>Datan laatu ja saanti ovat sellaisia tekij\u00f6it\u00e4, joiden kanssa data-analyytikot yleens\u00e4 taistelevat eniten ja osittain n\u00e4iden tekij\u00f6iden johdosta joudutaan tekem\u00e4\u00e4n kompromisseja. En kuitenkaan usko, ett\u00e4 t\u00e4ss\u00e4 COVID-19 potilasjoukon tarkastelussa tulisi mit\u00e4\u00e4n rekisteritutkimuslupiin liittyvi\u00e4 ongelmia, koska kaikkien etuhan on, ett\u00e4 tautiin l\u00f6ydet\u00e4\u00e4n parannuskeino ja se hy\u00f6ty, jonka rekistesteritutkimus voi asiaa kohtaan tuoda on kansanterveyden kannalta huomattavan suuri.<\/p>\n\n\n\n<p>Datan k\u00e4sittelyyn kuuluu my\u00f6s merkityksett\u00f6mien muuttujien poissulkemisia, jotta mukaan otetaan vain sellaiset muuttujat, jotka parhaiten kuvaavat selitett\u00e4v\u00e4\u00e4 muuttujaa. Poissulkemiseen l\u00f6ytyy useita menetelmi\u00e4, mutta yksinkertaisimmillaan regressiomallinnuksella p\u00e4\u00e4st\u00e4\u00e4n hyv\u00e4\u00e4n lopputulokseen. Initiaalimallin avulla haetaan maksimaalista R-arvoa, eli sellaista muuttujamixi\u00e4, joka parhaiten selitt\u00e4\u00e4 selitett\u00e4v\u00e4n muuttujan k\u00e4ytt\u00e4ytymist\u00e4 suhteessa selitt\u00e4j\u00e4muuttujiin.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Ryhmittelyanalyysi\u00e4<\/h3>\n\n\n\n<p>Suuresta joukosta regressioanalyysin muuttujaryhmist\u00e4 valitaan sitten sellaiset ryhm\u00e4t tai vain pelk\u00e4st\u00e4\u00e4n yksi muuttujaryhm\u00e4, johon voidaan kohdistaa esim. k-means -menetelm\u00e4ll\u00e4 ryhmittelyanalyysi. K-means menetelm\u00e4ss\u00e4 haetaan muuttujien havainnoista sellaisia dataryhmi\u00e4, jotka eniten \u201dmuistuttavat toisiaan\u201d tai jotka syyst\u00e4 tai toisesta ovat havaintoja samassa ryhm\u00e4ss\u00e4 vaikkakin ovat eri muuttujian havaintoja. N\u00e4iden v\u00e4lilt\u00e4 l\u00f6ytyy siis jokin yhteinen \u201dtekij\u00e4\u201d, jonka johdosta kyseiset havainnot ovat samassa ryhm\u00e4ss\u00e4. Huomautettakoon t\u00e4ss\u00e4 kohtaa, ett\u00e4 rajauksena t\u00e4ss\u00e4 olisivat vain sellaiset yksil\u00f6lliset havaintorivit, jotka kuuluvat COVID-19 diagnoosin saaneille.<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">Riskitekij\u00f6iden laajempi tarkastelu on kansallisesti ja kansainv\u00e4lisesti laajemman rekisteritutkimuksen paikka ja se voidaan tilanteen vakavuudesta riippuen kohdistaa, joko koko v\u00e4est\u00f6\u00f6n tai vain tiettyyn ennalta m\u00e4\u00e4ritettyyn riskiryhm\u00e4\u00e4n. T\u00e4st\u00e4 asiasta kerron lis\u00e4\u00e4 toisessa artikkelissani. <\/pre>\n\n\n\n<h3 class=\"wp-block-heading\">Klusterointia<\/h3>\n\n\n\n<p>Yhteisen tekij\u00e4n omaavaa havaintojoukkoa voidaan kutsua t\u00e4ss\u00e4 vaikka klustereiksi. Mik\u00e4li kysymyksess\u00e4 olisi COVID-19 potilaan havaintoaineisto, niin siin\u00e4 olisi tyypillisesti i\u00e4n ja sukupuolen lis\u00e4ksi taustamuuttujina tartunnan saantiaika, mahdollisesti v\u00e4h\u00e4oireisuusaika ja sitten tarkempaa tietoa siin\u00e4 vaiheessa, kun potilas on siirretty osastohoitoon tai mahdollisesti tehohoitoon. Tehohoidon osalta jokaisesta hoidettavasta potilaasta l\u00f6ytyy valtava m\u00e4\u00e4r\u00e4 dataa aina kehon l\u00e4mp\u00f6tilasta lukuisiin laboratorianalyyseihin verenkuvasta jne. Terveyden- ja sosiaalihuollon, Kelan reseptitietokannan rekisteritietojen yhdist\u00e4minen on my\u00f6s jossain vaiheessa oleellista, mutta t\u00e4st\u00e4kin kokonaisuudesta kirjoittelen sitten my\u00f6hemmin.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Selitett\u00e4v\u00e4n\u00e4 muuttujana vaikea COVID-19 sairaus<\/h3>\n\n\n\n<p>N\u00e4it\u00e4 muuttujajoukkoja (klustereita) voidaan ajaa sitten regressio tai neuroverkkotekniikoilla vasten selitett\u00e4v\u00e4\u00e4 muuttujaa. T\u00e4ss\u00e4 tapauksessa selitett\u00e4v\u00e4 muuttuja on yksinkertaisesti kaikki ne tapaukset, joilla ilmeni vaikea COVID-19 sairaus ja joka johti tehohoitoon tai sitten joissakin tapauksissa kuolemaan. Se klusteri, joka sai korkeamman R-arvon (selitysasteen) p\u00e4\u00e4see jatkoon eli tuohon klusteriin liittyviin havaintoriveihin (potilaisiin) kohdistetaan tutkimuksellisesti eniten panostuksia. T\u00e4m\u00e4 ryhm\u00e4 m\u00e4\u00e4ritt\u00e4\u00e4 my\u00f6s my\u00f6hemmin ns. riskiryhm\u00e4arvioinnin, joka mahdollisesti voi olla alueellisestikin erilainen eri osissa maata. Saattaa toki olla, ett\u00e4 nykyisiin riskiryhm\u00e4m\u00e4\u00e4ritelmiin ei t\u00e4m\u00e4 tutkimus toisi mit\u00e4\u00e4n uutta, mutta t\u00e4ss\u00e4 l\u00e4hestymistavassa uutuus olisikin se, ett\u00e4 riskiryhm\u00e4\u00e4n lukeutuvat pystyt\u00e4\u00e4n identifioimaan ja heille voidaan antaa r\u00e4\u00e4t\u00e4l\u00f6ityj\u00e4 ohjeistuksia miten tilanteessa kannattaa toimia.<\/p>\n\n\n\n<p>Malminkartanossa 16.4.2020, Marko Ekqvist DI, teko\u00e4lytutkija<\/p>\n\n\n\n<p>ps. mik\u00e4li artikkeli her\u00e4tti kysymyksi\u00e4, niin voit l\u00e4hett\u00e4\u00e4 kysymykset suoraan&nbsp;<a href=\"http:\/\/m.me\/vaalitmarkoekqvist\">viestipalveluun<\/a>&nbsp;tai soita numeroon +358 45 1200 944<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Tilastomatemaattisilla menetelmill\u00e4 voidaan tuottaa reaaliaikaisesta tietoa koronaviruksen aiheuttamasta taudista ja niiden avulla pystyt\u00e4\u00e4n saamaan varsin luotettavasti tietoa niist\u00e4 varhaisen vaiheen oireista, jotka ennustavat parhaiten vakavaa tautimuotoa COVID-19 sairaudesta. T\u00e4ss\u00e4 artikkelissa kuvaan pintaraapaisuna, mit\u00e4 mahdollisuuksia data-analyysit voisivat tuoda t\u00e4h\u00e4n vallitsevaan tilanteeseen. N\u00e4kemykseni on ett\u00e4 SARS-CoV2 -virus sel\u00e4tet\u00e4\u00e4n&nbsp;hyvin organisoidulla rekisteritutkimuksella, joka on&nbsp;koordinoitu maailmanlaajuisesti.&nbsp;Tukimustietoa tarvitaan viel\u00e4 runsaasti niist\u00e4 <a class=\"read-more-excerpt\" href=\"https:\/\/science.ekqvist.fi\/blogi\/covid-19\/rekisteritutkimus-ja-ryhmittelyanalyysit-apuun-taistelussa-sars-cov2-virusta-vastaan\/\">[&#8230;] Read More<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":[],"categories":[77],"tags":[],"_links":{"self":[{"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/posts\/505"}],"collection":[{"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/comments?post=505"}],"version-history":[{"count":1,"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/posts\/505\/revisions"}],"predecessor-version":[{"id":506,"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/posts\/505\/revisions\/506"}],"wp:attachment":[{"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/media?parent=505"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/categories?post=505"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/science.ekqvist.fi\/blogi\/wp-json\/wp\/v2\/tags?post=505"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}