Tein pienen
vertailun viiden eniten tarttuneen /
nopeimmin tartunnoiltaan kasvavan Kiinan
Provinssin päivittäisten uusien tartuntojen muutoksesta peräkkäisien päivien erotuksena. Eli vertaillaan
kuinka monta uutta tartuntaa tuli eiliseen verrattuna.
EDIT: Jälkikäteen ajatellen, olisin voinut vain nimetä vaaka-akselin järkevämmin: 31.1.->1.2. = 1.2. uudet varmistetut tartuntatapaukset. Tuo yo. nimeämislogiikka tuli sen aikasarjan manipuoloinnista, pahoitteluni.
Yllä olevasta näkyy, että vielä
vanhoilla NHC:n kolmansilla
tartuntaluokittelusäännöksillä, jotka tulivat voimaan 29.1.
kasvu oli aika
tasaista päivästä toiseen,
kunnes 7.2. tulivat voimaan uudet säännökset, jotka paikallisviranomaisten mukaan
otettiin käyttöön 8.2. lukuihin. 8.2. erotus 7.2. on jo
selkeää laskua ja trendi muuttuu nopeasti alaspäin kaikkien
muiden paitsi Hubein osalta.
Lisäksi
6.2. päivän datassa on tässä aikasarjassa
vertailuvirhe, koska
6.2. ei ole käytettävissä päivän lopun dataa (Johns Hopkins -aikasarja), vaan kyseisen päivän puolivälin data, eli eroa edellisen päivän (5.2.) tartuntoihin ei ole juuri nimeksikään.
Sama outous näkyy 10.2. päivän tartuntatilastoissa, jotka ovat kyllä illalta (19:30), joskaan eivät vertailukelpoisesti yöltä (21-23) kuin aikaisempina päivinä.
Tämä siis jälleen kerran alleviivaa sitä, että
vertailu on vaikeaa, datasarjoissakin on epätäydellisyyksiä ja nämä muutokset ovat niin nopeita/isoja, että itselle on
mahdotonta todeta
varmuudella, että ne johtuvat
joko karanteenitoimien vaikutuksista (tartunnat oikeasti vähenevät)
TAI/MYÖS tartuntaluokittelutavan muutoksista (tartunnat eivät ole vähentyneet, ne ovat vain luokiteltu eri luokkaan, eivätkä näy tässä aikasarjassa).
Eli kuten joku totesi: näiden virallisten lukujen vertailu on lähes hyödytöntä, ja alan olla kohta melkein samaa mieltä. Oma tilastollinen päättely ei riitä analysoimaan ja erittelemään aikasarjasta luonnollisen kohinan, epidemian todellisen taittumisen ja aikasarjamanipulaation mahdollisia osuuksia.
Lähde tässä oli siis Johns Hopkins aikasarjat, joka on siirtynyt uuteen GitHub-osoitteeseen aikaisemmasta Google Docs -sivustosta:
Lähde:
CSSEGISandData/2019-nCoV
Nyt
tarvittaisiin aikasarjojen tilastolliseen poikkeavuustunnistamiseen erikoistunutta tekijää, löytyykö lukijoista? Aikasarjahan on vielä kovin lyhyt, mutta ehkä siitä jotain saisi irti.