Alkaa menemään OFFTOPICin puolelle, mutta tuo ylen artikkeli osoittaa kuinka vaikeaa perinteistä tilastotiedettä on ymmärtää.No ei kyllä tarkoita. Tuo on valitettavan yleinen ja väärä harha ja tekee virheellisen oletuksen jakaumasta. Kuten sanoin, gallupin tulos ei ole tasainen jakauma. Koska tämä sama asia tulee jatkuvasti eteen, niin laitan vaikka ulkoisen lähteen:
Mikä on virhemarginaali?
Tilastotieteilijät käyttävät tutkimuksissaan todennäköisyyslaskentaa.yle.fi
Eli jos gallup antaa puolueen kannatukseksi 20% ja virhemarginaaliksi 2% suuntaansa, on (noin) 20% kannatus paljon todennäköisempi kuin (noin) 18% tai 22% kannatus. Tai vaikka 5% tai 35% kannatus. Jälkimmäisetkin ovat mahdollisia, mutta aina vaan epätodennäköisempiä. Ehkä ihmiset tajuaisivat asian helpommin, jos tuo virhemarginaali esitettäisiin jakaumana: keskeltä korkea, reunoilta matala. Sitten siitä voi valita ihan oman luottamusvälin ja sen saa juuri niin leveäksi tai kapeaksi kuin haluaa ja avautuu ehkä helpommin että se gallupin tulos on se todennäköisin.
Ja sama käy ilmi Wikistä kun huomaat, miten jakauman pinta-ala muuttuu eri luottamusvälien (95%, 99% jne.) mukaan. Virhemarginaali on siis myös täysin riippuvainen valitusta luottamusvälistä. 99,999999% luottamusvälillä se virhemarginaali on karkeasti mitä tahansa 0 ja 100% välillä. Tai 1% luottamusvälillä se on hyvin hyvin kapea kaistale sen gallupin tuloksen ympärillä ja mikään puolue ei ole toisensa kanssa päällekäin. Yleensä käytetään 95%:a mutta myös muita tilanteesta riippuen.
Margin of error - Wikipedia
en.wikipedia.org
Kerrataan nyt vielä: Tuo on nimenomaan väärä tulkinta. Tilastoanalyysissä kannatusprosentti ei ole tilastollinen muuttuja, vaan tuntematon vakio. Ei sillä voi olla todennäköisyysjakaumaa. Se mitä luottamusväli tarkoittaa on se että jos gallup toistetaan monta kertaa ja luottamusväli lasketaan, niin 95% tapauksista luottamusväli sisältää "oikean" kannatuksen.