Työllisyystilaston Lindströmin vakio?

Korostettakoon heti alkuun, että otsikossa mainittu henkilö Lindström ei tiettävästi ole millään tavalla sukua työministeri Jari Lindströmille vaan on todennäköisesti fiktiivinen ruotsalainen fyysikko. Opiskelutoverini yli 50 vuoden takaa muistavat varmaan Lindströmin vakion, jonka avulla saatiin fysiikan laboratoriotöiden mittaustulokset korjattua vastaamaan paremmin haluttuja ”oikeita” tuloksia. Kun hallitus on ankkuroinut toimintansa tiukasti 72 prosentin työllisyystavoitteeseen, niin on varmaan syytä tarkastella hieman lähemmin tämän työllisyysprosentin laskentaa ja mahdollista Lindströmin vakion käyttöä.

Tilastokeskuksen mukaan työllisyysprosentin laskennassa käytetään 12 000 henkilön otosta ja haastattelut suoritetaan tutkimusviikon aikana tietokoneavusteisena puhelinhaastatteluna. Otos varmaankin valitaan parhaan tilastotieteellisen tietämyksen mukaisesti mutta jo haastattelumenetelmä sisältää huomattavan virhelähteen. Kuinka moni yhteiskunnasta syrjäytynyt tulee tällä tavalla tavoitetuksi ja kuinka hän yleensä viitsii vastata kaiken maailman kyselyihin? Tästä syntyy ensimmäinen harha eli bias työllisyysestimaattiin.

Henkilön määrittely työlliseksi perustuu myös aika kummalliseen tilastolliseen kikkailuun. Työlliseksihän kyselyssä tulkitaan henkilö, joka on tutkimusviikolla tehnyt ansiotyötä vähintään tunnin rahapalkkaa tai luontaisetua vastaan tai voittoa saadakseen, tai on ollut tilapäisesti poissa työstä. Tutkimusviikolla työstä pois ollut henkilö lasketaan työlliseksi, jos poissaolon syy on äitiys- tai isyysvapaa tai oma sairaus tai jos poissaolo on kestänyt alle 3 kuukautta. Työlliset voivat olla palkansaajia, yrittäjiä tai samassa kotitaloudessa asuvan perheenjäsenen yrityksessä palkatta työskenteleviä (lähde Tilastokeskus).

Kuinka tällä tavalla muodostetusta joukosta voitaisiin estimoida oikeasti työllisten henkilöiden määrä? Ainakin laskennassa tarvitaan aika huomattavaa Lindströmin vakiota, joka pitäisi vähentää otoksen antamasta luvusta. Samanlainen harha näkyy työttömyystilastossa, jossa Tilastokeskuksen laskeman prosentin ja ELY-toimistojen tilastoiman työttömien työnhakijoiden määrän välillä on noin 2 prosenttiyksikön ero. Ainakin nämä työttömät voidaan vähentää Tilastokeskuksen ilmoittamasta työllisten määrästä, joten saadaan noin 1,5 prosenttiyksikön korjaus alaspäin. Lisäksi nk. aktivointitoimenpiteiden piirissä on henkilöitä, jotka Tilastokeskus on luokitellut työllisiksi, joten aivan hyvällä perusteella voidaan Tilastokeskuksen ilmoittamaa työllisyysprosenttia korjata alaspäin Lindströmin vakiolla 2-3 prosenttiyksikköä.

Kolmas kummallisuus työllisyystilastossa on kausi- ja satunnaistasoitus, jolla saatiin esimerkiksi helmikuun työllisyysluku 69,8 % korjattua 71,1%:ksi. Perustuuko tämä johonkin syvällisenpään tietoon talouselämän mekanismeista vai onko kyseessä vain Tilastokeskuksen standardisuodatus aikasarjoille, jossa huomioidaan mm. juhlapyhien sijoittuminen jne. Epäilen jälkimmäistä, mutta selitystä vaatii, kuinka hyvin se sopii työllisyyttä kuvaavan aikasarjan suodatukseen.

Aina kun tilastokeskukselta kysytään tilastolukujen erosta, he vastaavat, että ero johtuu menetelmästä. Tämä on tietenkin totta mutta olisi kohtuullista, että he ilmoittaisivat menetelmänsä virhemarginaalit hieman yksityiskohtaisemmin kuin vain normaalijakautumasta saadun +/- luvun. Hallituksenkin pitäisi kertoa totuus eikä vain rehvastella sillä, että tavoite on lähes saavutettu.

raimoylinen
Sitoutumaton Espoo

automaatiotekniikan professori emeritus,
systeemiteorian dosentti
"Tyhmyydelle minä olen vihainen ja äreä kuin rakkikoira, mutta viisaus ei ole kaikille annettu." "...,epäile vain, epäile vain,...”.
"Minkä ylipäänsä voi sanoa, sen voi sanoa selvästi, ja mistä ei voi puhua, siitä on vaiettava."

Ilmoita asiaton viesti

Kiitos!

Ilmoitus asiattomasta sisällöstä on vastaanotettu