Työvoimatutkimus: tilaston dokumentaatio
Tilaston perustiedot
Yleiskuvaus
Työvoimatutkimus sisältää jatkuvasti kerättäviä tietoja, joita käytetään kuukausi-, neljännesvuosi- ja vuositietoina sekä osaotokselta kysyttyjä tietoja, joita käytetään vain vuositietoina. Vuodesta 2021 alkaen osa vuositiedoista kerätään joka toinen vuosi. Työvoimatutkimukseen sisältyy myös osio, jonka aihe vaihtuu vuosittain. Aihe liittyy työmarkkinoihin, esimerkiksi nuoriin, eläkkeelle siirtymiseen, työtapaturmiin tai työn ja perheen yhteensovittamiseen. Osa aiheista toistuu säännöllisesti kahdeksan vuoden välein. Joka neljäs vuosi kysymykset liittyvät erikseen päätettävään ajankohtaiseen aiheeseen.
Työvoimatutkimuksen tietosisällöstä on kuvaus osoitteessa: https://www.stat.fi/til/tyti/tyti_2021-03-02_tlu_001.html.
Tilaston kuvaus
Työvoimatutkimus on otostutkimus, jonka avulla tilastoidaan 15–89-vuotiaan väestön työmarkkinoille osallistumista, työllisyyttä, työttömyyttä ja työaikaa kuukausittain, neljännesvuosittain ja vuosittain. Tutkimuksen tietosisältö perustuu EU:n asetukseen, ja tutkimuksen otokseen kuuluu joka kuukausi noin 12 500 henkilöä.
Vuoden 2021 alussa työvoimatutkimuksen tietosisältöä, tiedonkeruuta ja estimointimenetelmää uudistettiin. Kyselylomakkeen sisältöä yhdenmukaistettiin aikaisempaa tarkemmin eri EU-maiden välillä tietojen vertailtavuuden parantamiseksi. Tietosisältö myös laajeni, kun kyselyyn lisätiin uusia kysymyksiä mm. työajan joustavuuteen, yrittäjän asiakkaiden määrään ja sivutyön työaikaan liittyen. Lisäksi uutena ikäryhmänä tutkimukseen otettiin mukaan 75–89-vuotiaat. Tämän ikäryhmän otoskoko on pieni ja sen vuoksi ikäryhmästä ei julkaista tietoja kuukausi- ja vuosineljännestasolla. Työvoimatutkimuksen kuukausi- ja neljännesvuositiedot koskevat edelleen 15–74-vuotiaiden ikäryhmää.
Tutkimuksen tiedonkeruutapaa uudistettiin tarjoamalla vastaajille mahdollisuus vastata puhelin- ja käyntihaastattelujen lisäksi myös verkkolomakkeella. Otoksen muodostamisessa ja tulosten laskentatavassa huomioitiin uusi EU-lainsäädäntö, vastauskadon lisääntyminen ja tiedonkeruutapaan toteutetut muutokset.
Vastaajien antamien tietojen pohjalta luodaan kuva koko 15–89-vuotiaan väestön toiminnasta työmarkkinoilla yhden viikon aikana. Työmarkkina-aseman perusluokittelussa väestö jaetaan työllisiin, työttömiin ja työvoiman ulkopuolisiin. Näistä työlliset ja työttömät yhdessä muodostavat työvoiman.
Tutkimus on paneelitutkimus, jossa samaa henkilöä haastatellaan viisi kertaa. Haastattelut tehdään kolmen kuukauden välein, paitsi neljäs haastattelu, joka tehdään kuuden kuukauden kuluttua kolmannesta haastattelusta. Ensimmäisen ja viimeisen haastattelun väli on 15 kuukautta. Tutkimuksen tietosisältö vaihtelee eri tutkimuskerroilla. Ensimmäisellä tutkimuskerralla kysytään tarkemmin joitakin perustietoja, joiden ennallaan pysyminen tarkistetaan seuraavilla tutkimuskerroilla. Viimeisellä eli viidennellä tutkimuskerralla tietosisältö on laajempi, ja perustutkimuksen lisäksi kyselyyn kuuluu myös kotitalousosa ja osio, jonka aihe vaihtuu vuosittain. Kotitaloushaastattelun aikana selvitetään kohdehenkilön kotitalouden jäsenet sekä kotitalouteen kuuluvien 15–89-vuotiaiden toiminta työmarkkinoilla. Jotta aineisto kuvaisi koko väestöä, siihen on lisätty ylimääräisen otoksen avulla myös sellaisia kotitalouksia, joiden kaikki jäsenet ovat 90 vuotta täyttäneitä. Alle 15-vuotiaita lapsia ja yli 89-vuotiaita ei työvoimatutkimuksessa haastatella, vaan heille luodaan muutamia työmarkkina-asemaa kuvaavia tietoja rekisteritietojen perustella. Haastattelutietojen lisäksi tietoja saadaan Tilastokeskuksen käytössä olevista hallinnollisista rekistereistä mm. tutkintorekisteristä ja verorekisteristä.
Tilaston perusjoukko
Tutkimuksessa ikä määritellään haastatteluajankohdan todellisen iän mukaan. Puolentoista vuotta kestävän tutkimuksen aikana iäkkäimmät henkilöt jäävät pois tutkimuksesta täytettyään 90 vuotta. Korvaamaan poistuvia henkilöitä otokseen poimitaan 14-vuotiaita, jotka tulevat mukaan vasta täytettyään 15-vuotta.
Työvoimatutkimuksen otos poimitaan ositetulla systemaattisella otannalla väestön keskusrekisteriin perustuvasta Tilastokeskuksen väestötietokannasta kahdesti vuodessa. Ositteiden muodostamisessa käytetään NUTS1-jakoa ja ikätietoa. Ositteet ovat: Manner-Suomi (15–74-vuotiaat), Ahvenanmaan maakunta (15–74-vuotiaat) ja 75–89-vuotiaiden ikäryhmä. Ahvenanmaan väestöstä poimitaan väestöosuuteen nähden kaksinkertainen otos. Otantakehikko on lajiteltu ositteissa kotipaikkatunnuksen mukaan eli otos jakautuu alueellisesti samoin kuin perusjoukko (maantieteellisesti itsepainottuva otos). Puolivuotisotokseen poimitaan kaikkiaan 15 600 henkilöä:
Manner-Suomi (15–74-vuotiaat): 14 800
Ahvenanmaan (15–74-vuotiaat): 200
75–89-vuotiaat: 600.
Puolivuotisotos jaetaan tasaisesti kuukausiotoksiin. Joka kuukauden otokseen kuuluu noin 12 500 henkilöä, keskimäärin noin joka 370. henkilö perusjoukosta.
Suurimmassa osassa Euroopan maita työvoimatutkimuksen tiedonkeruu perustuu kotitalousotokseen, mikä tarkoittaa sitä, että haastatellaan samalla kertaa kaikki tietyssä osoitteessa asuvat saman kotitalouden jäsenet. Suomen lisäksi vain Ruotsissa, Tanskassa ja Sveitsissä otos on henkilöpohjainen, eli haastateltavana on vain otokseen poimittu kohdehenkilö. EU:n asetus kuitenkin edellyttää tietoja myös kotitaloudesta, ja Suomessa tämä on ratkaistu hyödyntämällä työvoimatutkimuksen paneeliominaisuutta.
Tilastoyksikkö
Mittayksikkö
Viiteajankohta
Kuukausi-, neljännesvuosi- ja vuositulokset kuvaavat tilannetta ko. tutkimusjakson ”keskimääräisellä” viikolla. Työpanosta koskevat tiedot ovat jaksojen tulosten summia.
Viitealue
Kattavuus
Ajallinen kattavuus
Jakelutiheys
Julkaistavat tiedot ovat lopullisia. Ainoastaan kausitasoitus muuttaa hieman viimeisimpiä kausitasoitettuja kuukausituloksia. Kuukausitiedot julkaistaan noin kolmen viikon kuluttua tutkimuskuukauden päättymisestä. Neljännesvuositiedot julkaistaan samanaikaisesti kunkin vuosineljänneksen viimeisen kuukauden tietojen kanssa. Neljännesvuositiedot ovat tilastollisesti kuukausitietoja luotettavampia ja sisältävät yksityiskohtaisempia tietoja, muun muassa työllisyys- ja työpanostiedot toimialoittain sekä tarkempia.
Yksityiskohtaisimmat tulokset julkaistaan vuositilastossa. EU:n tilastovirastolle, Eurostatille, toimitetaan neljännesvuosittain aineisto, josta laaditaan EU:n jäsenmaita koskevia tilastoja.
Käsitteet
Ammatti
Ammattiasema
Ei työssä, koulutuksessa eikä asevelvollisuutta suorittamassa olevien nuorten osuus
Tilastokeskuksen työvoimatutkimuksen luku eroaa hieman Eurostatin käyttämästä lähes vastaavasta NEET-asteesta (NEET rate). NEET on lyhenne määritelmästä "Not in Employment, Education or Training" eli "ei työssä, tutkintoon johtavassa koulutuksessa eikä kurssikoulutuksessa". Eurostatin julkaisema luku perustuu aineistoon, jossa varusmies- tai siviilipalveluksessa olevat nuoret eivät ole mukana perusjoukossa.
Ei-työllinen
Iltatyö
Julkinen sektori
Kokoaikatyö
Lomautettu
Määräaikainen työ
Osa-aikatyö
Palkansaaja
Pitkäaikaistyötön
Päätyö
Sairauspäivä
Sivutyö
Sivutyöaste
Sopimuksen mukainen viikkotyöaika
Sosioekonominen asema
Tavanomainen viikkotyöaika
Tehdyt työtunnit vuodessa
Tehty viikkotyöaika
Tehty vuosityöaika
Toimiala
Työllinen
Työllisyysaste
Työnantajasektori
Työnantajayrittäjä
Työssä olleet/ työstä poissa olleet
Työssäoloaste
Työttömyysaste
Työtön
Työvoima
Työvoiman ulkopuolella olevat
Työvoimaosuus
Vuokratyö
Vuorotyö
Vuosityöaika
Yksinäisyrittäjä
Yksityinen sektori
Ylityö
Ylityöaste
Yrittäjä
Yrittäjäperheenjäsen
Yötyö
Tarkkuus, luotettavuus ja oikea-aikaisuus
Tarkkuus ja luotettavuus yleisesti
Työvoimatutkimuksen lukujen luotettavuuteen vaikuttavat mittausvirheet, otannasta aiheutuva vastauskato sekä satunnaisvaihtelu. Mittausvirheitä voi syntyä siitä, että kysymyksiä voidaan ymmärtää ja tulkita eri tavoin tai että vastaajat jättävät kertomatta jotain. Mittausvirheitä pyritään vähentämään haastattelijakoulutuksen sekä lomakkeen testauksen avulla.
Vastauskato voidaan jakaa yksikkö- ja erä- eli osittaiskatoon. Yksikkökato tarkoittaa, että otoshenkilöltä ei saada lainkaan haastattelua esimerkiksi kieltäytymisen tai tavoittamattomuuden takia. Yksikkökatoa voidaan korjata painokertoimien avulla. Eräkadolla taas tarkoitetaan kysymyskohtaista katoa. Tällöin haastattelu on saatu, mutta joissakin kysymyksissä esiintyy puutteita esimerkiksi haastattelun keskeytymisen tai vastaushaluttomuuden vuoksi.
Otannasta aiheutuvalla satunnaisvaihtelulla tarkoitetaan sitä, että eri otoksista lasketut luvut poikkeaisivat jonkin verran toisistaan. Arvioitaessa karkeasti otannasta aiheutuvan satunnaisvaihtelun suuruutta erilaisissa tilanteissa on pääperiaatteena, että lukuihin sisältyy sitä vähemmän otannasta aiheutuvaa epävarmuutta, 1) mitä suuremman otoksen pohjalta luvut on laskettu ja 2) mitä suurempaa väestöryhmää luvut kuvaavat. Esimerkiksi neljännesvuotta koskevat luvut ovat tarkempia kuin samaa asiaa koskevat kuukausiluvut, koska neljännesvuositiedot on saatu haastattelemalla kolminkertainen määrä henkilöitä verrattuna kuukausitietoihin. Koko vuotta koskevat luvut ovat kaikkein tarkimpia. Jälkimmäinen periaate tarkoittaa sitä, että samankokoisella otoksella saadut työllisten ja työttömien lukumäärää koskevat luvut eli estimaatit ovat sitä tarkempia, mitä suurempaa osaryhmää ne koskevat. Tarkasteltavan osaryhmän pienentyessä otannasta aiheutuvan satunnaisvaihtelun osuus kasvaa. Tämän vuoksi esimerkiksi työttömien lukumäärät eri ikäryhmissä tai eri alueilla eivät ole yhtä luotettavia kuin kaikkien työttömien lukumäärä.
Työvoimatutkimuksen estimaattien laatua arvioidaan vuosittain ja julkaistaville estimaateille asetetaan rajat. Rajojen avulla estimaattien käytöstä varoitetaan tai ne peitetään julkaistavissa tiedoissa. Neljännes- ja vuosiestimaattien julkistamisessa noudatamme Eurostatin ohjetta. Alle 3000 henkilön estimaatit peitetään taulukoissa automaattisesti pisteellä (.) ja alle 7000 henkilön estimaatista varoitetaan. Rajat koskevat pyöristämättömiä lukuja ja näiden lukujen pohjalta laskettuja prosenttiosuuksia.
Kuukausitasolla estimaattien rajat, 7000 ja 20 000 henkilöä, on määritelty Tilastokeskuksen menetelmäyksikössä. Kuukausitasolla peitettävät alle 7000 henkilön estimaatit perustuvat korkeintaan noin 10 henkilön vastauksiin ja ne eivät ole sen vuoksi luotettavia. Alle 20 000 henkilön estimaatit, joista varoitetaan, perustuvat korkeintaan noin 30 henkilön vastauksiin.
Oikea-aikaisuus
Täsmällisyys
Tietojen revisioituminen
Otantavirhe
Keskivirheen avulla voidaan laskea virhemarginaali eli luottamusväli, jolla haettu perusjoukon arvo sijaitse tietyllä todennäköisyydellä (usein 95 % luottamusväli) ja suhteellinen keskivirhe. Luottamusväli kuvaa sitä, kuinka laajalla alueella perusjoukon todellinen parametrin arvo on suhteessa otoksesta laskettuun estimaattiin. Luottamusväliä laskettaessa kiinnitetään haluttu riskitaso. Työvoimatutkimuksessa käytetty 5 prosentin riskitaso tarkoittaa sitä, että jos otosten ottamista toistettaisiin, parametrin todellinen arvo osuisi 95 tapauksessa sadasta luottamusvälin sisään ja jäisi 5 tapauksessa sadasta sen ulkopuolelle.
Työvoimatutkimuksessa käytetty 95 prosentin luottamusväli on väli, jolla kiinnostuksen kohteena olevan ominaisuuden todellinen arvo sijaitsee 95 prosentin todennäköisyydellä. Jos esimerkiksi tietyn kuukauden työttömien määrän estimaatti on 230 000 ja sen keskivirhe 7 700, on työttömien määrän 95 prosentin luottamusväli 230 000 ± 15 100 eli 214 900–245 100 henkeä. Estimaattiin lisättävä ja siitä vähennettävä osa saadaan kertomalla estimaatin keskivirhe 95 prosentin luottamusvälin kertoimella 1,96. Tämä osa kuvaa otannasta aiheutuvaa epävarmuutta ja sitä kutsutaan estimaatin virhemarginaaliksi.
Suhteellinen keskivirhe (variaatiokerroin) on keskivirheen prosenttiosuus estimaatista. Keskivirheen suhteuttaminen estimaatin kokoon poistaa muuttujan mittakaavasta aiheutuvan vaikutuksen. Tämän ansiosta eri muuttujien suhteellisen keskivirheen arvoja tai saman muuttujan keskivirheen arvoja eri osajoukoissa on helppo verrata keskenään.
Esimerkkejä työllisten ja työttömien kuukausiestimaattien tarkkuudesta osaryhmän koon mukaan:
Kuukausiestimaatti |
Kuukausiestimaatin virhemarginaalit, 95 %:n luottamusväli | Keskivirhe | Suhteellinen keskivirhe | |
Henkilöä | Henkilöä | Henkilöä | % | |
Työlliset | 2 400 000 | ± 29 000 | 14 800 | 0.6 |
1 200 000 | ± 22 400 | 11 400 | 1.0 | |
600 000 | ± 16 300 | 8 300 | 1.4 | |
300 000 | ± 12 400 | 6 300 | 2.1 | |
100 000 | ± 7 100 | 3 600 | 3.6 | |
50 000 | ± 5 100 | 2 600 | 5.2 | |
10 000 | ± 3 200 | 1 600 | 16.0 | |
Työttömät | 230 000 | ± 23 600 | 12 000 | 5.2 |
120 000 | ± 16 700 | 8 500 | 7.1 | |
90 000 | ± 14 600 | 7 400 | 8.2 | |
60 000 | ± 12 400 | 6 300 | 10.5 | |
30 000 | ± 9 800 | 5 000 | 16.7 | |
20 000 | ± 7 900 | 4 000 | 20. 0 | |
10 000 | ± 5 600 | 3 000 | 30.0 |
Katovirhe
Kaikilta otokseen valituilta henkilöiltä ei saada vastausta, sillä joitakin henkilöitä ei koskaan tavoiteta ja monet kieltäytyvät vastaamasta tutkimukseen. Tätä kutsutaan vastauskadoksi. Vastauskato on yleistynyt viime vuosina. Estimointi perustuu vain vastanneisiin henkilöihin, joita on vastauskadon vuoksi vähemmän. Silloin virhemarginaali kasvaa ja luottamusvälit levenevät. Vastauskato pyritään ottamaan huomioon estimoinnissa, esimerkiksi uudelleenpainotusmenetelmillä kalibrointiestimaattorin avulla. Taulukossa on esitetty tietoja työvoimatutkimuksen otoksesta ja vastauskadosta.
Työvoimatutkimus, otoskoko ja vastauskato, 15-74-vuotiaat:
2016 | 2017 | 2018 | 2019 | 2020 | 2021 | |
Otos | 147365 | 147495 | 147384 | 147183 | 147304 | 147548 |
Ylipeitto | 2272 | 2061 | 1994 | 1827 | 1759 | 1570 |
Ylipeitto, osuus otoksesta, % | 1.5 | 1.4 | 1.4 | 1.2 | 1.2 | 1.1 |
Otos pl. ylipeitto | 145093 | 145434 | 145390 | 145356 | 145545 | 145978 |
Vastanneet | 100940 | 97881 | 95301 | 91086 | 86247 | 75942 |
Nettokato | 44153 | 47553 | 50087 | 54270 | 59298 | 69541 |
Kieltäytyneet | 26241 | 27408 | 29256 | 29994 | 29044 | 33888 |
Ei tavoitettu | 17511 | 19719 | 20289 | 23708 | 29881 | 34948 |
Muu kato | 401 | 426 | 542 | 568 | 373 | 670 |
Vastausosuus, % | 68.5 | 66.4 | 64.7 | 61.9 | 58.6 | 51.5 |
Nettokato, % | 30.0 | 32.7 | 34.5 | 37.3 | 40.7 | 47.6 |
Käsittelyvirhe
Virheet korjataan ja niistä tiedotetaan käyttäjille mahdollisimman nopeasti. Tilastokeskus kertoo merkittävistä virheistä samassa laajuudessa ja samoja kanavia käyttäen kuin varsinaisten tietojen julkistamisessa.
Korjattuihin tilastojulkistuksiin lisätään merkintä korjauksesta sekä tieto korjauksen ajankohdasta. Mikäli mahdollista, myös alkuperäinen, virheellinen tieto jätetään näkyviin.
Tilastoissa esiintyvät kirjoitus- ja muut muotovirheet korjataan mahdollisimman nopeasti ja joustavasti, eikä niistä tehdä erillistä merkintää verkkosivuille.
Tilastotietokantoihin tehtävistä muutoksista uutisoidaan Muutoksia tietokannassa -sivulla. Tilastotietokannoissa ylläpidetään vain tuoreimpia tietoja.
Myös aikataulupoikkeamat lasketaan virhetilanteiksi. Mikäli tilastotiedon julkistaminen myöhästyy merkittävästi ilmoitetusta ajankohdasta, ilmoitetaan myöhästymisestä Tilastokeskuksen kotisivulla.
Vertailukelpoisuus
Johdonmukaisuus ja vertailukelpoisuus
Maantieteellinen vertailukelpoisuus
Tutkimuksessa käytetyt käsitteet ja määritelmät noudattavat YK:n kansainvälisen työjärjestön ILO:n suosituksia ja Euroopan unionin tilastotoimen asetuksia, joten tilaston tiedot ovat kansainvälisesti vertailukelpoisia ja kattavat koko Suomen.
Ajallinen vertailukelpoisuus
Alkuun tietosisällöltään melko suppean tutkimuksen tiedot kerättiin postikyselynä. Vuonna 1976 tietosisältö laajeni ja menetelmää uudistettiin. Vuosina 1977–1993 tutkimus koostui kuukausitiedustelusta sekä sitä täydentävästä erillisestä puhelimitse tehdystä vuosihaastattelusta. Kuukausitiedustelun tiedonkeruu muutettiin vuonna 1983 postikyselystä puhelinhaastatteluksi, minkä ansiosta vastauskato pieneni noin 30 prosentista 4 prosenttiin.
Suomen liityttyä Euroopan unioniin työvoimatutkimus harmonisoitiin Euroopan unionin yhteiseen työvoimatutkimukseen. Aluksi vuosina 1995–1998 EU-työvoimatutkimuksen tiedot kerättiin erillisenä haastattelututkimuksena keväisin maalis–toukokuussa. Kuukausitutkimus uudistettiin asteittain vastaamaan EU-työvoimatutkimusta. Vuonna 1997 kuukausitutkimuksen sisältö laajentui, tiedonkeruu muuttui tietokoneavusteiseksi puhelinhaastatteluksi (CATI) sekä käsitteet ja määritelmät yhdenmukaistettiin vastaamaan entistä paremmin Euroopan unionin ja YK:n työjärjestön ILO:n ohjeita ja suosituksia. Työttömän määritelmää tarkistettiin vielä toukokuussa 1998 ja julkaistut aikasarjat korjattiin vuodesta 1989 alkaen taannehtivasti uudistettujen määritelmien mukaisiksi.
Työnhaun aktiivisuus tulkittiin v.1997 alkupuolella EU: n ja ILO: n suosituksia väljemmin, kun kysymyksessä oli työnhaku työvoimatoimiston kautta. Ajalla 1.1.1997 - 30.4.1997 aktiiviseksi työnhauksi hyväksyttiin asiointi työvoimatoimiston kanssa 6 kuukauden aikana. Sen jälkeen asioimisväliä tiukennettiin 3 kuukauteen (ajalla 1.5.1997 -30.4.1998). 1.5.1998 siirryttiin tiukkaan EU:n ja ILO:n neljän viikon kriteerin työnetsinnässä kaikkien työnetsintätapojen osalta.
Huhtikuussa 1999 työvoimatutkimuksen tietosisältö laajeni edelleen, kun kuukausitutkimus ja EU-työvoimatutkimus yhdistyivät yhdeksi jatkuvaksi työvoimatutkimukseksi. Vuodesta 1999 lähtien työvoimatutkimuksen yhteydessä tehtiin EU-maiden yhteinen ad hoc -lisätutkimus, jonka aihe vaihteli vuosittain. Vuoden 2000 alusta siirryttiin jatkuvaan tietokeruuseen, jossa kaikki vuoden viikot ovat tutkimusviikkoja. Aiemmin kunkin kuukauden tiedot kerättiin yhdeltä tutkimusviikolta, yleensä kuukauden keskimmäiseltä viikolta. Jatkuvaan tutkimusviikkoon siirtyminen vaikutti työpäivä- ja työtuntitietoihin, minkä vuoksi ne eivät ole vuodesta 2000 eteenpäin täysin vertailukelpoisia aiempiin tietoihin. Vaikutukset työllisten määrää kuvaaviin lukuihin jäivät Tilastokeskuksessa tehdyn selvityksen mukaan pieniksi (Työvoimatilasto 2000).
Vuodesta 2003 alkaen tutkimuksen tietosisältö laajeni osaotokselta kerättävällä kotitalousosalla. Vuonna 2008 otettiin käyttöön uusi tiedonkeruulomake: tutkimuksen tietosisältö muuttui hieman ja osa tiedoista siirryttiin keräämään osaotokselta, jolta kerättyjä tietoja käytetään vain vuositietoina. Myös joidenkin käsitteiden määritelmät muuttuivat. Uudistukset perustuivat EU:n asetuksiin, ja niillä pyrittiin parantamaan EU-maiden työvoimatilastojen vertailtavuutta.
Vuoden 2021 alussa työvoimatutkimuksen tietosisältöä, tiedonkeruuta ja estimointimenetelmää uudistettiin. Kyselylomakkeen sisältöä yhdenmukaistettiin aikaisempaa tarkemmin eri EU-maiden välillä tietojen vertailtavuuden parantamiseksi. Tietosisältö myös laajeni, kun kyselylomakkeelle lisätiin uusia kysymyksiä. Tärkeimmät muutokset koskevat kysymyksiä työajasta ja sitä, milloin henkilö määritellään työlliseksi. Jatkossa esimerkiksi vanhempainvapaalla olevat, jotka saavat ansiosidonnaista tukea, luokitellaan työllisiksi poissaolon pituudesta riippumatta.
Lisäksi uutena ikäryhmänä tutkimukseen otettiin mukaan 75–89-vuotiaat. Tämän ikäryhmän otoskoko on pieni ja sen vuoksi ikäryhmästä ei julkaista tietoja kuukausi- ja vuosineljännestasolla. Työvoimatutkimuksen kuukausi- ja neljännesvuositiedot koskevat edelleen 15–74-vuotiaiden ikäryhmää.
Tutkimuksen tiedonkeruutapaa uudistettiin tarjoamalla vastaajille mahdollisuus vastata puhelin- ja käyntihaastattelujen lisäksi myös verkkolomakkeella.
Otoksen muodostamisessa ja tulosten laskentatavassa huomioitiin uusi EU-lainsäädäntö, vastauskadon lisääntyminen ja tiedonkeruutapaan toteutetut muutokset. Aikasarjat vuosilta 2009-2020 korjattiin taannehtivasti uuden estimointimenetelmän mukaisiksi.
Tilastojen välinen yhtenäisyys
Euroopan unionin tilastoviraston, Eurostatin, julkaisemat Suomen työvoimatutkimuksen tulokset eroavat Suomessa julkaistuista siten, että asevelvolliset eivät ole lainkaan mukana Eurostatin tiedoissa. Useimmissa EU-maissa asevelvolliset eivät kuulu työvoimatutkimuksen kohdejoukkoon eli yksityisissä kotitalouksissa asuvaan väestöön. Tämä aiheuttaa eroja etenkin 15–24-vuotiaita koskeviin tuloksiin. Suomen julkaisemissa luvuissa asevelvollisuutta suorittavat ovat mukana työvoiman ulkopuolisessa väestössä. Joissain tapauksissa eroja voi tulla siitä, että Eurostatin luvuissa on mukana koko yksityisissä kotitalouksissa asuva väestö iästä riippumatta ja Suomessa 15–74-vuotias väestö.
Myös työ- ja elinkeinoministeriö julkaisee tietoja työttömistä työnhakijoista. Työ- ja elinkeinoministeriön tiedot perustuvat rekisteripohjaiseen työnvälitystilastoon, joka kuvaa kuukauden viimeistä arkipäivää. Työnvälitystilaston työttömyyden määrittely perustuu lainsäädäntöön ja hallinnollisiin määräyksiin, minkä vuoksi tilastotiedot eivät ole kansainvälisesti vertailukelpoisia. Työnvälitystilastossa työttömältä ei edellytetä yhtä aktiivista työnhakua kuin työvoimatutkimuksessa. Myös opiskelijoiden hyväksymisessä työttömiksi on eroja. Tietoja tilastojen välisistä eroista on selitetty tarkemmin täällä.
Yhtenäisyys kansantalouden tilinpidon kanssa
Lähdeaineistot ja tiedonkeruut
Lähdeaineistot
tiedot kerätään puhelinhaastatteluilla ja osin käyntihaastatteluilla sekä vuodesta 2021 alkaen verkkokyselomakkeella. Samaa vastaajaa haastatellaan kaikkiaan viisi kertaa.
Tiedonkeruumenetelmä
Haastattelu tehdään pääsääntöisesti haastateltavalle itselleen. Jos haastateltavaa itseään ei ole mahdollista haastatella, pyritään haastattelutiedot kysymään ns. sijaisvastaajalta. Sijaisvastaajana voidaan käyttää haastateltavan puolisoa / avopuolisoa, vanhempia ja 15 vuotta täyttänyttä lasta tai sisarta / veljeä. Näiden tulee asua samassa kotitaloudessa kuin haastateltava.
Työvoimatutkimuksen tiedonkeruussa käytetään jatkuvaa tutkimusviikkoa. Tämä tarkoittaa haastattelujen jakamista tasaisesti vuoden kaikkien viikkojen kesken. Työvoimatutkimuksen lomakkeen kysymykset koskevat pääosin tiettyä tutkimusviikkoa. Osassa kysymyksistä viiteajankohtana käytetään neljää viimeksi kulunutta viikkoa (esim. ilta-, yö- ja viikonlopputyö, koulutuskysymykset). Lomakkeen kysymysten avulla kartoitetaan vastaajan toimintaa tutkimusviikolla. Vastaajan työmarkkina-asema määräytyy usean eri kysymyksen perusteella.
Tutkimus on paneelitutkimus, jossa samaa henkilöä haastatellaan viisi kertaa. Haastattelut tehdään kolmen kuukauden välein, paitsi neljäs haastattelu, joka tehdään kuuden kuukauden kuluttua kolmannesta haastattelusta. Ensimmäisen ja viimeisen haastattelun väli on 15 kuukautta. Yhden tutkimuskuukauden otos koostuu viidestä rotaatioryhmästä, jotka ovat tulleet tutkimukseen mukaan eri aikoina. Otos vaihtuu asteittain siten, että kolmena peräkkäisenä kuukautena vastaamisvuorossa ovat eri henkilöt. Peräkkäisinä vuosineljänneksinä vastaajista 3/5 on samoja. Peräkkäisten vuosien otosten päällekkäisyys on 2/5. Tietoja kerätään kaikilta vuoden viikoilta.
Suurimmassa osassa Euroopan maita työvoimatutkimuksen tiedonkeruu perustuu kotitalousotokseen, mikä tarkoittaa sitä, että haastatellaan samalla kertaa kaikki tietyssä osoitteessa asuvat saman kotitalouden jäsenet. Suomen lisäksi vain Ruotsissa, Tanskassa ja Sveitsissä otos on henkilöpohjainen, eli haastateltavana on vain otokseen poimittu kohdehenkilö. EU:n asetus kuitenkin edellyttää tietoja myös kotitaloudesta, ja Suomessa tämä on ratkaistu hyödyntämällä työvoimatutkimuksen paneeliominaisuutta.
Haastattelun keskimääräinen kesto oli noin 3-5 minuuttia. Tilastokeskuksen haastattelijat keräävät tiedot tietokoneavusteisilla puhelinhaastatteluilla. Vuonna 2021 työvoimatutkimuksessa haastateltiin noin 76 000 henkilöä. Tutkimuksen vastausosuus oli keskimäärin 52 prosenttia.
Tiedonkeruun tiheys
Menetelmät
Tiedon käsittely
Aluksi muodostetaan asetelmapainot käyttäen hyväksi henkilön otokseen sisältymistodennäköisyyttä. Tämän jälkeen hyväksytyn otoksen asetelmapainoille tehdään kato- ja kehikkovirheen oikaisu käyttäen jälkiositusta. Oikaisu tehdään korvaamalla otoskoko vastanneiden määrällä, oletuksena että katotapaukset ovat täysin satunnainen osajoukko otoksesta.
Työvoimatutkimuksen estimointimenetelmä perustuu painojen kalibrointiin, jossa alkuperäisiä otosasetelmasta laskettuja otospainoja muokataan regressiomallin avulla siten, että halutut väestöjakaumat saadaan oikeiksi. Otostason tietojen perusteella vastauskatokorjatut painot kalibroidaan CALMAR2-ohjelmalla vastaamaan tutkimuskuukautta edeltävän kuukauden perusjoukon keskeisiä väestöjakaumia. Menettelyllä pyritään pienentämään kadon valikoivuuden aiheuttamaa harhaa ja tuottamaan mahdollisimman tarkkoja estimaatteja tärkeimmille muuttujille. Vuoden 2021 alusta aineiston painojen kalibroinnissa käytettään seuraavia tietoja:
• ikäryhmät
• sukupuoliryhmät
• alue (maakuntajako, jossa pääkaupunkiseutu erikseen)
• kieli
Kalibroinnissa käytetään aputietoina myös työ- ja elinkeinoministeriön työnhakijarekisteriä, tilastokeskuksen tutkintorekisteriä ja verohallinnon tulorekisteriä.
Työvoimatutkimuksen luvut, kuten kaikki otostutkimuksilla saadut luvut ovat niin kutsuttuja estimaatteja. Estimaatti on matemaattisella menettelyllä (estimoinnilla) otoshavaintoja käyttäen saatu arvio perusjoukon ominaisuudesta. Esimerkiksi tietyn kuukauden julkaistu työttömien lukumäärä on tällaisella menettelyllä saatu Suomen 15–74-vuotiaiden työttömien lukumäärää koskeva arvio eli estimaatti.
Vuodesta 2021 alkaen neljännesvuosiestimaattien laskennassa käytetään neljännesvuosipainoa, joka on laskettu skaalaamalla kyseisen vuosineljänneksen kunkin kuukauden kuukausipaino vuosineljänneksen keskiväestömäärään ja suhteuttamalla kuukauden tutkimusviikkojen lukumäärään. Vuosiestimaatit ovat neljännesvuosiestimaattien keskiarvoja.
Estimaattien tarkkuutta arvioidaan niiden keskivirheen avulla. Keskivirhe (otosvarianssin neliöjuuri) ilmaisee sen, kuinka tiiviisti havainnoista estimoitu parametrin arvo on keskittynyt mitattavan perusjoukon parametrin ympärille. Keskivirheen suuruuteen vaikuttavat otosasetelma, havaintojen lukumäärä tarkasteltavassa kokonais- tai osajoukossa, tutkimusmuuttujan jakaumasta aiheutuva vaihtelu sekä laskentakaavan ominaisuudet.
Aineiston/datan validointi
Julkaistavan tilastotiedon laatu varmennetaan mm. katotarkasteluilla, vertailuilla työ- ja elinkeinoministeriön tietoihin ja vastaavan ajankohdan tuloksiin edellisenä vuonna. Tämän lisäksi Eurostat validoi ja tarkastaa neljänneksittäin saapuneen aineiston yksityiskohtaisesti.
Kausitasoitus
Pitkän aikavälin kehityksen suunta sekä suhdannevaihtelu ovat paremmin havaittavissa trendistä kuin tasoittamattomista kuukausiluvuista. Käytetystä menetelmästä johtuen trendin viimeisimmät luvut muuttuvat jonkin verran, kun seuraavan kuukauden tiedot liitetään mukaan aikasarjaan. Kausitasoitettuja sarjoja ja trendisarjoja käytettäessä on syytä huomata, että Tramo/Seats-menetelmässä viimeisimmät kuukaudet perustuvat osittain mallipohjaisiin ennusteisiin, joten niiden pohjalta tehtävissä päätelmissä on noudatettava erityistä varovaisuutta.
Aikasarjojen trendikomponentit on laskettu kesäkuusta 2007 alkaen EU:n tilastoviraston Eurostatin suosittelemalla Tramo/Seats -menetelmällä. Käytetystä menetelmästä johtuen trendin viimeisimmät luvut muuttuvat jonkin verran, kun seuraavan kuukauden tiedot liitetään mukaan aikasarjaan. Kausitasoitettuja sarjoja ja trendisarjoja käytettäessä on syytä huomata, että Tramo/Seats-menetelmässä viimeisimmät kuukaudet perustuvat osittain mallipohjaisiin ennusteisiin, joten niiden pohjalta tehtävissä päätelmissä on noudatettava erityistä varovaisuutta. Trendistä ja sen käytön rajoituksista on kerrottu tarkemmin osoitteessa: http://tilastokeskus.fi/til/tyti/men.html.
Eurostat julkaisee kuukausittain EU-maiden kausitasoitetut sarjat ja joidenkin maiden, mukaan lukien Suomi (Saksa, Alankomaat, Ruotsi, Islanti ja Itävalta), trendiluvut. Eurostatin ja tilastokeskuksen trendiluvut mm. työttömyysasteet, eroavat toisistaan eri menetelmätavan takia.
Menetelmädokumentointi
Periaatteet ja linjaukset
Organisaatio
Organisaatioyksikkö
Yhteiskuntatilastot
Lainsäädäntö ja muut sopimukset
Lisätietoja: Tilastolainsäädäntö
Tietosuojaperiaatteet
Lisätietoja: Tietosuoja | Tilastokeskus (stat.fi)
Tietosuoja ja -turva tietoja käsiteltäessä
Tietosuojaseloste on nähtävissä osoitteessa: https://www.stat.fi/meta/tietosuojaselosteet/tietosuojaseloste_tyovoimatutkimus.html.
Julkistamispolitiikka
Lisätietoja: Tilastojen julkistamisperiaatteet Tilastokeskuksessa
Tietojen jakaminen
Työvoimatutkimuksen vuosineljännestietoja käytetään Tilastokeskuksen kansantalouden tilinpidossa.
Saatavuus ja selkeys
StatFin-tietokannassa julkaistavien tilastotietojen rinnalla verkkopalvelussa julkaistaan yleensä tiedote keskeisimmistä tiedoista. Jos julkistus sisältää useamman viiteajankohdan tietoja (esim. kuukausi- ja vuositietoja), julkistetaan verkkopalvelussa näiden tiedot yhteen kokoava katsaus. Sekä tiedotteeseen että katsaukseen listataan julkaisuhetkellä päivittyneet tietokantataulukot. Tilastotietoja voidaan julkaista joissain tapauksissa myös pelkkinä tietokantajulkistuksina StatFin-tietokannassa. Näiden niin kutsuttujen tietokantajulkistusten yhteydessä ei julkaista tiedotetta tai katsausta.
Tiedotteet ja tietokantataulukot julkaistaan kolmella kielellä, suomeksi, ruotsiksi ja englanniksi. Tiedotteiden kieliversiot voivat olla suomenkielistä suppeampia.
Julkistuksiin ja tietokantataulukoihin liittyvistä aikataulumuutoksista ja korjauksista viestitään muutostiedotteilla verkkopalvelussa.
Työvoimatutkimuksen tulokset julkaistaan Suomen virallisen tilaston Työmarkkinat -sarjassa. Keskeisimmät kuukausi- ja neljännesvuosi- ja vuositulokset julkistetaan määräpäivinä Internetissä työvoimatutkimuksen kotisivulla https://www.stat.fi/tilasto/tyti. Kotisivun linkeistä löytyvät muun muassa tilaston kuvaus, käsitteet ja määritelmät sekä työvoimatutkimuksen maksuttomat tilastotietokantataulukot (StatFin). Tietoja on saatavissa internetin kautta myös Tilastokeskuksen maksullisesta aikasarjatietokannasta (ASTIKA). Eurostat julkaisee työvoimatutkimuksen neljännesvuosi- ja vuositietoja omilla internet-sivuillaan.
Yksikkötason aineistojen saatavuus
Tietojen revisioitumislinjaukset
Jo julkistettujen tilastotietojen tarkentuminen eli revisio on osa normaalia tilastotuotantoa ja merkitsee laadun parantumista. Periaatteena on, että tilastotiedot perustuvat parhaaseen saatavilla olevaan aineistoon ja tietoon tilastoitavasta ilmiöstä. Toisaalta tarkentumisesta pyritään tiedottamaan mahdollisimman läpinäkyvästi ennakkoon. Ennakkoviestinnällä varmistetaan, että käyttäjät pystyvät varautumaan tietojen tarkentumiseen.
Tilastojulkistusten tietojen tarkentumisen taustalla on useimmiten aineiston täydentyminen. Tällöin uusi, revisioitu tilastoluku perustuu laajempaa tietopohjaan ja kuvaa ilmiötä entistä tarkemmin.
Tilaston tietojen tarkentuminen voi liittyä myös käytettävään laskentamenetelmään, kuten lukujen vuosittaiseen täsmäytykseen tai painorakenteen päivitykseen. Myös perusvuoden ja käytettyjen luokitusten muutoksesta aiheutuu tietojen tarkentumista.
Suhdannetilastojen kausitasoitetut tiedot tarkentuvat käytettävän laskentamenetelmän vuoksi. Uuden aikasarjahavainnon tuoma lisäinformaatio hyödynnetään mallipohjaisessa laskentamenetelmässä, mikä heijastuu vanhojen julkistusten muutoksena. Tuoreimpien kausitasoitettavien lukujen revisoitumisesta kerrotaan tilastojen julkistuksissa ja laatuselosteissa.
Keskeisten suhdannetilastojen ja joidenkin vuositilastojen yhteydessä julkistetaan myös taulukko toteutuneista revisioista. Taulukosta ilmenee, miten viimeisten tilastoajankohtien tiedot ovat muuttuneet ensimmäisen ja tuoreimman tilastojulkistuksen välillä.
Käyttäjien tarpeet
Tutkimuksen tuloksia käytetään muun muassa työvoimapoliittisten ennusteiden ja suunnitelmien laadinnassa, päätösten teon tukena sekä erilaisten toimien työllisyysvaikutusten seurannassa. Tärkeitä tulosten käyttäjiä ovat ministeriöt, aluesuunnittelusta vastaavat elimet, työnantaja- ja työntekijäjärjestöt, yliopistot ja tutkimuslaitokset, kansainväliset järjestöt ja Euroopan unioni. Tilastokeskuksessa tietoja käytetään esimerkiksi kansantalouden tilinpidon laadinnassa. Euroopan unionin tilastovirasto, Eurostat, ohjaa tutkimuksen sisältöä ja seuraa sen laatua. Eurostat tuottaa sille toimitetuista neljännesvuosiaineistoista omia rakenneindikaattoreitaan ja muita tilastoja.
Laadun arviointi
Laadunvarmistus
Laadunhallinta edellyttää toiminnan kokonaisvaltaista ohjausta. Tilastoalan oma laadunhallinnan kehikko on Euroopan tilastojen käytännesäännöstö (CoP). Kehikot täydentävät toisiaan. Myös Suomen virallisen tilaston laatukriteerit ovat yhteensopivat Euroopan tilastojen käytännesääntöjen kanssa.
Lisätietoja: Laadunhallinta | Tilastokeskus (stat.fi)
Tilastokeskuksessa tehdään vuosittain tilastojen läpivalaisuja, joilla osaltaan varmistetaan tilastojen laatua. Työvoimatutkimuksen läpivalaisu toteutettiin loka-marraskuussa 2011.
Käyttäjien käyttöoikeudet
Lisätietoja: Tilastojen julkistamisperiaatteet
Tilastokeskus on aineistojen tuottaja ja tekijänoikeuden haltija, ellei tuotteen, tiedon tai palvelun yhteydessä erikseen toisin ilmoiteta. Tilastotietojen käyttöehdot.
Etsitkö aiemmin julkaistua dokumentaatiota?
Ennen 5.4.2022 julkaistu dokumentaatio löytyy tilaston arkistosivuilta.
Siirry arkistosivuille