Otanta ja estimointi – otos ja populaatio
Otanta ja estimointi ovat tilastotieteen keskeisiä käsitteitä. Otanta tarkoittaa populaation osajoukon valitsemista tutkimusta varten. Estimointi tarkoittaa populaation parametrien arvioimista otoksen perusteella. Otoskeskiarvo ja otosvarianssi ovat estimaattoreita populaation keskiarvosta ja varianssista. Luottamusväli antaa välin, jolla populaation keskiarvo todennäköisesti sijaitsee. Tämä aihe kuuluu lukion matematiikan opetussuunnitelmaan (LOPS21) ja käsitellään kursseilla MAA8: Tilastot ja todennäköisyys ja MAA12. Tällä sivulla opit otantamenetelmät, estimaattorit ja luottamusvälit.
Kaavat
Otoskeskiarvo
- Otoskeskiarvo
- Otoksen koko (havaintojen lukumäärä)
- Yksittäinen havaintoarvo
Otosvarianssi
- Otosvarianssi
- Otoskeskiarvo
- Vapausasteet (jakaja)
Keskivirhe
- Otoskeskiarvon keskivirhe (standard error)
- Otokeskihajonta (kun $\sigma$ tuntematon)
- Populaation keskihajonta (kun tunnetaan)
Luottamusväli (tunnettu $\sigma$)
- Kriittinen z-arvo (95 %: $z_{0{,}025} \approx 1{,}96$)
- Virhemarginaali: $m = z_{\alpha/2} \cdot \sigma/\sqrt{n}$ (puolikas välin pituudesta)
- Populaation keskihajonta (tunnettu)
Luottamusväli (tuntematon $\sigma$)
- Kriittinen t-arvo (vapausasteet $n-1$)
- Otokeskihajonta
Säännöt
Otoskeskiarvo
Otosvarianssi
Keskivirhe
Luottamusväli (tunnettu $\sigma$)
Luottamusväli (tuntematon $\sigma$)
Esimerkit
Esimerkki 1: Otoskeskiarvo
Helppo- Laske otoskeskiarvo: .Otoskeskiarvo lasketaan kaavalla .
- Vastaus: Otoskeskiarvo on .Tämä on tyypillinen otoskeskiarvon laskenta.
Esimerkki 2: Keskivirhe
Helppo- Tunnista parametrit: , , .Keskivirhe lasketaan otoksen perusteella.
- Laske keskivirhe: .Keskivirhe lasketaan kaavalla .
- Vastaus: Keskivirhe on .Tämä on tyypillinen keskivirheen laskenta.
Esimerkki 3: Luottamusväli (tunnettu $\sigma$)
Keskitaso- Tunnista parametrit: , , , ( luottamusväli).Koska tunnetaan, käytetään z-jakaumaa.
- Etsi z-arvo: (normaalijakaumataulukosta).Z-arvo luottamusväliin on .
- Laske keskivirhe: .Keskivirhe lasketaan kaavalla .
- Laske luottamusväli: , eli .Luottamusväli lasketaan kaavalla .
- Vastaus: luottamusväli populaation keskiarvolle on noin .Tämä on tyypillinen luottamusvälin laskenta, kun tunnetaan.
Esimerkki 4: Luottamusväli (tuntematon $\sigma$)
Keskitaso- Tunnista parametrit: , , , ( luottamusväli).Koska ei tunneta, käytetään t-jakaumaa.
- Etsi t-arvo: ( vapausastetta, t-jakaumataulukosta).T-arvo luottamusväliin on .
- Laske keskivirhe: .Keskivirhe lasketaan kaavalla .
- Laske luottamusväli: , eli .Luottamusväli lasketaan kaavalla .
- Vastaus: luottamusväli populaation keskiarvolle on noin .Tämä on tyypillinen luottamusvälin laskenta, kun ei tunneta.
Esimerkki 5: Otantamenetelmät
Helppo- Satunnaisotos: Jokainen populaation alkio valitaan satunnaisesti yhtä todennäköisesti. Tämä on paras menetelmä, koska se varmistaa, että otos on edustava.Satunnaisotos on paras menetelmä, koska se varmistaa, että otos on edustava.
- Systemaattinen otos: Valitaan ensimmäinen alkio satunnaisesti ja sitten jokainen :s alkio. Tämä on helpompi kuin satunnaisotos, mutta voi aiheuttaa harhaa, jos populaatiossa on jaksollisuutta.Systemaattinen otos on helpompi kuin satunnaisotos, mutta voi aiheuttaa harhaa.
- Kerrosotos: Populaatio jaetaan kerroksiin (esimerkiksi ikäryhmät) ja jokaisesta kerroksesta valitaan satunnaisotos. Tämä varmistaa, että jokainen kerros on edustettuna otoksessa.Kerrosotos varmistaa, että jokainen kerros on edustettuna otoksessa.
- Vastaus: Satunnaisotos on paras menetelmä, systemaattinen otos on helpompi mutta voi aiheuttaa harhaa, ja kerrosotos varmistaa, että jokainen kerros on edustettuna.Tämä on tyypillinen otantamenetelmien selitys.
Esimerkki 6: Estimaattorit
Keskitaso- Määritelmä: Estimaattori on harhaton, jos sen odotusarvo on yhtä suuri kuin estimoitava parametri.Harhaton estimaattori tarkoittaa, että estimaattorin odotusarvo on yhtä suuri kuin estimoitava parametri.
- Otoskeskiarvo: , missä on populaation keskiarvo.Otoskeskiarvon odotusarvo on populaation keskiarvo.
- Tulkinta: Tämä tarkoittaa, että pitkällä aikavälillä otoskeskiarvo on keskimäärin yhtä suuri kuin populaation keskiarvo. Yksittäiset otokset voivat poiketa, mutta keskimäärin otoskeskiarvo on oikea.Harhaton estimaattori tarkoittaa, että pitkällä aikavälillä estimaattori on keskimäärin oikea.
- Vastaus: Otoskeskiarvo on harhaton estimaattori populaation keskiarvosta, koska . Tämä tarkoittaa, että pitkällä aikavälillä otoskeskiarvo on keskimäärin yhtä suuri kuin populaation keskiarvo.Tämä on tyypillinen estimaattorin selitys.
Esimerkki
- Tunnista parametrit: , , , ( luottamusväli).
- Koska ei tunneta, käytetään t-jakaumaa: ( vapausastetta).
- Laske keskivirhe: .
- Laske luottamusväli: , eli .
- Vastaus: luottamusväli populaation keskiarvolle on noin .
Sovellukset
- Tilastotieteessä otantaa ja estimointia käytetään tutkimuksissa. Esimerkiksi mielipidetutkimuksissa valitaan otos ja estimoidaan koko väestön mielipide.
- Laadunvalvonnassa otantaa ja estimointia käytetään arvioimaan tuotteiden laatua. Esimerkiksi testataan otos tuotteista ja estimoidaan koko tuotantosarjan laatu.
- Taloustieteessä otantaa ja estimointia käytetään arvioimaan taloudellisia indikaattoreita. Esimerkiksi työttömyysaste lasketaan otoksen perusteella ja estimoidaan koko väestön työttömyysaste.
- Terveystieteessä otantaa ja estimointia käytetään arvioimaan terveysindikaattoreita. Esimerkiksi sairauksien esiintyvyys lasketaan otoksen perusteella ja estimoidaan koko väestön sairauksien esiintyvyys.
Yleisiä virheitä
Otosvarianssin ja populaatiovarianssin sekoittaminen
Luottamusvälin laskeminen väärin
Keskivirheen laskeminen väärin
Luottamusvälin tulkinta väärin
Usein kysyttyä
- Mikä on otos?
- Otos on populaation osajoukko, joka valitaan tutkimusta varten. Otos on yleensä paljon pienempi kuin populaatio, joten otoksen perusteella voidaan tehdä johtopäätöksiä koko populaatiosta. Otos valitaan yleensä satunnaisesti, jotta se olisi edustava.
- Mikä on estimaattori?
- Estimaattori on tilastollinen funktio, jota käytetään estimoimaan populaation parametria. Esimerkiksi otoskeskiarvo on estimaattori populaation keskiarvosta . Estimaattori on harhaton, jos sen odotusarvo on yhtä suuri kuin estimoitava parametri.
- Mikä on luottamusväli?
- Luottamusväli on väli, joka sisältää populaation parametrin tietty todennäköisyydellä. Esimerkiksi luottamusväli populaation keskiarvolle tarkoittaa, että jos toistetaan otanta monta kertaa, luottamusväleistä sisältää populaation keskiarvon.
- Miten lasken luottamusvälin?
- Luottamusväli lasketaan kaavalla (kun tunnetaan) tai (kun ei tunneta), missä tai on kriittinen arvo luottamustasolle .
- Mikä ero on z-jakaumalla ja t-jakaumalla?
- Z-jakaumaa käytetään, kun populaation keskihajonta tunnetaan. T-jakaumaa käytetään, kun populaation keskihajonta ei tunneta ja käytetään otokeskihajontaa . T-jakauma on leveämpi kuin z-jakauma, koska se ottaa huomioon epävarmuuden :n estimoinnissa.
- Mikä on keskivirhe?
- Keskivirhe on otoskeskiarvon keskihajonta. Keskivirhe lasketaan kaavalla (kun tunnetaan) tai (kun ei tunneta). Keskivirhe kuvaa, kuinka paljon otoskeskiarvo vaihtelee otoksesta toiseen.
- Mikä on harhaton estimaattori?
- Estimaattori on harhaton, jos sen odotusarvo on yhtä suuri kuin estimoitava parametri. Esimerkiksi otoskeskiarvo on harhaton estimaattori populaation keskiarvosta , koska . Tämä tarkoittaa, että pitkällä aikavälillä otoskeskiarvo on keskimäärin yhtä suuri kuin populaation keskiarvo.
- Mikä on otantamenetelmä?
- Otantamenetelmä on menetelmä, jolla valitaan otos populaatiosta. Yleisimmät otantamenetelmät ovat satunnaisotos (jokainen alkio valitaan satunnaisesti), systemaattinen otos (valitaan ensimmäinen alkio satunnaisesti ja sitten jokainen :s alkio) ja kerrosotos (populaatio jaetaan kerroksiin ja jokaisesta kerroksesta valitaan satunnaisotos).
- Miten suuri otos tarvitaan?
- Otoksen koko riippuu tutkimuksen tavoitteista ja halutusta tarkkuudesta. Yleensä suurempi otos antaa tarkemman estimaatin, mutta se on myös kalliimpi ja aikaa vievämpi. Otoksen koko voidaan laskea halutun tarkkuuden ja luottamustason perusteella.
- Mikä ero on otoksella ja populaatiolla?
- Populaatio on koko joukko, josta halutaan tehdä johtopäätöksiä. Otos on populaation osajoukko, joka valitaan tutkimusta varten. Otoksen perusteella estimoidaan populaation parametreja. Yleensä otos on paljon pienempi kuin populaatio.
Lähteet ja lisämateriaali
- LOPS21: MAA8 ja MAA12 Tilastot ja todennäköisyys
Lukion matematiikan kurssit (LOPS21): MAA8 ja MAA12 käsittelevät otantaa, estimointia ja luottamusvälejä. Osa lukion opetussuunnitelmaa.
- Ylioppilaskokeiden tehtävät
Aiemmat ylioppilaskokeiden tehtävät ja malliratkaisut otannasta ja estimoinnista.
- TIM - Pitkän matematiikan kertauskurssi
Jyväskylän yliopiston kertauskurssi, joka sisältää harjoitustehtäviä ja teoriaa otannasta ja estimoinnista.
- Ylen Abitreenit: Otanta ja estimointi
Ylen Abitreenit-sivuston materiaali otannasta ja estimoinnista.