Keskmised, mediaanid ja töötus: arvude parsimine

Igal kuul, kui tööstatistika büroo avaldab oma tööaruande, asuvad inimesed ühe kindla mõõdiku järgi: töötuse määr. Kuid aruandes on palju muid huvitavaid ja potentsiaalselt olulisi andmeid, kuigi nende asjakohane tõlgendamine võib olla keeruline.


Võtame näiteks töötuse kestuse. Pole vähimatki kahtlust, et rohkem inimesi jääb töötuks kauemaks kui seni on olnud. Eelmisel kuul oli BLS-i andmetel sesoonselt korrigeeritud keskmine töötuse kestus 35,6 nädalat, mis ei olnud kaugelt madalam kui kriisijärgne kõrgeim näitaja - 40,7 nädalat 2011. aasta lõpus. Enne finantskriisi täielikku saabumist oli keskmine kestus umbes 16 või 17 nädalat.

Aga onkeskminekestus parim mõõtmine? Nagu näitab paremalt toodud diagramm, on töötuse kestus tugevalt viltu: kuigi enamik inimesi on koondunud lühema kestuse poole, on mõned inimesed, kes on olnud pikka aega - 3, 4, 5 või enam aastat - töölt väljas ning need juhtumid tõmbavad keskmist kõrgemaks. Kui andmeid jagatakse niimoodi, võivad keskmised väärtused olla väga eksitavad selle kohta, mis on „tüüpiline“ väärtus.


Sellistel juhtudel kasutaks enamik eksperte hoopis mediaani - jaotuse keskpunkti, kusjuures pool väärtustest langeb sellest kõrgemale ja pool alla. Mediaani mõjutavad viltused jaotused ja kõrvalekalded (andmepunktid on ülejäänud andmekogumiga võrreldes ebatavaliselt suured või väikesed) palju vähem. Themediaansesoonselt korrigeeritud töötuse kestus juunis oli 16,3 nädalat - see on ikka tunduvalt üle tavapärase majanduslanguseelse keskmise kestuse 8–9 nädalat.

Töötuse kestus on vaevalt ainus andmete jaotus, mida suhteline käputäis kõrvalekaldeid võib liigselt mõjutada. Näiteks rikkuse ja sissetulekute andmed on teadupärast moonutatud: New York Timesi kolumnisti Floyd Norrise sõnul oli 2010. aasta keskmine majapidamiste rikkus (arvutatuna Föderaalreservi kolmeaastase tarbijafinantseerimise uuringu põhjal) umbes kuuendik leibkonna keskmisest rikkusest.

Mis puutub sissetulekutesse, nagu Stephanie Coontz hiljuti The New York Timesis väitis, kui Warren Buffett ja Oprah Winfrey võtaksid oma pähe Ohio osariiki Steubenville'i kolimise, tõuseks sealne leibkonna keskmine sissetulek üleöö 46 341 dollarilt 75 263 dollarile. Coontzi teos toob veel mitmeid näiteid vildakatest jaotustest ja eksitavatest keskmistest.



Vaadates nii keskmisi kui mediaane ja nende lähedust üksteisele, võib see teile palju öelda alusandmete kohta. (Täiesti normaalse jaotuse korral oleksid nad identsed.) Jätkuvalt suur vahe keskmise ja meediapuuduse kestuse vahel (ehkki mitte nii suur kui aasta tagasi) näitab, et kuigi enamik töötutest ameeriklastest leiab tööd 20 nädala pärast või vähem jääb põhiliste pikaajaliste töötute hulk pikemaks ajaks töötuks. Ja pidage meeles, et kuna inimene peab töötuks loetama olema hiljuti tööd otsinud, ei sisalda need andmed hinnanguliselt 7,2 miljonit ameeriklast, kes soovivad tööd, kuid pole seda viimase aasta jooksul otsinud.