Prironiki

Naslov Reziduali v tabelah
Vsebina


Ko v zavihku 'ANALIZE' - 'Statistike' - 'Tabele' naredimo kontingenno tabelo, se prikae vrednost Hi kvadrata in znotraj tabele se obarvajo celice, kar se izvede na osnovi rezidualov.

Reziduali omogoajo izredno enostavno in uinkovito analizo dogajanja v tabeli. Za razliko od hi kvadrata, ki podaja zgolj neko splono diagnostiko o povezanosti v tabeli, pa reziduali natanno pokaejo, kje tono se dogaja povezava. Hi kvadrat je namre lahko statistino znailen zgolj zaradi povezanosti v eni sami celici, ne pove pa nam, kje je to.

Rezidual je termin iz analize nominalnih spremenljivk. Rezidual je enostavno razlika med dejansko frekvenco v doloeni celici in teoretino frekvenco, kakrna bi bila, e spremenljivki dvorazsene tabele v tej celici ne bi bili povezani (predpostavka nielne domneve). Teoretino frekvenco izraunamo zelo enostavno kot produkt obeh margin, ki ga delimo s skupno velikostjo tabele.

e osnovne reziduale - ki po obiajni predpostavki sledijo Poissonovi porazdelitvi - standardiziramo (odtejemo priakovano vrednost in delimo s standardnim odklonom), dobimo standardizirane reziduale (standardised residuals), ki se porazdeljujejo asimptotino normalno. Zanje zato lahko uporabimo obiajno interpretacijo iz preverjanja domnev in tudi obiajne kritine vrednosti, npr.  1.65 ali 1.96  pri 10% ali 5% tveganju.

Prilagojeni reziduali (adjusted residuals) dodatno korigirajo za neenake dimenzije margin in nekateri raziskovalci dokazujejo, da so bolj primerni od obiajnih standardiziranih rezidualov, kar je tudi nae priporoilo, zato pri analizi (obarvanju) uporabljamo prilagojene reziduale.

Aplikacija 1KA uporablja in obarva meje 1.0, 2.0 in 3.0 za vrednosti prilagojenih rezidualov, ki zato v grobem oznaujejo jakost povezave v doloeni celici oziroma jakost odstopanja od predpostavke nielne domneve. Pomen vrednosti za standardizirane reziduale:

  • nad 1.0 pomeni doloeno poveanje in pozornost,
  • nad 2.0 (gre za poenostavitev vrednosti 1.96) pomeni statistino znailno razliko (sign<0.05), torej se z razmeroma majhnim tveganjem reziduali razlikujejo od ni
  • nad 3.0 pa pomenijo e mono odstopanje (sign<0.01). kar pomeni, da so reziduali skoraj zagotovo razlini od ni in se torej v celici nekaj "dogaja"

Modro obarvane celice pomenijo, da je v celici manj enot kot bi priakovali, rdee pa ve.

e je v celici npr. 30 enot, priakovana vrednost pa je 20, je osnovni rezidual 10. V tej celici je torej 10 enot ve kot bi priakovali, e spremenljivki v teh dveh kategorijah ne bi bili povezani. e gre npr. za spol in mnenje, zato reemo, da so npr. moki bistveno bolj ZA kot bi priakovali, e spol ne bi imel vpliva. e rezidualu 10 odtejemo priakovano vrednost in delimo z njenim korenom (koren iz 20 je 4.5, saj ima Poissonova porazdelitev priakovano vrednost enako varianci), dobimo standardizirani rezidual, ki je v tem primeru veji od 2, saj imamo (20-10)/4.5>2.0.

e to nekoliko popravimo na osnovi formul v prilogah spodaj, pa dobimo prilagojeni rezidual, ki ima - e ni res izjemnih asimetrij v marginah (DA:NE, moki:enske) - precej podobno vrednost. Natanen primer izrauna rezidualov je tukaj >>. V vsakem primeru lahko zakljuimo, da so v tej celici statistino znailna odstopanja in na tej osnovi se lahko lotimo tudi vsebinske interpretacije (npr. razlogi, zakaj so moki bolj ZA).

Obarvanje celic v 1KA je okvirno, poenostavljeno in zgolj v funkciji pregledovalne (eksploratorne) analize. V formalni interpretaciji bodisi navedemo toen standardizirani ali - e bolje - prilagojeni rezidual in ga interpretiramo v obiajnem smislu kot navajajo primeri spodaj.

Tone vrednosti rezidualov dobimo v 1KA tako, da oznaimo njihov izraun v opciji 'Nastavitve', v eni od vodoravnih povezav nad tabelo.

Lahko seveda interpretiramo celotno tabelo in njen hi kvadrat. So pa - kot reeno - reziduali bolj precizni kot celoten hi kvadrat, ker se osredotoajo tono na vsako posamezno celico, kjer se odstopanja dogajajo. Dodaten vpogled dobimo z analizo razlike deleev na osnovi t-testa.

Seveda pa vse to skupaj velja le za nominalne spremenljivke. V primeru "dobre" ordinalne urejenosti ene od spremenljivk - e bolj pa v primeru nedvomne intervalne ali razmernostne skale - pa seveda raje uporabimo kar T-test ali analizo variance.

Nekaj koristnih povezav:

Povezave:

Print

Prironiki - Prironiki (114)