Meetschalen, Data Assumpties & Pre-Tests

Welke meetschaal heeft mijn variabele?

Variabelen worden opgesplitst in twee soorten, de twee soorten bestaan (opgeteld) uit 5 typen.
De 5 typen (‘measurement levels’) kunnen gezien worden als een soort hiërarchie van
meetinformatie’. Dit klinkt misschien erg vaag, maar wordt bij verder lezen duidelijker.

Categorische variabele’ (soort);

1) Dichotoom/binair, er zijn slechts twee categorieën (bijv. sekse; man of vrouw)
2) Nominaal, meer dan twee categorieën maar niet hiërarchisch (bijv. Nationaliteit)
3) Ordinaal, hetzelfde als nominaal maar dan wel hiërarchisch (bijv. examenuitslag; gezakt, geslaagd, cum laude geslaagd)

Continue variabele’ (soort);

4) Interval variabele, hetzelfde als ordinaal maar dan zijn de intervallen gelijk (d.w.z. het verschil tussen gezakt en geslaagd zou dan hetzelfde moeten zijn als tussen geslaagd en cum laude geslaagd, bijv. temperatuur in celsius; het verschil tussen 25 en 20 graden is hetzelfde als tussen 35 en 30, (dit is geen ratio omdat 40 graden niet twee keer zo warm is als 20 graden celsius))
5) Ratio variabele (ookwel ‘verhoudingsschaal’), hetzelfde als interval maar dan (door een absoluut 0-punt) zijn ook de verhoudingen relevant (bijv. tijd, temperatuur in Kelvin; 10 seconden is twee keer zo lang als 5 seconden).


scriptie hulp, spss uitbesteden icoonTwijfel je toch nog over welke meetschalen van welke niveau je gebruikt? Of zijn er andere onderdelen bij het schrijven van je scriptie waar je tegen aanloopt? Overweeg dan ook eens het om betaalde hulp in te schakelen. Je kunt bij scriptiemaster.nl heel eenvoudig een vrijblijvend (en gratis) advies gesprek aanvragen.
Of bekijk of er een SPSS hulp boek tussen de bol.com aanbieding van vandaag staan


In SPSS:

Je moet SPSS laten weten welke schaal je variabelen hebben. Dit doe je door naar het tabblad ‘Variable View’ te gaan (linksonder). Hier vind je een kolom (de 9e) genaamd ‘Measure’. Je moet in deze kolom per variabele (in Variable View wordt elke variabele gerepresenteerd door een rij) dus per rij onder Measure de juiste van drie opties selecteren.

1) Dichotoom/binair, selecteer: Nominalmeetschaal, ordinaal niveau of interval?
2) Nominaal, selecteer: Nominal
3) Ordinaal, selecteer: Ordinal
4) Interval, selecteer: Ordinal of Ratio
5) Ratio, selecteer: Ordinal


Data assumpties & pre-testen’

Het selecteren, uitvoeren, interpreteren en rapporteren van de pre-
tests.

Assumpties zijn niet enkel premissen waar aan voldaan kan of moet worden, de resultaten van het toetsen van de assumpties geven je in inzicht in welke SPSS analyse je kunt gebruiken voor het echte testen. Ze laten je weten of je bijvoorbeeld ANOVA of Kruskall-Wallis kunt gebruiken. (Bekijk ook stap 3 ‘welke analyse moet ik gebruiken in SPSS‘.) Het wel of niet voldoen aan bepaalde assumpties deelt alle data als het ware op in categorieën/soorten. Hier behandelen we herhaaldelijk twee van de vele mogelijke assumpties. We noemen er hier 4, slechts 2 (nr.1 en nr.2) blijven terugkomen komen onder de naamassumpties.

Een belangrijke opsplitsing in soorten data is die tussen parametrische data en non-parametrische data. Onder welke categorie (parametrisch/non-parametrisch) jouw data valt ligt aan het wel of voldoen aan de 4 meest belangrijke assumpties in SPSS.


De 4 assumpties
(in volgorde van toetsen);

1) Normaal verdeling
2) Homogeniteit van variantie
3) Interval data (zie stap 1)
4) Onafhankelijkheid.

 

Uitleg data assumpties

1 Normaal verdeling, dit moet je al kennen, dit wordt ook wel omschreven als de ‘bell curve’. Het helpt je als je hier de naam ‘Kolmogorov Smirnov’ (of ‘Shapiro Wilk’) alvast kunt onthouden.
2 Homogeniteit van variantie, dit is niet eenvoudig om te begrijpen. (Het houdt in dat (mits aan de assumptie wordt voldoen) het gemiddelde afwijken van het gemiddelde op een variabele van een groep vergelijkbaar moet zijn met het gemiddelde afwijken van het gemiddelde op die variabele van de andere groep.) Het zou handig zijn om hierbij alvast de naam ‘Levene’ te onthouden. Deze assumptie speelt echter geen rol wanneer de N voor alle groepen gelijk is (hier wordt verder niet op in gegaan omdat dit meestal niet het geval is)
3) Interval data of ‘hoger’, dit is als het ware het ‘type schaal’ van de data. Dit betekent simpelweg dat nominale data (ook wel categorische data genoemd) niet volstaan (e.g. sekse, beroep, zie stap 1 voor een volledige uitleg).
4) Onafhankelijkheid, dit houdt in dat de score van de ene participant geen invloed op de andere participant mogen hebben. (Dit is een vereiste die je in het ontwerp van je studie als vanzelfsprekend (een ‘ja hallo, nogal logisch’ effect) ervaart, en zal ik daarom niet verder op ingaan)

Hoe toets ik deze 4 assumpties?

Een veelgebruikte mogelijkheid is het plotten (uittekenen) van je data om zo met het blote oog te kijken of het er allemaal ‘normaal’ (normaal verdeeld) uit ziet. Dit heeft vanzelfsprekende een erg groot nadeel: subjectiviteit. In plaats van je uitleggen hoe je dit doet om vervolgens uit te leggen hoe je test of je data o.a. normaal verdeeld is, leg ik je meteen uit hoe je de toetsen uitvoert.
Het vooraf plotten kan voor de ervaren onderzoeker in bepaalde gevallen tijd besparen, maar voor ons moet de toets toch uitgevoerd worden en deze maakt het plotten overbodig*. Door te weten of je data aan deze assumpties voldoen kom je dichterbij het kiezen van de juiste SPSS analyse (test). Hoe weet je nu of je data er aan voldoen?

* Resultaten van het plotten kunnen gebruikt worden om toets uitkomsten (van Kolmogorov-Smirnov te overrulen (dit bij gevonden afwijking bij grote samplesizes, en niet gevonden afwijkingen bij kleine samplesizes).

We handelen eerst even snel assumpties 3 & 4 af.

Deze twee assumpties toets je vaak eigenlijk niet echt. Deze zouden zonder gebruik te maken van SPSS al duidelijk moeten worden.
Assumptie 4 moet eigenlijk altijd aan voldaan worden omdat je anders een erg vreemd onderzoek aan het uitvoeren bent. Assumptie 3 is meer een kennis vraag.
Als je weet wat de schaaltypen inhouden (zie stap 1) kun je dit afleiden uit het ontwerp van je onderzoek.

Het echte assumptie toetsen begint bij assumptie 1 (de normaalverdeling).

Ik heb hier gezegd; ‘probeer Kolmogorov-Smirnov te onthouden’. De analyse die je met SPSS doet om deze assumptie te testen heet de ‘Kolmogorov-Smirnov test’.

In SPSS: ga naar Analyze > Descriptive Statistics > Explore.

Kies je ‘dependent’ (afhankelijke/uitkomst variabele) en evt je ‘independent’ (onafhankelijke/predictor) variabele(n) en klik op ‘Plots’, vink hier (in het midden) de optie ‘Normality plots with tests’ aan. Klik ‘Continue’ en ‘Ok’.


Interpreteren
OUTPUT test of normality ‘Kolmogorov-Smirnov’.

Kijk naar output tabel genaamd ‘Tests of Normality’. Hier heb je een aantal kolommen onder ‘Kolmogorov-Smirnov’, kijk naar de kolom genaamd ‘Sig.’(erg voor de hand liggend tot nu toe..). Waar je nu wel even op moet letten is dat deze test een test is voor het van de normaalverdeling afwijken van je data. Dat wil zeggen dat juist wanneer de p waarde (waarde onder ‘Sig.’) kleiner is dan .05, je data significant wel van de normaalverdeling afwijkt. Dus p < .05 betekent niet aan de assumptie voldaan, p > .05 betekent wel aan de assumptie voldaan  (dus het wel normaal verdeeld  zijn van je data (dwz aan de eis is voldaan) leidt je af uit het niet significant afwijken (dwz ‘p’ is niet kleiner dan 0.05) van je data).


Rapporteren
OUTPUT test of normality ‘Kolmogorov-Smirnov’.

Bij het rapporteren is het belangrijk dat je de variabele noemt waarvan het de data zijn die wel of niet aan de assumptie voldoen. Je noemt ‘wel of niet significant afwijken van de normaal verdeling‘, D(nummer onderdf) = waarde onderstatistic, p < (of >) .05.

Assumptie toetsen  assumptie 2 (homogeniteit van variantie).

Voor het toetsen van de homogeniteit van variantie (assumptie 2) is de ‘Levene’s test’.

In SPSS: ga naar Analyze > Descriptive Statistics > Explore.

Kies je dependent en evt je independent variabelen en klik op ‘Plots’ (tot hier hetzelfde als voor assumptie 1).
Onder het kopje ‘Spread vs Level with Levene Test’ staan 4 opties, kies hier de laatste, ‘Untransformed’. Klik ‘Continue’ en ‘Ok’.


Interpreteren
OUTPUT homogeniteit van variantie ‘Levene’s test’.

Kijk naar de output tabel genaamd ‘Test of Homogeneinity of Variance’. Kijk naar de kolom genaamd ‘Sig.’. Evenals bij het aflezen van de Kolmogorov-Smirnov moet je weten dat deze test een test is voor het van de homogeniteit afwijken van je data. Dat wil zeggen dat ook hier juist wanneer de p waarde (waarde onder ‘Sig.’) kleiner is dan .05, je data significant van homogeniteit afwijkt. Dus p < .05 betekent niet aan de assumptie voldaan, p > .05 betekent wel aan de assumptie voldaan.


Rapporteren
 OUTPUT homogeniteit van variantie ‘Levene’s test’.

Bij het Rapporteren is het belangrijk dat je de variabele noemt waarvan het de data zijn die wel of niet aan de assumptie voldoen. Je noemt ‘wel of niet significant afwijken van homogeniteit van variantie’ (of het heterogeen verdeeld zijn van de variantie mits significant resultaat), F(nummer onderdf1, nummer onderdf2) = waarde onderlevene statistic, p < (of >) .05.

Wat nu als mijn data niet aan deze assumpties heeft voldaan?

Een optie is het aanpassen van je data. Dit kan met technieken als ‘trimmen’, ‘bootstrapping’ en ‘winsorizing’. Hier gaan we niet op in omdat SPSS analyse methoden heeft voor data die niet voldoen aan de assumpties: Non-parametrische tests.

 


Voor meer informatie over statistiek met SPSS adviseren we ‘Discovering Statistics with SPSS’ van Andy Field. |  Terug naar het ‘data-analyse in 4 stappen’ overzicht.