Ga meteen naar de voorbeelden per statistische test:
Of volg de stappen zoals hieronder beschreven;
Ben je een student en ben je bezig met het schrijven van een essay of scriptie? Overweeg dan ook eens de ghostwriter / uitbesteed mogelijkheden;
(Je kunt nu ook alleen het data deel uitbesteden, of juist je eigen data gebruiken maar de rest uitbesteden)
Merk je dat je te veel tijd verdoet op social media terwijl je eigenlijk wilt werken of studeren?
Het kan zijn dat je een van de vele studenten bent die last heeft van procrastinatie.
Probeer de gratis app voor studenten die probeert je minder gevoelig te maken voor de immediate gratification van social media, netflix, junkfood en andere short term ‘temptations’
Voor dat we kunnen gaan rapporteren moeten de resultaten geïnterpreteerd worden. De resultaten in SPSS ( – de ‘OUTPUT’ – ) kunnen de eerste keer misschien wat intimiderend zijn.
Een hoop statistieken met afkortingen of enkel letters als namen worden in meerdere tabellen op je scherm gepresenteerd.
Wat wordt bedoeld met -OUTPUT- ?
‘OUTPUT‘ is de term die veel software pakketten (waaronder SPSS) gebruiken voor het totaal aan ‘resultaten’ (meestal voornamelijk in de vorm van tabellen en grafieken) na een bepaalde handeling op de data (zoals het uitvoeren een een bepaalde statistische toets). Voor nu kun je ‘OUTPUT’ lezen als ‘resultaten zoals door SPSS gegeven’.
In SPSS is dit altijd een aparte tab die naast je ‘data tab’ ligt in je overzicht. Deze tab heet ‘OUTPUT’ of ‘SPSS OUTPUT’.
Voorbeeld van SPSS ‘OUTPUT’:
Laat je hierdoor niet afschrikken, je hoeft vaak maar enkele ‘letters’ met bijbehorende getallen op te zoeken en de rest kun je negeren.
Het eerste waar je naar kijkt (ongeacht welke toets je hebt toegepast) is de ‘significantiewaarde’ (rood omcirkeld in onderstaand SPSS ‘OUTPUT’ voorbeeld van een ANOVA toets).
Uit deze waarde kun je afleiden of je gevonden resultaten (denk hierbij bijvoorbeeld aan je ‘multipele regressie analyse’, ‘chi-kwadraat’ of ‘Mann Witney U test’) anders zijn dan je op basis van kans zou kunnen verwachten (oftewel; ‘is er een effect/verschil?’).
De significantiewaarde (Sig.) in de SPSS OUTPUT geeft je hier het antwoord op.
De significantie wordt in de SPSS OUTPUT met ‘Sig.’ aangeduid. Buiten SPSS (bijvoorbeeld bij het rapporteren) wordt dit aangeduid met de (kleine) letter ‘p’.
De significantiewaarde (‘sig.‘ ookwel ‘p’) is altijd kleiner dan 1. Je kunt het zien als de kans dat het gevonden verschil toeval is, waarbij 1 gelijk staat aan 100%.
In een onderzoek wordt meestal de regel gehanteerd dat als de kans kleiner is dan 5% dat het gevonden verschil toeval is, dan mag er gezegd worden dat het geen toeval is en er inderdaad een ‘significante’ samenhang is (dit bewijst echter geen causaliteit!). De ‘cut-off’ waarde van sig. (‘p‘) om te kunnen concluderen dat het gevonden verschil in gemiddelde sterfleeftijd van rokers tegenover niet-rokers te groot is om toeval te zijn wordt dan ook in dit voorbeeld gesteld op 0,05. (=5%)
Als de significantiewaarde (de waarde weergegeven in de kolom ‘sig.’ in de SPSS ‘OUTPUT’, hierboven in rood omcirkeld) kleiner is dan .05, dan is er sprake van een significant verschil/effect.
Hoe interpreteer ik de < en > tekens nu ook alweer?
‘>’ is het ‘groter dan’ teken.
‘<‘ is het ‘kleiner dan’ teken.
Het helpt om er bij stil te staan dat bij gebruik van deze tekens
De kant waar de ruimte tussen het = teken kleiner is, is de kant van de kleinere waarde. De ruimte waar dit juist groter is, is de kant van de grotere waarde. Gezien we van ‘links naar rechts’ lezen, is < het kleiner dan teken, en > het ‘groter dan’ teken.
Dus;
Vervolgens (nog steeds in de SPSS OUTPUT) kijk je naar het ‘test-statistic’. Deze wordt afhankelijk van de gekozen toets weergegeven met de letter r, t, F, U of X².
Het getal dat onder een van deze letters weergegeven zegt iets over de grootte van het verschil/effect (F) of het vertelt of er sprake is van een positieve (een positief getal) of negatieve (een min teken voor het getal) samenhang/effect.
Positief en negatief zijn geen waardeoordelen, ze zeggen niets over of iets goed of slecht is. Met positief wordt bedoeld dat wanneer de ene variabele toeneemt of afneemt in waarde (hoger of lager getal), dan ook de andere variabele hoger of lager in getal wordt. D.w.z. een ontwikkeling in de ene variabele gaat samen met een ontwikkeling ‘in dezelfde richting’ bij de andere variabele . Van een negatieve samenhang/correlatie is sprake wanneer deze richting tegenstrijdig zijn. Als het toenemen van de ene variabele samengaat met de afname van de andere variabele, of andersom. (let op; een afname in variabele A die samengaat met een afname in variabele B is dus een positieve correlatie omdat ze in dezelfde richting gerelateerd zijn)
Dit is vaak beter begrijpbaar met een aantal voorbeelden
(‘variabele A’ & ‘variabele B’ -> ‘soort correlatie’)
Schakel professionele hulp in om je te helpen met SPSS of met je gehele scriptie of studieopdracht.
Kies voor het ‘kopen’ van een kant en klaar paper, opdracht of scriptie bij een professionele partij.
Of lees een artikel over het hoe en wat van je scriptie laten schrijven op thesishulp.nl
Als je begrijpt hoe je de OUTPUT dient te interpreteren (stap 1 en 2) is het rapporteren vrij eenvoudig.
Het bestaat uit enkele conventies die je simpelweg even moet weten.
Je schrijft de bevinding eerst uit in woorden. Deze zin sluit je niet af met een ‘punt’, je zet er een ‘komma’ achter en na de komma komt de letter van je ‘test-statistic’ (afhankelijk van de gekozen toets) r, t, F, U of X².
‘Er is een significant verschil gevonden in …. tussen …. en …. , t(..)= …, p < .05‘
Na deze letter komt tussen haakjes het aantal ‘vrijheidsgraden’ te staan (‘df’), dit wordt gevold door het ‘=’ teken, en dan de waarde uit de SPSS OUTPUT (te vinden onder de letter van je test-statistic).
Dan komt een ‘,’ (komma), en dan de letter ‘p’ (weet je nog, deze staat voor de significantiewaarde).
Na deze ‘p’ komt ‘> .05’ (is groter dan 5%) of ‘< .05’ (is kleiner dan 5%). Welke van de twee (‘<’ of ‘>’) is af afhankelijk van de grootte van de waarde onder ‘sign.’ in de OUTPUT.
Je raadt het al; als deze waarde kleiner is dan .05 dan gebruik je ‘< .05’ (dit betekent dat je resultaat significant is). Is deze waarde groter dan .05, dan gebruik je ‘> .05’ (dit betekent voor de meeste toetsen dat je resultaat niet significant is).
Verder onder de ‘algemene voorbeelden’ vind je een uitvouwbare lijst met voorbeelden en uitleg voor het APA-stijl rapporteren van je resultaten specifiek per test.
(na bijvoorbeeld een t-Test:)
‘Er is een significant verschil gevonden in …. tussen …. en …. , t(..)= …, p < .05‘
(na bijvoorbeeld een Chi-square test:)
‘Er is een significant verschil gevonden in …. tussen …. en …. , X²(..)= …, p < .05‘
Tussen de haakjes (achter t bij t-test en achter X² bij Chi kwadraat test (ook wel ‘Chi-squared) vul je de ‘degrees of freedom’ (vrijheidsgraden) in. Deze kun je vinden onder kolom ‘df’ in de SPSS output).
Na het ‘=’ teken komt de daadwerkelijke test-value, ook deze vind je in de SPSS output.
Tot slot de p waarde. Bij een significant effect mag je ‘p < .05‘ zetten, je kunt er ook voor kiezen om de exacte waarde weer te geven, bijvoorbeeld ‘…p = .023‘ Maar gebruik maximaal 3 decimalen).
In de meeste gevallen wil je ook nog na een komma het aantal participanten invullen als N=… (met het aantal participanten op de plaats van de puntjes).
Overzicht APA stijl rapporteren van multipele regressie:
“A multiple regression was used to predict {afhankelijke variabele} from {onafhankelijke variabele 1} , {afhankelijke variabele 2} , {afhankelijke variabele 3} and {etc..} . These variables significantly predict {afhankelijke variabele} , F( {A} , {B} ) = {C} , p < {D} , R2 = {E} . All {aantal afhankelijke variabelen} variables added statistically significantly to the prediction, p < .05.”
Multipele regressie lijkt op simpele lineaire regressie, met het verschil dat er bij multipele regressie gekeken wordt naar meer dan 1 onafhankelijke variabele (‘de predictors’). Meetschaal van afhankelijke variabelemoet ‘continu’ (dwz ‘interval’ of ‘ratio’) zijn.
Het uitvoeren van de multipele regressie in SPSS (Analyze > regression > linear) geeft een aantal tabellen als output. Hiervan heb je de volgende 3 nodig;
A multiple regression was used to predict VO2max from gender, age, weight and heart rate. These variables significantly predicted VO2max, F(4, 95) = 32.393, p < .0005, R2 = .577. All four variables added significantly to the prediction, p < .05.
Overzicht APA stijl rapporteren van regressie analyse:
“A simple linear regression was used to predict {afhankelijke variabele} from {onafhankelijke variabele} . This variable significantly predicted {afhankelijke variabele} , F( {A} , {B} ) = {C} , p < {D} , R2 = {E} . Predicted {afhankelijke variabele} is equal to {F} , {+/- G} in {eenheid van onafhankelijke variabele; €/kg/meters/etc} per {eenheid onafhankelijke variabele; €/kg/etc} in {afhankelijke variabele} “
Lineaire regressie lijkt op zowel correlatie als op multipele regressie. Lineaire regressie wordt gebruikt voor het voorspellen van 1 variabele (onafhankelijke variabele, ook wel de ‘predictor’) op basis van 1 andere variabele (de afhankelijke variabele, ook wel de ‘outcome’ of ’target’). Dit wordt ook wel ‘simple linear regression’ genoemd. Meetschaal van variabelen moet ‘continu’ (dwz ‘interval’ of ‘ratio’) zijn.
Het uitvoeren van de lineaire regressie in SPSS (Analyze > regression > linear) geeft een aantal tabellen als output. Hiervan heb je de volgende 3 nodig;
A simple linear regression was used to predict price from income. This variable significantly predicted price, F(4, 95) = 57.737, p < .0005, R2 = .762. Predicted price is equal to 8286.786, + .564 (€) per euro in income “
Overzicht APA stijl rapporteren van Chi square test:
“A Chi square test was performed to determine whether {afhankelijke variabele} differed between {categorie 1 van onafhankelijke variabele} and {categorie 2 van onafhankelijke variabele} . {afhankelijke variabele} was found not to be significantly different between {categorie 1 van de onafhankelijke variabele} and {categorie 2 van onafhankelijke variabele} , χ²({A}) = {B} , p = {C} . “
Chi kwadraat test (‘Chi square test’) is een test waarbij regelmatig wat verwarring ontstaat doordat het eigenlijk 3 verschillende test zijn. Namelijk de;
In de meeste gevallen (van studentenonderzoek) bedoelen met ‘chi kwadraat test’ de independence variant. Ze lijken overigens erg veel op elkaar, het zijn slechts kleine verschillen in design die bepalen welke van deze drie voor jou de meest juiste is. Maar voor nu nemen we de meest gebruikte Chi kwadraat test (chi square test of independence).
Als je wilt weten of twee categorische variabelen (meetlevel categorisch, dwz ordinaal of nominaal) aan elkaar gerelateerd zijn in de populatie. In dit voorbeeld gebruiken we de Chi-square test om te toetsen of er een verschil is tussen man en vrouw wat betreft hun voorkeur in lesmateriaal (‘online’ of ‘books’).
Analyze > Descriptive Statistics > Crosstabs , aanvinken ‘display clustered bars charts‘. Klik op ‘Statistics‘ vink ‘Chi-square‘ en ‘Phi & Cramer’s V‘ aan. Klik op ‘Continue‘ > ‘Cells‘. Vink onder ‘Counts‘, ‘Observed‘ aan, en vink alles onder ‘Percentages’ aan.
Het uitvoeren van de Chi kwadraat in SPSS geeft een aantal tabellen als output;
“A Chi square test was performed to determine whether preferred learning material (‘online’ vs ‘books’) differed between men and women. Preferred learning material was found not to be significantly different between men and women , χ²(1) = .487 , p > .05 . “
Overzicht APA stijl rapporteren Mann Whitney U test:
“A Mann-Whitney U test was used to determine whether {afhankelijke variabele} differed between {onafhankelijke variabele 1} and {afhankelijke variabele 2} . {afhankelijke variabele} in the {onafhankelijke variabele 1} group was found to be significantly higher/lower than in the{onafhankelijke variabele 1} group, U = {A} , p = {B} . “
Mann-Whitney U test lijkt op een t-toets maar maakt het mogelijk om verschillen tussen groepen te toetsen in bepaalde gevallen waar de t-toets dit niet kan. Bijvoorbeeld wanneer je data niet normaal verdeeld is of de ‘shape’ van de data per groep erg verschilt. Kort gezegd maakt de Mann Whitney test dit mogelijk door gebruik te maken van ranking.
Als je twee onafhankelijk groepen vergelijkt (‘between groups design’) waarbij je afhankelijk variabele (je ‘outcome’ variabele, ook wel je ’target variabele’) van ordinaal of continue meetlevel is, maar deze niet ‘normaal verdeeld’ is. (De Mann Whitney U-test is dan ook een ‘non-parametric’ test, en wordt ook zo aangeduid in SPSS.)
Analyze > Nonparametric Tests > Legacy Dialogs > 2 Independent Samples, aanvinken ‘mann whitney U test’
Het uitvoeren van de multipele regressie in SPSS (Analyze > Nonparametric Tests > Legacy Dialogs > 2 Independent samples) geeft een aantal tabellen als output;
“A Mann-Whitney U test was used to determine whether cholesterol concentration differed between diet and exercise . Cholesterol concentration in the diet group was found to be significantly higher than in the exercise group, U = 110, p = .014 .”
Voorbeeld APA stijl rapporteren van ANOVA
…volledige zin... , F(df1,df2)= ..waarde.., p < .05 –
Nog geen verdere informatie beschikbaar-
Voorbeeld APA stijl rapporteren van MANOVA
-Nog geen verdere informatie beschikbaar-
Voorbeeld APA stijl rapporteren van de independent samples t-toets:
‘Er is een significant verschil gevonden in … tussen … en …, t(…)= …, p < .05‘.of‘Er is geen significant verschil gevonden in … tussen … en …, t(…)= …, p > .05‘.
Je onderzoek in dit voorbeeld gaat over hoe oud mensen worden (leeftijd), en je wilt weten (hier wordt de hypothese uit afgeleid) of rokende mensen een minder oud worden (d.w.z. eerder overlijden).
‘Sterfleeftijd’ is dus je afhankelijke (dependent / outcome) variabele, het schaaltype hiervan is ‘continu‘.
Roken (in dit voorbeeld wel of niet roken) is je onafhankelijke (predictor) variabele, het schaaltype hiervan is ‘categorisch‘ (en specifieker ‘dichotoom’ wat onder categorisch valt).
De voornaamste vraag die je in dit onderzoek eigenlijk stelt is ‘is de gemiddelde sterfleeftijd van rokers (in mijn sample) lager dan de sterfleeftijd van niet-rokers (in mijn sample), en is dit verschil in sterfleeftijd (afgezet tegen verschillen in sterfleeftijd binnen de groepen) groot genoeg op te concluderen dat dit geen toeval is (of dit dus ook geldt voor de populatie en niet enkel mijn sample)?’
Een uiteindelijk resultaat zou dan als volgt verwoord kunnen worden;
‘Er is een significant verschil gevonden in sterfleeftijd tussen rokers en niet-rokers, t(12)= -1.23, p < .05‘.
Hierna leg je uit dat -in dit voorbeeld- bij de rokers groep de sterfleeftijd significant (want p < .05) lager lag dan bij de niet-rokers groep, eigenlijk met name om de interpretatie van het (de richting van het) verschil voor de lezer makkelijker te maken.
Voorbeeld APA stijl rapporteren van een paired samples t-toets
…volledige zin... , t(df)= ..waarde.. , p < .05
-Nog geen verdere informatie beschikbaar-
Voorbeeld APA stijl rapporteren van de Pearson correlatie
…volledige zin... , r(df)= ..waarde.. , p < .05
-Nog geen verdere informatie beschikbaar-
Voorbeeld APA stijl rapporteren van de Kruskal Wallis test
…volledige zin... , H(df)= ..waarde.. , p < .05
-Nog geen verdere informatie beschikbaar-
Voor meer informatie over statistiek met SPSS adviseren we ‘Discovering Statistics with SPSS’ van Andy Field. |
Terug naar het ‘4 stappen overzicht’.