16. maj 2011 - 11:09Der er
5 kommentarer og 1 løsning
Hvordan beregner jeg statistisk validitet af data?
Hej folkens
Jeg har indsamlet nogle data, som jeg nu skal beregne validiteten af... Men er noget i tvivl om, hvordan jeg gør det.
Mine data (forsimplet):
Jeg har en kolonne med 62 besvarelser (fra N3 til N64). Hver celle i kolonnen rummer et tal fra 1 til 6 (som er det, en respondent har angivet i et spørgeskema).
I celle D3 beregner jeg kolonnens gennemsnitsværdi til 4,32.
Nu vil jeg gerne vide, hvor statistisk sikkert dette tal er... Hvordan gør jeg det?
Har forsøgt mig med CHI2.FORDELING(D3;1;N3:N64) - men aner ikke om dette er korrekt. Resultatet af beregningen er 0,962 - men er det overhovedet det rigtige jeg får beregnet?
Når jeg bruger beskrivende statistik, så får jeg følgende output:
Kolonne1
Middelværdi 4,322580645 Standardfejl 0,133643158 Median 4 Tilstand 4 Standardafvigelse 1,052307278 Stikprøvevarians 1,107350608 Kurtosis 0,978779585 Skævhed -0,777025446 Område 5 Minimum 1 Maksimum 6 Sum 268 Antal 62 Konfidensniveau(95,0%) 0,267236011
jeg går ud fra, at det er konfidensniveauet, jeg skal bruge, men er lidt i tvivl om, hvad tallet repræsenterer.
Skal det forstås som et +/- interval med udgangspunkt i middelværdien, men hvad er det, de 95% repræsenterer?
Har læst følgende fra Microsofts hjælp, men da jeg ikke er statistiker, virker det lidt som sort snak: En værdi på 95% beregner f.eks. konfidensniveauet for middelværdien med en signifikans på 5%.
Ja det skal opfattes som et plus minus interval. Dvs. hvis du trækker værdien fra middelværdien i den ene ende og lægger den til i den anden ende har du dit konfidensinterval. Det betyder, at der er 95 % sandsynlighed for at den "rigtige" middelværdi ligger i dette interval. Men der er altså 5 % chance for at middelværdien reelt ligger udenfor intervallet.
Så med din stikprøve kan man sige, at: "middelværdien med 95 pct. sandsynlighed ligger i intervallet {4,06 ; 4,58}."
Da jeg skal bruge dataene til et universitetsspeciale, vil jeg lige høre, om den fagkorrekte betegnelse for værdien 0,267236011 er Konfidensniveau (så jeg kan få koblet lidt faglitteratur på)?
Hmm, nej konfidensniveauet for middelværdien er her 95 pct. Det kan du ændre i Excel til eksempelvis 90 pct. eller 99 pct. Jo større konfidensniveauet/sikkerhedsniveauet er, jo bredere vil dit interval blive.
Grunden til det er, at du vil have større sikkerhed for at din middelværdi ligger indenfor intervallet, og således mindre sandsynlighed for at den rigtige middelværdi ligger udenfor intervallet. I 99 pct.-eksemplet er der således blot 1 pct. sandsynlighed for at den sande middelværdi ligger uden for dit interval.
Størrelsen 0,2672 svarer approksimativt til 2*standardfejlen, som du ligeledes kan se i dit Excel-output. Når den fratrækkes middelværdien fås den nedre konfidensgrænse og når den tillægges fås den øvre konfidensgrænse.
Lige på dette punkt er excel ikke særligt pædagogisk, når man ikke er statistiker - så er det rart med lidt forståelsesassistence. :o)
Synes godt om
Ny brugerNybegynder
Din løsning...
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.