Hvad er en z-score? | En z-score er for en værdi, det antal standardafvigelser, som værdien falder fra gennemsnittet |
Hvad er en stokastisk variabel? | En variabel, hvor der indgår et element af tilfældighed |
Hvad er en normalfordeling? | Sandsynlighedsfordeling, som er normalfordelt ved gennemsnittet (bell shaped - klokkeformet).
Kurtosis på 3 og skævhed på 0. |
Hvad er en standardnormalfordeling? | Sandsynlighedsfordeling, hvor gennemsnit er på 0 og en standardafvigelse på 1 |
Hvad betyder simpel tilfældig udtrækning? | At man tilfældigt vælger en stikprøve i populationen |
Hvad er en stikprøvefordeling? | Det er en fordeling over stikprøvens observationer |
Hvad er en stikprøvemålsfordeling? | En fordeling over stikprøvernes gennemsnit, som er normalfordelt |
Hvad er en t-fordeling? | Sandsynlighedsfordeling, der opfører sig som en normalfordeling, men den afhænger af hvor stort n er. Når n>30 så ligner det en normalfordeling. |
Hvad er den central grænseværdisætning? | Hvordan vi kan forvente at stikprøvemålsfordelingen kommer til at se ud, når n er høj. // Når vi får et højere n, så nærmer det sig en normalfordeling |
Hvad er "Law of Large numbers? | Jo større n → jo lavere standardafvigelse i stikprøvemålsfordeling dvs. (mindre variation og dermed usikkerhed) → jo mere konsistente stikprøvemål. // Jo højere n, desto mere sandsynligt at stikprøvemålsfordelingens gennemsnit er populationsgennemsnittet |
Hvad er en standardfejl? | Standardafvigelsen i en stikprøvemålsfordeling |
Hvad er en estimator? | En regneforskrift for hvordan man ud fra observererede værdier beregner (bedste bud) vrædien af parameter (fx. gennemsnittet) |
Hvad kendetegner en middelret estimator? | En estimator er middelret, hvis den i gennemsnit rammer en parameter rigtigt |
Hvad er en sandsynlighedsfordeling | En fordeling, der beskriver sandsynligheden for at observationerne placerer sig i et datasæt |
Hvad er standardfejlen et estimat af? | Stikprøvens standardafvigelse |
Hvad udtrykker en p-værdi? | P-værdien er lig sandsynligheden for at observere et stikprøvemål lig det observerede eller stikprøvemål, som er mere ekstreme i retningen af den alternative hypotese, under antagelse af at nul-hypotesen er korrekt. |
Hvad er et konfidensinterval? | Et interval, hvori vi regner med at vores sande parameter med en vis sikkerhed falder indenfor. Fx. 95% sikkerhed for populationsparameteret ved et 95%-konfidensinterval.
Hvis konfidensintervallet ikke inkluderer 0, så er det statistisk signifikant. |
Er 5,56 eks. en variabel? | Nej, det er et estimat. |
Hvad er et estimat? | En specifik værdi estimatoren kan antage, udregnet pba. en stikprøve |
Hvad kendetegner en efficient estimator? | En estimator er efficient, hvis den har en lav grad af varians. Altså når dens standardafvigelser er mindre end andre potentielle estimatorer. |
Hvad er et punktestimat? | Vores bedste bud på hvad en given sand parameter er? |
Hvornår siger man 95% sandsynlighed for og 95% sikre for ifht konfidensintervaller? | Sandsynlighed er for selve estimatoren inden vi realiserer nogen stikprøver, mens sikkerhed er efter vi har realiseret stikprøver |
Hvad er en t-værdi? | Antal standardfejl, ens stikprøvemål falder fra nulhypotesen |
Hvordan analyserer man forskellen mellem to gruppers gennemsnit? | Ved hypotesetest |
Hvad er en type 1 fejl? | Vi afviser nulhypotesen, selvom den er sand (falske positiver) (1 ud af 20 gange) |
Hvad er en type II fejl? | Vi afviser ikke nulhypotesen, selvom den er falsk (falske negativer) |
Hvad er statistisk signifikans? | Når vi kan afvise nulhypotesen med 95% sikkerhed gennem statistik |
Hvad er substantiel signifikans? | Vurdering udfra teori og baggrundsforventninger. Så om den statistiske signifikans giver mening at konkludere substantielt på. |
Hvad er et alpha-niveau? | Den kritiske testværdi |
Hvad er forskellen på t-test og f-test, og hvad kan man bruge f-testen til? | T-testen er vores foretrukne redskab til at lave signifikanstest, men den har én central
begrænsning: T-testen kan ikke håndtere/opsummere multiple tests.
Det kan F-testen tilgengæld. Derfor brugbar i følgende:
- Test af samtlige kategorier på en kategorisk variabel på én gang. Er en kategorisk variabel ”samlet set” signifikant?
- Test af samtlige variable i regressionsmodellen.
- Balancetests ved ovenstående metoder: er relevante baggrundsvariable samlet set korreleret med X? Hvis ja, så er risikoen for, at X er korreleret med fejlledet meget høj! |