You are in browse mode. You must login to use MEMORY

level: Statistisk inferens

Questions and Answers List

level questions: Statistisk inferens

Question	Answer
Hvad er en z-score?	En z-score er for en værdi, det antal standardafvigelser, som værdien falder fra gennemsnittet
Hvad er en stokastisk variabel?	En variabel, hvor der indgår et element af tilfældighed
Hvad er en normalfordeling?	Sandsynlighedsfordeling, som er normalfordelt ved gennemsnittet (bell shaped - klokkeformet). Kurtosis på 3 og skævhed på 0.
Hvad er en standardnormalfordeling?	Sandsynlighedsfordeling, hvor gennemsnit er på 0 og en standardafvigelse på 1
Hvad betyder simpel tilfældig udtrækning?	At man tilfældigt vælger en stikprøve i populationen
Hvad er en stikprøvefordeling?	Det er en fordeling over stikprøvens observationer
Hvad er en stikprøvemålsfordeling?	En fordeling over stikprøvernes gennemsnit, som er normalfordelt
Hvad er en t-fordeling?	Sandsynlighedsfordeling, der opfører sig som en normalfordeling, men den afhænger af hvor stort n er. Når n>30 så ligner det en normalfordeling.
Hvad er den central grænseværdisætning?	Hvordan vi kan forvente at stikprøvemålsfordelingen kommer til at se ud, når n er høj. // Når vi får et højere n, så nærmer det sig en normalfordeling
Hvad er "Law of Large numbers?	Jo større n → jo lavere standardafvigelse i stikprøvemålsfordeling dvs. (mindre variation og dermed usikkerhed) → jo mere konsistente stikprøvemål. // Jo højere n, desto mere sandsynligt at stikprøvemålsfordelingens gennemsnit er populationsgennemsnittet
Hvad er en standardfejl?	Standardafvigelsen i en stikprøvemålsfordeling
Hvad er en estimator?	En regneforskrift for hvordan man ud fra observererede værdier beregner (bedste bud) vrædien af parameter (fx. gennemsnittet)
Hvad kendetegner en middelret estimator?	En estimator er middelret, hvis den i gennemsnit rammer en parameter rigtigt
Hvad er en sandsynlighedsfordeling	En fordeling, der beskriver sandsynligheden for at observationerne placerer sig i et datasæt
Hvad er standardfejlen et estimat af?	Stikprøvens standardafvigelse
Hvad udtrykker en p-værdi?	P-værdien er lig sandsynligheden for at observere et stikprøvemål lig det observerede eller stikprøvemål, som er mere ekstreme i retningen af den alternative hypotese, under antagelse af at nul-hypotesen er korrekt.
Hvad er et konfidensinterval?	Et interval, hvori vi regner med at vores sande parameter med en vis sikkerhed falder indenfor. Fx. 95% sikkerhed for populationsparameteret ved et 95%-konfidensinterval. Hvis konfidensintervallet ikke inkluderer 0, så er det statistisk signifikant.
Er 5,56 eks. en variabel?	Nej, det er et estimat.
Hvad er et estimat?	En specifik værdi estimatoren kan antage, udregnet pba. en stikprøve
Hvad kendetegner en efficient estimator?	En estimator er efficient, hvis den har en lav grad af varians. Altså når dens standardafvigelser er mindre end andre potentielle estimatorer.
Hvad er et punktestimat?	Vores bedste bud på hvad en given sand parameter er?
Hvornår siger man 95% sandsynlighed for og 95% sikre for ifht konfidensintervaller?	Sandsynlighed er for selve estimatoren inden vi realiserer nogen stikprøver, mens sikkerhed er efter vi har realiseret stikprøver
Hvad er en t-værdi?	Antal standardfejl, ens stikprøvemål falder fra nulhypotesen
Hvordan analyserer man forskellen mellem to gruppers gennemsnit?	Ved hypotesetest
Hvad er en type 1 fejl?	Vi afviser nulhypotesen, selvom den er sand (falske positiver) (1 ud af 20 gange)
Hvad er en type II fejl?	Vi afviser ikke nulhypotesen, selvom den er falsk (falske negativer)
Hvad er statistisk signifikans?	Når vi kan afvise nulhypotesen med 95% sikkerhed gennem statistik
Hvad er substantiel signifikans?	Vurdering udfra teori og baggrundsforventninger. Så om den statistiske signifikans giver mening at konkludere substantielt på.
Hvad er et alpha-niveau?	Den kritiske testværdi
Hvad er forskellen på t-test og f-test, og hvad kan man bruge f-testen til?	T-testen er vores foretrukne redskab til at lave signifikanstest, men den har én central begrænsning: T-testen kan ikke håndtere/opsummere multiple tests. Det kan F-testen tilgengæld. Derfor brugbar i følgende: - Test af samtlige kategorier på en kategorisk variabel på én gang. Er en kategorisk variabel ”samlet set” signifikant? - Test af samtlige variable i regressionsmodellen. - Balancetests ved ovenstående metoder: er relevante baggrundsvariable samlet set korreleret med X? Hvis ja, så er risikoen for, at X er korreleret med fejlledet meget høj!