Metode II
🇩🇰
In Danish
In Danish
Practice Known Questions
Stay up to date with your due questions
Complete 5 questions to enable practice
Exams
Exam: Test your skills
Test your skills in exam mode
Learn New Questions
Manual Mode [BETA]
Select your own question and answer types
Specific modes
Learn with flashcards
Listening & SpellingSpelling: Type what you hear
multiple choiceMultiple choice mode
SpeakingAnswer with voice
Speaking & ListeningPractice pronunciation
TypingTyping only mode
Metode II - Leaderboard
Metode II - Details
Levels:
Questions:
170 questions
🇩🇰 | 🇩🇰 |
Hvordan opnår man kausal inferens? | Ved tilfældig tildeling af treatment |
Hvad er kausalitet? | Årsagssammenhæng |
Hvad er en kausal effekt? | Den påvirkning, som en årsag forårsager |
Hvad betyder potentielle udfald? | De udfald, som hypotetisk kan tænkes at en person/enhed kan havne i ved at vælge enten det faktiske eller kontrafaktiske valg. |
Hvad er det fundamentale kausalitetsproblem? | At vi ikke kender den kontrafaktiske virkelighed |
Hvad er selektion? | Forskelle mellem den treatede og ikke-treatede gruppe |
Hvad er selektionsbias? | Forskellen mellem den sande kausaleffekt og den estimerede kausaleffekt |
Hvad er balance og hvad er grunden til at bruge dette? | Sammenligning af forskelle i gennemsnit ved eksperimentelle data. Bruges til at teste den interne validitet. |
Hvad er intern validitet? | At undersøgelsen kan udtale sig om kausaleffekt. Så gyldigheden af vores kausalslutning. Kræver at vores identifikationsantagelse er opfyldt. |
Hvad er ekstern validitet? | Generaliserbarheden af undersøgelsen. Grundlæggende handler det om ensartethed jf. Mutz-teksten. Ensartethed mellem: - Undersøgelsens variable og de fænomener, der skal måles (herunder målingsvaliditet) - Undersøgelsens enheder og den population, vi gerne vil inferere til - Undersøgelsens setting og den setting, vi gerne vil inferere til |
Hvad er forskellen på observationelle og eksperimentelle data? | Eksperimentelle data er data fra eksperimenter, hvor man som forsker, selv påvirker data. Observationelle data er datafra den "virkelige verden", hvor forskeren observerer en række fænomener, men ikke manipulerer dem |
Hvad kendetegner eksperimentelle forskningsdesigns? | Tilfældig tildeling af treatment. Derudover at X er uafhængig af andre variable og potentielle outcomes. |
Hvorfor er eksperimentelle forskningsdesigns generelt gode til at afdække kausaleffekter? | Høj intern validitet |
Hvad er problemet med selektionsbias? | At den kausaleffekt, som vi observerer, ikke er den sande kausaleffekt, men derimod skyldes selektionsbias |
Hvordan opnår man statistisk inferens? | Ved tilfældig udtrækning af stikprøve fra den population vi gerne vil inferere til |
Hvad er vores identifikationsantagelser? | For DD: parallel trends assumption For alle andre: Ens potentielle outcomes for forskellige niveauer af vores uafhængige variabel |
Hvad er mundæn og eksperimentel realisme (jf Mutz)? | Mundæn: Hvorvidt den eksperimentelle setting afspejler den virkelige verden. Eksperimentel: Hvorvidt eksperimentet virker virkeligt for enheden / individet. |
Hvad er et manipulationstjek ved eksperimentel realisme? | At man anskuer treatment som T, mens man anskuer det fænomen, som vi gerne vil manipulere som M. Hvis T har en effekt på M, tyder det på, at den eksperimentelle realisme er høj. |
Hvad er faktoranalyse og hvad kan det bruges til? | Formålet med faktoranalyse er at finde ud af, hvordan man ud fra sine items kan danne indeks Man skaber et plan gennem mange dimensioner, som de forskellige variable skaber. Faktor 1 forklarer noget af variation. Faktor 2 vil forklare mindre af variationen, da faktor 1 kunne forklare det meste. Derfor scorer faktor 1 altid højest på eigenværdi. Derfor roterer man planet (faktorerne), for at korrelere og kunne forklare mere ligeligt. |
Hvordan bruges faktoranalyse i indekskonstruktion? | 1. Udvælger man items 2. Faktoranalysen danner en række faktorer 3. Beholder faktorer, hvis eigenværdi er over 1 (suppleres gerne med Scree-plot) 4. Der er lav rotation, hvis der er udtrukket flere faktorer 5. Inspicerer korrelation mellem items og de enkelte faktorer og accepterer factor loadings ned til 0,3 |
I hvilke typer spørgsmål er hhv. intern validitet og ekstern validitet vigtigst? | Intern validitet: Kausale spørgsmål Ekstern validitet: Deskriptive spørgsmål |
Hvad er forskellen på eksperimentel og mundæn realisme jf. ekstern validitet? | Eksperimentel realisme: Er eksperimentet virkeligt for individet? Mundæn realisme: Afspejler den eksperimentelle situation den virkelige verden? |
Hvilke 3 centrale antagelser findes ved faktoranalyse? | 1. Linearitet mellem items og faktor (intervalskalerede variable nødvendige) 2. Ingen kausalitet mellem items 3. Stort antal items (mere end 2) |
Hvad gør et screeplot? | Plotter faktorernes eigenværdier (kend den på knækket) |
Hvilke to muligheder er der for rotation i en faktoranalyse? | 1. Promax - tillader at faktorerne er korrelerede 2. Varimax - tillader ikke, at faktorerne er korrelerede |
Hvad mener Mutz om trade-off mellem intern og ekstern validitet? | Generaliseringsbegrebet skal bredes ud, hvilket også betyder at det antagede trade-off mellem int. og ekst. validitet er en skrøne. |
Hvad er en placebo-test jf. intern validitet? | En test, som kan sandsynliggøre intern validitet Hvis identifikationsantagelsen er korrekt, burde vi ikke kun identificere en effekt af X på Y: vi burde også identificere en nul-effekt (ingen effekt) af X på Y(placebo) eller af X(placebo) på Y |
Hvad er Cohens D? | Det er et standardiseret mål for effektstørrelser, hvor man tager forskellen i gns / standardafvigelsen. 0,2 er lille effekt, 0,5 er mellem effekt og 0,8 er stor effekt. |
Hvad er en z-score? | En z-score er for en værdi, det antal standardafvigelser, som værdien falder fra gennemsnittet |
Hvad er en stokastisk variabel? | En variabel, hvor der indgår et element af tilfældighed |
Hvad er en normalfordeling? | Sandsynlighedsfordeling, som er normalfordelt ved gennemsnittet (bell shaped - klokkeformet). Kurtosis på 3 og skævhed på 0. |
Hvad er en standardnormalfordeling? | Sandsynlighedsfordeling, hvor gennemsnit er på 0 og en standardafvigelse på 1 |
Hvad betyder simpel tilfældig udtrækning? | At man tilfældigt vælger en stikprøve i populationen |
Hvad er en stikprøvefordeling? | Det er en fordeling over stikprøvens observationer |
Hvad er en stikprøvemålsfordeling? | En fordeling over stikprøvernes gennemsnit, som er normalfordelt |
Hvad er en t-fordeling? | Sandsynlighedsfordeling, der opfører sig som en normalfordeling, men den afhænger af hvor stort n er. Når n>30 så ligner det en normalfordeling. |
Hvad er den central grænseværdisætning? | Hvordan vi kan forvente at stikprøvemålsfordelingen kommer til at se ud, når n er høj. // Når vi får et højere n, så nærmer det sig en normalfordeling |
Hvad er "Law of Large numbers? | Jo større n → jo lavere standardafvigelse i stikprøvemålsfordeling dvs. (mindre variation og dermed usikkerhed) → jo mere konsistente stikprøvemål. // Jo højere n, desto mere sandsynligt at stikprøvemålsfordelingens gennemsnit er populationsgennemsnittet |
Hvad er en standardfejl? | Standardafvigelsen i en stikprøvemålsfordeling |
Hvad er en estimator? | En regneforskrift for hvordan man ud fra observererede værdier beregner (bedste bud) vrædien af parameter (fx. gennemsnittet) |
Hvad kendetegner en middelret estimator? | En estimator er middelret, hvis den i gennemsnit rammer en parameter rigtigt |
Hvad er en sandsynlighedsfordeling | En fordeling, der beskriver sandsynligheden for at observationerne placerer sig i et datasæt |
Hvad er standardfejlen et estimat af? | Stikprøvens standardafvigelse |
Hvad udtrykker en p-værdi? | P-værdien er lig sandsynligheden for at observere et stikprøvemål lig det observerede eller stikprøvemål, som er mere ekstreme i retningen af den alternative hypotese, under antagelse af at nul-hypotesen er korrekt. |
Hvad er et konfidensinterval? | Et interval, hvori vi regner med at vores sande parameter med en vis sikkerhed falder indenfor. Fx. 95% sikkerhed for populationsparameteret ved et 95%-konfidensinterval. Hvis konfidensintervallet ikke inkluderer 0, så er det statistisk signifikant. |
Er 5,56 eks. en variabel? | Nej, det er et estimat. |
Hvad er et estimat? | En specifik værdi estimatoren kan antage, udregnet pba. en stikprøve |
Hvad kendetegner en efficient estimator? | En estimator er efficient, hvis den har en lav grad af varians. Altså når dens standardafvigelser er mindre end andre potentielle estimatorer. |
Hvad er et punktestimat? | Vores bedste bud på hvad en given sand parameter er? |
Hvornår siger man 95% sandsynlighed for og 95% sikre for ifht konfidensintervaller? | Sandsynlighed er for selve estimatoren inden vi realiserer nogen stikprøver, mens sikkerhed er efter vi har realiseret stikprøver |
Hvad er en t-værdi? | Antal standardfejl, ens stikprøvemål falder fra nulhypotesen |
Hvordan analyserer man forskellen mellem to gruppers gennemsnit? | Ved hypotesetest |
Hvad er en type 1 fejl? | Vi afviser nulhypotesen, selvom den er sand (falske positiver) (1 ud af 20 gange) |
Hvad er en type II fejl? | Vi afviser ikke nulhypotesen, selvom den er falsk (falske negativer) |
Hvad er statistisk signifikans? | Når vi kan afvise nulhypotesen med 95% sikkerhed gennem statistik |
Hvad er substantiel signifikans? | Vurdering udfra teori og baggrundsforventninger. Så om den statistiske signifikans giver mening at konkludere substantielt på. |
Hvad er et alpha-niveau? | Den kritiske testværdi |
Hvad er forskellen på t-test og f-test, og hvad kan man bruge f-testen til? | T-testen er vores foretrukne redskab til at lave signifikanstest, men den har én central begrænsning: T-testen kan ikke håndtere/opsummere multiple tests. Det kan F-testen tilgengæld. Derfor brugbar i følgende: - Test af samtlige kategorier på en kategorisk variabel på én gang. Er en kategorisk variabel ”samlet set” signifikant? - Test af samtlige variable i regressionsmodellen. - Balancetests ved ovenstående metoder: er relevante baggrundsvariable samlet set korreleret med X? Hvis ja, så er risikoen for, at X er korreleret med fejlledet meget høj! |
Hvad er varians? | Gennemsnitlige kvadrerede afvigelse fra gennemsnittet |
Hvilke vigtige momenter er der? | Gennemsnit, varians, std.dev, skævhed og kurtosis |
Hvilke vigtige percentiler er der? | Median, nedre og øvre percentil, interkvartilafstand og outliers |
Hvad er variationsbredde? | Forskellen mellem den største og mindste værdi |
Hvad er standardafvigelse? | Den typiske afvigelse fra gennemsnittet |
Hvad er skævhed? | Om den er normalfordelt (observationer centreret omkring gns), højreskæv (flere observationer til venstre for gns) eller venstreskæv (flere observationer til højre for gns) |
Hvad er kurtosis? | Hvor spids fordelingen er. Hvor tæt på gennemsnittet observationerne er. |
Hvad er gennemsnit? | Summen af observationer divideret med antal observationer |
Hvad er interkvartilafstand? | Forskellen mellem den nedre og den øvre kvartil. |
Hvad er et percentil? | Det punkt, hvor x% af observationerne er under eller på dette punkt |
Hvad er median? | Værdien af den enhed, som ligger midt i rækken af enheder, når enhederne er rangordnet efter stigende værdi. |
Hvad er outliers? | En observation, som er 1,5(IQR) over det øvre kvartil eller 1,5(IQR) under det nedre kvartil. |
Hvad er et densityplot? | En grafisk fremstilling af fordeling af en population |
Hvad er residualet? | Forskellen mellem det observerede punkt og regressionslinjen |
Hvad er parametrene β0 og β1 i den lineære regressionsmodel og hvordan fortolkes de? | Β0 er en konstant, som er skæringspunktet i y-aksen. β1 er hældningskoefficienten og hvis antagelsen om fravær af selektionsbias holder, så er β1 vores kausal effekt. |
Hvad er residualet? | Forskellen mellem det observerede punkt og regressionslinjen |
Hvad er residualet? | Forskellen mellem det observerede punkt og regressionslinjen |
Hvordan estimeres parametrene β0 og β1? | Reg yvar xvar (i Stata) |
Hvad er R^2 og fortæller den noget om intern validitet? | Den del af variationen i Y, som er forklaret af X i procent. Det er målet for modellens "fit". Den fortæller ikke noget om intern validitet, da den ikke siger noget om selektionsbias og dermed kausalitet. |
Hvad betyder antagelsen om, at E(u|x) = 0 og hvilket forhold har antagelsen til selektionsbias? | At fejlleddet er ukorreleret med x. At der er kausal inferens eller fravær af selektionsbias. Enheder med forskellige niveauer af x skal have ens potentielle outcomes. Hvis x er korreleret med faktorer (under fejlleddet), så er x korreleret med fejlleddet. Evt. se slides 5-9 på forelæsning 9 |
Hvad er fejlledet? | Det uforklarede i Y ud fra X. Eller alle de faktorer, der forklarer Y, men som ikke er inkluderet i regressionsmodellen som variable. |
Hvordan fungerer statistisk kontrol i den multiple regressionsmodel? Bruges dette til at styrke eller teste den interne validitet? | Man fjerner den variation af X, som kan forklares af kontrolvariablen, ved at holde kontrolvariablen konstant. Dette gøres for at styrke den interne validitet. |
Hvad er udeladt variabel bias (UVB)? | Bias i den observerede sammenhæng, som skyldes, at vi ikke har inddraget nogle variable som kontrolvariable. Det sker hvis den udeladte variable korellerer med regressoren (X) og hvis den udeladte variable er afhængig af den afhængige variabel (Y). |
Hvordan hænger UVB sammen med selektionsbias og E(u|x) = 0? | UVB svarer til selektionsbias. Når der er selektionsbias, så er fejlleddet korreleret med x, altså ikke E(u|x)=0. |
Hvordan kan vi vide om UVB forårsager, at vi under- eller overestimerer effekten af X? | Hvis Z korrelerer positivt eller negativt med både X og Y, så er der positiv bias, hvor man vil overestimere ved en positiv sammenhæng ml. X og Y og underestimere ved en negativ sammenhæng ml. X og Y. // Hvis Z korrelerer positivt med enten X og Y og negativt med den anden, så er der negativ bias, hvor man vil underestimere ved en positiv sammenhæng ml. X og Y og overrestimere ved en negativ sammenhæng ml. X og Y. |
Hvad definerer en god og en dårlig kontrolvariabel? | Dårlige kontrolvariable: Post-treatment bias, hvor variable ligger efter X i tid. Problemet er nemlig, at den vil tage noget af "effekten" ud af X (den uafhængige variable) Gode kontrolvariable: Variable, som påvirker X og Y og ligger før i tid |
Hvad vil det sige, at en kontrolvariabel skaber post-treatment bias? | At en baggrundsvariable er efter den uafhængige variabel (X) i tid, så at den ikke påvirker X, men er påvirket af X. Dette giver bias. |
Hvad er multikollinearitet? | Når to regressor er perfekt multikollineare, så betyder det, at en af regressorne er en perfekt lineær funktion af en af de andre regressorer. At der skal være selvstændig variation i X (uafhængige variable) efter vi har kontrolleret for kontrolvariablen. Stata fortæller, hvis der er perfekt multikollinearitet ved at fjerne den ene koefficient. Hvis der er næsten perfekt multikollinearitet, så kan man estimere med og uden Z og kigge på standardfejlen. |
Hvordan foretages en regressionsanalyse med en kategorisk uafhængig variabel (i stata)? | Med i. foran variablen, hvor stata tager den første kategori som referencekategori, hvor effekten på de andre er i forhold til referencekategorien. |
Hvad er residualet? | Forskellen mellem det observerede punkt og regressionslinjen |
Hvad er linearitetsantagelsen? | Effekten af X på Y er "beta 1" på tværs af X. Hvis sammenhængen ikke er lineær, men at vi kontrollerer lineært, så er det et problem. Skal undersøges grafisk i et acpr-plot. |
Hvad gør at standardfejlen er mindre? | Mindre residualer, større stikprøve og mere variation i X. |
Hvordan fortolkes "beta hat 1" i den multiple regressionsmodel? | Hældningskoefficienten, når der kontrolleres for kontrolvariable. |
Hvad indebærer en statistisk hypotesetest i en regressionsanalyse? | Tester hvad sandsynligheden er for at hældningskoefficienten er lig det estimerede eller mere ekstrem givet at hældningskoefficienten er nul (nulhypotese). |
Hvad er standardfejlen for hældningskoefficienten "beta hat 1", et estimat af? | Standardafvigelsen i stikprøvemålsfordelingen for vores hældningskoefficient. Så den typiske afstand mellem den sande og estimerede hældningskoefficient. |
Hvad udtrykker p-værdien for hældningskoefficienten? | Sandsynligheden for at få den aktuelle eller en mere ekstrem t-værdi/koefficient hvis den sande koefficient er lig 0 (nulhypotesen er sand) |
Hvad er forskellen på homo- og hetereoskedasticitet? | Fejlleddet er homoskedastisk, hvis den ikke afhænger af den uafhængige variabel (x), mens den er heteroskedastisk, hvis den afhænger af den uafhængige variabel (x). Dvs. at residualerne er lige store og har samme retning for alle niveauer af X. Brug robuste standardfejl (robust), hvis uheldet er ude. |