"Im Vordergrund eines Großteils quantitativer Sozialforschung steht die Schätzung von kausalen Effekten. Um ein besseres Verständnis des Problems der kausalen Inferenz zu entwickeln, wird in diesem Beitrag das Kausalitätsproblem anhand einer klassischen Frage der Bildungssoziologie veranschaulicht: Dem Effekt der sozialen Zusammensetzung der Mitschüler auf die Leistungen von Schülern. Dabei werden nach einer Einführung in die Frage von Peer-Effekten in der Schule der kontrafaktische Ansatz zur Kausalität sowie das fundamentale Problem der Kausalanalyse anhand dieses Beispiels verdeutlicht und anschließend sowohl Experimente als auch eine Reihe von statistischen Verfahren zur Lösung des Selektionsproblems diskutiert. Im Einzelnen behandelt der Beitrag neben der Kontrolle nach Kovariaten durch die heute gängigen Regressionsmodelle, Matchingverfahren (etwa Propensity Score Matching), Fixed-Effekt und Difference-in-Difference-Modelle sowie instrumentelle Variablen und das Regression Discontinuity Design. Das Augenmerk der Einführung liegt nicht auf dem mathematischen Hintergrund oder den Schätzverfahren sondern vielmehr auf der generellen Logik der Ansätze sowie den impliziten Annahmen. Abschließend wird der adäquate Umgang mit möglichen Selektionsprozessen anhand einer beispielhaften Analyse zu Kontexteffekten in der Schule veranschaulicht." (Autorenreferat)
Um Daten am effektivsten zu nutzen, muss die moderne Ökonometrie ihren Werkzeugkasten an Modellen erweitern und neu denken. Das Feld, in dem diese Transformation am besten beobachtet werden kann, ist die kausale Inferenz. Diese Dissertation verfolgt die Absicht Probleme zu untersuchen, Lösungen zu präsentieren und neue Methoden zu entwickeln Machine Learning zu benutzen, um kausale Parameter zu schätzen. Dafür werden in der Dissertation zuerst verschiedene neuartige Methoden, welche als Ziel haben heterogene Treatment Effekte zu messen, eingeordnet. Im zweiten Schritt werden, basierend auf diesen Methoden, Richtlinien für ihre Anwendung in der Praxis aufgestellt. Der Parameter von Interesse ist der "conditional average treatment effect" (CATE). Es kann gezeigt werden, dass ein Vergleich mehrerer Methoden gegenüber der Verwendung einer einzelnen Methode vorzuziehen ist. Ein spezieller Fokus liegt dabei auf dem Aufteilen und Gewichten der Stichprobe, um den Verlust in Effizienz wettzumachen. Ein unzulängliches Kontrollieren für die Variation durch verschiedene Teilstichproben führt zu großen Unterschieden in der Präzision der geschätzten Parameter. Wird der CATE durch Bilden von Quantilen in Gruppen unterteilt, führt dies zu robusteren Ergebnissen in Bezug auf die Varianz. Diese Dissertation entwickelt und untersucht nicht nur Methoden für die Schätzung der Heterogenität in Treatment Effekten, sondern auch für das Identifizieren von richtigen Störvariablen. Hierzu schlägt diese Dissertation sowohl die "outcome-adaptive random forest" Methode vor, welche automatisiert Variablen klassifiziert, als auch "supervised randomization" für eine kosteneffiziente Selektion der Zielgruppe. Einblicke in wichtige Variablen und solche, welche keine Störung verursachen, ist besonders in der Evaluierung von Politikmaßnahmen aber auch im medizinischen Sektor wichtig, insbesondere dann, wenn kein randomisiertes Experiment möglich ist. ; To use data effectively, modern econometricians need to expand and rethink their toolbox. One field where such a transformation has already started is causal inference. This thesis aims to explore further issues, provide solutions, and develop new methods on how machine learning can be used to estimate causal parameters. I categorize novel methods to estimate heterogeneous treatment effects and provide a practitioner's guide for implementation. The parameter of interest is the conditional average treatment effect (CATE). It can be shown that an ensemble of methods is preferable to relying on one method. A special focus, with respect to the CATE, is set on the comparison of such methods and the role of sample splitting and cross-fitting to restore efficiency. Huge differences in the estimated parameter accuracy can occur if the sampling uncertainty is not correctly accounted for. One feature of the CATE is a coarser representation through quantiles. Estimating groups of the CATE leads to more robust estimates with respect to the sampling uncertainty and the resulting high variance. This thesis not only develops and explores methods to estimate treatment effect heterogeneity but also to identify confounding variables as well as observations that should receive treatment. For these two tasks, this thesis proposes the outcome-adaptive random forest for automatic variable selection, as well as supervised randomization for a cost-efficient selection of the target group. Insights into important variables and those that are not true confounders are very helpful for policy evaluation and in the medical sector when randomized control trials are not possible.
In der Diskussion zum Auswahlbias in Forschungsdesigns mit großer Fallzahl befasst sich die Verfasserin mit einer Herausforderung, der sich die quantitative Forschung oft gegenübersieht: das Universum der Fälle - d.h. die zu analysierende Population - ist sehr groß und theoretisch gut definiert, aber nur teilweise beobachtbar. Wenn die nicht-beobachtbaren Fälle nicht zufallsverteilt sind, ist jede kausale Inferenz aus der Stichprobe verfälscht. Es existieren zwar altbekannte statistische Lösungen für solche Situationen, die mehr oder weniger hilfreich für das jeweilige Forschungsproblem sein können. Es wird argumentiert, dass das Problem in erster Linie theoretischer Natur ist. Sie gibt praktische Hinweise, wie solche Probleme der Fallauswahl identifiziert und theoretisch wie statistisch angegangen werden können, und wendet sie schließlich auf den Auswahlbias bei der Analyse von namentlichen Abstimmungen im Europäischen Parlament an. (ICF2)
This dissertation discusses the potentials and pitfalls of empirical economic research. Several pieces of applied research illustrate the discipline's diverse use of statistical methods as well as their applicability to different topics. Empirical economic research uses empirical evidence to test hypotheses and statistical inference to uncover general rules. However, very often several rules or causal mechanisms exist that can equally well explain the investigated outcome. This can be problematic whenever statistical inference does not yield convincing results, i.e. the degree of the study's internal validity is low. Although many different statistical tools and techniques have been developed to increase the degree of internal validity, in practice it remains difficult to claim causality. One reason for this is that the quality of statistical inference depends on the appropriateness of the chosen statistical method. Another reason is that causality requires that competing alternative explanations for an estimated statistical relationship are addressed and at best can be dismissed. Thus, an empirical study's overall quality depends critically on an author's judgement and knowledge of the environment in which the outcome is nested. Given the importance of personal perception it is not surprising that the validity of results in many studies in empirical economics is heatedly discussed in- and outside the community. At the beginning of this dissertation the current status of this academic debate is reproduced, leading to the conclusion that there is no panacea for causal inference. Instead, it is proposed that several equally sensible strategies to strengthen causality exist and that their selection depends on the specific research question and setting. While this still allows the author to base decisions on personal perception it also stresses that justifications are required. Hence, each new study demands a tailored research agenda in which the choice of statistical methods and the existence of alternative explanations are transparently discussed. Subsequently to the discussion, three independent papers illustrate that there is indeed no blueprint procedure to conduct empirical economic research. The first paper addresses the question whether individuals react to natural disasters by adjusting their saving behavior. The study applies statistical tools commonly used in applied microeconomic research. The research design uses quasi-experimental variation in a panel survey to infer a causal relationship between flooding and saving behavior. The study finds that from the flooding affected individuals save less in subsequent years. While the study's internal validity is rather high, the generalizability of the relationship remains to be seen. Several alternative explanations for the observed behavior are discussed and evaluated. The concluding explanation is that unusually high amounts of post-disaster financial aid induces moral-hazard-behavior. Thus, the paper makes a case for policy makers to carefully design post-disaster aid payments so as to minimize the possibility of detrimental reductions in individual precautionary efforts. The second paper investigates the link between foreign education and domestic productivity. The paper uses aggregate data, thus encountering statistical challenges commonly occurring in applied macroeconomic research. The research design focuses on the dynamic structure of the data. The paper finds that the more students a country sends to the U.S., the higher subsequent domestic productivity growth rates will be. Additional analyses show that this effect is driven by developing countries. It is argued that the relationship is causal because foreign students transfer productivity enhancing skills from the U.S. to their home country. However, the data does not reveal whether foreign students indeed return and therefore causal inference is weaker than it could be otherwise. Measures to overcome this shortage are presented and applied. Nonetheless, the extent of the data allows for a certain generalizability of the results. In conclusion, the study suggests that foreign education poses a viable additional strategy for economic development. Finally, the third paper addresses a research question from the field of empirical industrial organization. Specifically, the paper tests whether prices for an abatement technology are influenced by the type of environmental regulation of polluting sources. In order to test this relationship, the paper's research design combines a structural economic model with quasi-experimental empirical evidence. The paper finds that the price of abatement technology is significantly higher for those polluting sources that are participating in a permit trading scheme. Causal inference relies on the quasi-experimental nature of the data and the theoretical derivations from the structural model. However, it remains empirically challenging to exclude alternative explanations as doing so considerably strains the scope of our data. In the end, the study's results should caution policy makers to consider that regulatory instruments can have unintended side-effects hampering the diffusion and adoption of abatement technology by increasing its price. The final section discusses the role of empirical research in the overall process of scientific progress. The importance of diverse and comprehensive empirical economic research is emphasized. Finally, it is concluded that empirical research with all its outgrowth is essential to establish something like an objective truth'' in economic science. ; Die vorliegende Dissertation beschäftigt sich mit den Möglichkeiten und Grenzen der empirischen Wirtschaftsforschung. Anhand mehrerer Forschungsarbeiten verdeutlicht sie die Anwendbarkeit statistischer Verfahren auf verschiedene Fragestellungen aus den Wirtschaftswissenschaften. In der empirischen Wirtschaftsforschung werden Beobachtungen statistisch ausgewertet, um Hypothesen zu testen und allgemeine Regeln aufzudecken. Die Herleitung eines kausalen Zusammenhangs zwischen zwei Ereignissen gilt dabei als ein wichtiges Ziel. In der Praxis erweisen sich kausale Schlussfolgerungen allerdings als überaus schwierig. Ein Grund hierfür ist, dass der Gegenstand empirischer Wirtschaftsforschung - unsere Gesellschaft - ein komplexes und dynamisches System ist. Eine allgemeingütige Blaupause, mithilfe welcher sich kausale Zusammenhänge belegen lassen, lässt sich daher kaum entwickeln. Vielmehr hängt die Herleitung eines kausalen Zusammenhangs von den konkreten Faktoren des Einzelfalls ab. Solche Faktoren sind die Forschungsfrage, die Qualität der Daten und das Umfeld, in welchem diese erhoben wurden. Sie bestimmen anschließend das Forschungsdesign und die Auswahl eines geeigneten statistischen Verfahrens. Eine empirische Studie ist somit in vielerlei Hinsichten einzigartig. – Daher ist es auch nicht verwunderlich, dass Kausalitätsbehauptungen in Bezug auf empirische Ergebnisse in den Wirtschaftswissenschaften häufig kontrovers diskutiert werden. Zu Beginn dieser Dissertation wird eine aktuelle Diskussion zur Herleitung von Kausalität in der empirischen Wirtschaftsforschung wiedergegeben. Aus dieser Diskussion geht hervor, dass es momentan kein Allheilmittel für kausale Inferenz gibt, sondern stattdessen mehrere gleichermaßen sinnvolle Strategien für die Herleitung von Kausalität existieren. An die Wiedergabe und Auswertung der Diskussion schließt sich die Darstellung dreier unabhängiger empirischer Studien an. Jede dieser Studien befasst sich mit einem anderen Themengebiet der Wirtschaftswissenschaften, wobei Forschungsdesign, Auswahl der empirischen Methoden und die Art der kausalen Herleitung variieren. Die drei Studien illustrieren somit mehrere Punkte, die sich aus der Diskussion in der Einleitung ergeben haben. Der erste empirische Beitrag in dieser Dissertation geht der Frage nach, ob Opfer von Naturkatastrophen im Anschluss an ihre Erlebnisse ihr Sparverhalten verändern. In der Studie werden statistische Methoden verwendet, die üblicherweise in der angewandten mikroökonomischen Forschung verwendet werden. Das Forschungsdesign nutzt die durch eine Flut generiete quasi-experimentelle Variation in einer Panelbefragung aus, um einen Kausalzusammenhang zwischen Betroffenheit und Sparverhalten abzuleiten. Die Studie zeigt, dass von den Überschwemmungen Betroffene in den Folgejahren weniger sparen. Während der Grad der kausalen Schlussfolgerung hoch ist, bleibt es abzuwarten, ob sich der Zusammenhang auf andere Situationen übertragen lässt. Es werden mehrere Gründe für das beobachtete Verhalten diskutiert und gegeneinander abgewogen. Die Studie kommt zu dem Ergebnis, dass ungewöhnlich hohe Hilfszahlungen zu einem sogenannten Moral Hazard-Verhalten'', also einem verantwortungslosen Verhalten aufgrund von Fehlanreizen, führen können. In dem untersuchten Fall haben die Hilfszahlungen zu einer Verringerung im Vorsorgeverhalten bei Betroffenen geführt. Die Studie plädiert daher dafür, dass politische Entscheidungsträger etwaige Hilfszahlungen nach einer Katastrophe sorgfältig planen, um einen nachteiligen Einfluss auf individuelle Vorsorgemaßnahmen zu vermeiden. In der zweiten Arbeit wird die Verbindung zwischen einem Studium im Ausland und heimischer Produktivität untersucht. Das Papier verwendet dafür aggregierte Daten und befasst sich aus ökonometrischer Sicht mit bestimmten statistischen Herausforderungen, die häufig in der angewandten makroökonomischen Forschung auftreten. Das Forschungsdesign fokussiert sich auf die dynamische Struktur der Daten, um einen kausale Herleitung zu ermöglichen. Gezeigt wird, dass die Anzahl von Studenten, die ein Land in die USA schickt, sich positiv auf die Produktivitätszuwächse dieses Landes in den Folgejahren auswirkt. Des Weiteren kann gezeigt werden, dass dieser positive Zusammenhang nur für Entwicklungsländer gilt. Dies erscheint plausibel, da insbesondere die Bevölkerung aus Entwicklungsländern durch den Transfer produktivitätssteigernder Fähigkeiten aus den USA in ihr Heimatland profitieren sollte. Die Ergebnisse deuten daher an, dass es tatsächlich einen positiven Kausalzusammenhang zwischen Auslandsstudium und heimischer Produktivität gibt. Da die Daten jedoch nicht darüber informieren, ob ausländische Studenten wirklich zurückkehren, ist die kausale Inferenz schwächer, als sie es sonst sein könnte. Hingegen erlaubt der Umfang der Daten eine gewisse Generalisierbarkeit der Ergebnisse. Zusammenfassend lässt sich festhalten, dass die Förderung eines Auslandsstudiums eine sinnvolle zusätzliche Strategie für eine erfolgreiche internationale Entwicklungszusammenarbeit darstellen kann. Das dritte und letzte Papier befasst sich mit einer Forschungsfrage, die dem Bereich der empirischen Industrieökonomik zugeordnet werden kann. Darin wird untersucht, ob die Regulierung von Schwefeldioxidemissionen von Kohlekraftwerken die Preissetzungsstrategie von Herstellern einer geeigneten Vermeidungstechnologie beeinflusst. Um diese Beziehung zu testen, nutzt die Studie ein Forschungsdesign, das auf einem Strukturmodell und Daten mit quasi-experimenteller Variation basiert. Die Ergebnisse der empirischen Untersuchung zeigen, dass die Preise für die Vermeidungstechnologie höher sind, wenn ein Kohlekraftwerk an einem Emissionshandelssystem teilnehmen muss. Diese Entwicklung ist kontraproduktiv, da es den Anreizen eines Emissionshandelssystems, die Verbreitung von Vermeidungstechnologien zu fördern, entgegen wirkt. Die Herleitung eines kausalen Zusammenhangs beruht auf dem quasi-experimentellen Charakter der Daten sowie einem theoretischen Modell, welches den empirischen Befund ebenfalls vorhersagt. Die wichtigsten alternativen Erklärungen für das Ergebnis können ausgeschlossen werden. Einschränkend wirkt hierbei jedoch der Umfang der Daten. Dieser lässt eine rigorose Untersuchung alternativer Erklärungen nur begrenzt zu und schwächt somit den kausalen Zusammenhang etwas ab. Am Ende unterstreichen die Ergebnisse der Studie allerdings, dass politische Entscheidungsträger bei der Ausgestaltung regulatorischer Instrumente umfassend auf unbeabsichtigte Nebenwirkungen achten sollten. Im letzten Abschnitt der Dissertation wird die Rolle empirischer Forschung im Gesamtprozess des wissenschaftlichen Fortschritts diskutiert. Dabei wird die Bedeutung einer umfangreichen und vielfältigen empirischen Wirtschaftsforschung hervorgehoben. Abschließend wird festgestellt, dass die empirische Forschung mit all ihren Ergebnissen und Methoden notwendig ist, um eine objektive Wahrheit'' in der Wirtschaftswissenschaft zu generieren.
Das Ziel politikwissenschaftlicher Forschung ist es, so der Verfasser, zum systematischen Wissen um politische Institutionen, Ereignisse und Prozesse beizutragen. Um dies erreichen zu können, benötigt man angemessene theoretische und methodische Mittel. Es wird argumentiert, dass die Bedeutung von Konzepten klar spezifiziert werden muss, um bestmöglich von deren theoretischem und analytischem Potenzial zu profitieren. Konzepte müssen sowohl mit Blick auf die sie definierenden Attribute, das heißt ihre Intension, als auch mit Blick auf die von ihnen erfassten Referenten, das heißt ihre Extension, spezifiziert werden. Wenn theoretische Konzepte klar spezifiziert werden, dienen sie als zuverlässige Brücke zwischen der politikwissenschaftlichen Theorie und der empirisch beobachtbaren Welt politischer Prozesse, für die wir uns interessieren. Unklare Konzepte beeinträchtigen nicht nur den verständlichen theoretischen Diskurs und behindern die Verbesserung politikwissenschaftlicher Theorien. Unklare Konzepte bieten sich ebenfalls zur irreführenden theoretischen ex post-Rationalisierung empirischer Ergebnisse an. Diese bestätigen Sichtweisen auf Gegenstände an denen man Gefallen gefunden hat, anstatt neue Einsichten hervorzubringen. Damit stellen sie Hürden auf dem Weg zu validen empirischen und kausalen Inferenzen dar. (ICF2)
Diese Dissertation kombiniert vier Studien im Bereich der Bildungsökonomie und der Programmevaluation. Ziel der Dissertation ist es, zu analysieren, wie unterschiedliche Faktoren studentische Leistung und Entscheidungen in höherer Bildung beeinflussen. Sie soll das Verständnis über Studiengebühren, Universitätssport und Studienfachwahl fördern und letztlich zu einer informierten Politikgestaltung in der höheren Bildung beitragen. Alle Kapitel achten besonders auf die Identifizierung kausaler Effekte. Die Dissertation nutzt institutionelle Gegebenheiten der Universität St. Gallen, die sich für experimentelle und quasi-experimentelle Forschungsstrategien anbieten. Das erste Kapitel präsentiert neue methodische Überlegungen, die für Studiengebührevaluation genutzt werden. Es leistet ebenfalls einen eigenständigen Beitrag zur Literatur über kausale Inferenz. Das Kapitel diskutiert Identifizierung anhand von Difference-in-Differences (DID) Ansätzen mit mehreren Treatments. Obwohl solche Situationen häufig in der angewandten Forschung auftreten, haben sie kaum theoretische Aufmerksamkeit erhalten. In diesem Kapitel werden zwei wichtige Erkenntnisse erläutert und ihre Auswirkungen auf prominente Beispiele diskutiert. Erstens: die Studie zeigt, dass eine angemessene Anwendung der Common Trend Annahme für den Vergleich von zwei Treatments die Möglichkeit der Effektheterogenität für mindestens eines der beiden Treatments einschränkt. Angesichts des nicht-zufälligen Treatmentstatus ist es unwahrscheinlich, dass diese Annahme in den meisten Anwendungen zutrifft. Zweitens: der Vergleich von zwei Treatments mit DID Strategien identifiziert unter bestimmten Bedingungen den tiefst möglichen absoluten Wert eines Average Treatment Effects on the Treated zwischen einem der beiden Treatments und der hypothetischen Situation ohne Treatment, selbst wenn die Homogenitätsannahme verletzt wird. Diese Bedingungen sind plausibel in Anwendungen, bei denen Treatments geordnet sind, oder sich in ihrer Intensität unterscheiden ...
"Qualitative Comparative Analysis (QCA) ebenso wie die Erweiterung zu Fuzzy Set Qualitative Comparative Analysis (fs/QCA) wurden von dem amerikanischen Sozialwissenschaftler Charles C. Ragin eingeführt. Ziel von QCA und fs/QCA als Methoden zur kausalen Inferenz ist es, ein zu erklärendes Phänomen als das Ergebnis verschiedener Kombinationen von Merkmalsbedingungen zu modellieren. QCA und fs/QCA eignen sich für jene Forschungssituationen, in denen (a) Hypothesen oder zumindest starke Erwartungen über das Vorliegen notweniger und/oder hinreichender Bedingungen und damit über äquifinale und kombinatorische kausale Strukturen vorliegen, (b) die Fallzahl und die Qualität der Daten zu gering für die Anwendung fortgeschrittener statistischer Verfahren sind, die in der Lage wären, die erwarteten komplexen kausalen Strukturen zumindest annähernd zu modellieren und/ oder (c) fallbasiertes Wissen stark in den Analyseprozess eingebracht werden soll und kann. Es bestehen mehrere bedeutende Unterschiede zu herkömmlichen statistischen Verfahren, insbesondere der Regressionsanalyse: (a) die der QCA zu Grunde liegenden Daten sind qualitativer Natur und drücken die Zugehörigkeit von Fällen zu Mengen aus; (b) die Beziehung zwischen dem zu erklärenden Phänomen und den Bedingungen wird auf der Basis von Mengenbeziehungen und nicht von Kovariationen untersucht; (c) die Ergebnisse werden im Sinne notwendiger und hinreichender Bedingungen und nicht additiver und unifinaler Modelle interpretiert und (d) QCA und fs/QCA können nicht auf die Analyse von Datensätzen reduziert werden. Vielmehr ist dieses analytische Moment - wie in qualitativer Forschung üblich - untrennbar in einen iterativen Prozess eingebettet, der zwischen Analyse, Respizifikation der Untersuchungsfälle und -konzepte sowie weiterer Datenerhebung und erneuter Analyse pendelt. In einem engeren Sinn handelt es sich bei QCA und fs/QCA um ein auf boolescher Algebra beruhendes Datenanalyseverfahren, in dessen Kern die logische Minimierung der in einer Wahrheitstafel enthaltenen Information steht. Technisch bestehen keine Unter- und Obergrenzen für die zu analysierende Fallzahl. Da die Güte von QCA und fs/QCA jedoch entscheidend von einem Mindestmaß an Vertrautheit mit den Fällen abhängt, bietet sich ein mittleres N (10-50) an. Dies schließt eine fruchtbare Anwendung von QCA und fs/QCA auf Datensätze mit mehreren Tausend Fällen (Individualdaten) nicht grundsätzlich aus. Bei sehr niedriger Fallzahl (2-10) verliert QCA viele ihrer Vorzüge gegenüber klassischen fallorientierten Vergleichsansätzen." (Autorenreferat)
In der ökonomischen Forschung wird eine Vielzahl von Strategien verwendet, um zu versuchen kausale Schlussfolgerungen aus Beobachtungsdaten zu ziehen. Neue Strömungen in der Literatur zu kausaler Inferenz konzentrieren sich auf die Kombination von Methoden zur Vorhersage und kausalen Fragestellungen. Diese neuen Methoden ermöglichen es neue Forschungsfragen zu beantworten und bieten die Möglichkeit bestehende Forschungsfragen in der Literatur neu zu adressieren. Diese Dissertation umfasst empirische Arbeiten in den Bereichen (i) Umweltökonomie: Ich evaluiere die Preispolitik für Abfälle mithilfe der "synthetic control" Methode und Methoden des maschinellen Lernens; (ii) Arbeits- und Migrationsökonomie: Ich identifiziere und quantifiziere nicht gemeldete landwirtschaftliche Arbeitsleistung, die durch einen plötzlichen Migrationszustrom verursacht wird; (iii) Konfliktökonomie: Ich analysiere die wirtschaftlichen Kosten eines hybriden Krieges, des Donbass-Krieges in der Ukraine. Der Beitrag dieser Dissertation zur bestehenden Literatur ist dreifach. Erstens kombiniere ich neuartige Datenquellen und stelle neue Datensätze bereit. Zweitens verwende ich moderne Evaluierungsmethoden und passe sie an, um politisch relevante kausale Parameter in verschiedenen Bereichen der ökonomischen Forschung abzuschätzen. Drittens vergleiche ich neuere mit traditionellen ökonometrischen Ansätzen, die zuvor in der Literatur verwendet wurden. Meine Dissertation zeigt, dass moderne ökonometrische Techniken vielversprechend sind, um die Genauigkeit und Glaubwürdigkeit von kausalen Schlussfolgerungen und die Evaluierung von Politikmassnahmen zu verbessern. ; In economics, researchers use a wide variety of strategies for attempting to draw causal inference from observational data. New developments in the causal inference literature focus on the combination of predictive methods and causal questions. These methods allow researchers to answer new research questions as well as provide new opportunities to address older research question in the literature. This dissertation entails empirical work in the fields of (i) environmental economics: I evaluate waste pricing policies using synthetic controls and machine learning methods; (ii) labor and migration economics: I identify and quantify unreported farm labor induced by a sudden migrant inflow; (iii) conflict economics: I evaluate the economic costs of an hybrid war, namely, the Donbass war in Ukraine. The contribution of this dissertation is threefold. First, I combine novel data sources and provide unique datasets. Second, I apply and tailor modern evaluation methods to the estimation of policy-relevant causal parameters in various fields of economics. Third, I compare recent versus traditional econometric approaches previously employed by the literature. My dissertation shows that modern econometric techniques hold great promise for improving the accuracy and credibility of causal inference and policy evaluation.
Diese Doktorarbeit besteht aus vier Studien, die auf dem Konzept der kausalen Inferenz basieren. Zwei empirische Studien untersuchen, ob eine Abhängigkeit von Wohlfahrtshilfe die Gesundheit und das Gesundheitsverhalten beeinflussen kann. Die beiden restlichen Arbeiten sind methodische Studien über Treatmenteffekte, die eine neue Inferenzmethode einführen und diese neben einer Vielzahl von anderen Methoden analysieren. In der ersten Studie wird untersucht, ob Abhängigkeit von Wohlfahrtshilfe einen Einfluss auf die Gesundheit und das Gesundheitsverhalten hat. Die empirische Analyse verwendet mehrperiodische Umfragedaten, um die Auswirkungen des deutschen Wohlfahrtshilfeprogramms Hartz IV auf Gesundheit zu studieren. Basierend auf einer Stichprobe von Wohlfahrtshilfeempfängern vergleicht diese Analyse die Gesundheit zweier Gruppen: Personen, die weiterhin Wohlfahrtshilfe beziehen und Personen, die die Wohlfahrtshilfe nicht mehr benötigen. Die Ergebnisse lassen darauf schliessen, dass eine Abhängigkeit von Wohlfahrtshilfe die Gesundheit und Sportverhalten negativ beeinflussen kann. In der zweiten Studie wird eine Mediationsanalyse durchgeführt, um potentielle Kanäle zu identifizieren, die die Gesundheit von Wohlfahrtshilfeempfängern beeinflussen können. Hier wird ein speziell für diese Analyse adaptiertes semi-parametrisches Schätzverfahren eingesetzt. Die Resultate zeigen, dass Beschäftigung zur Verbesserung der Gesundheit von Männern und älteren Personen, die keine Wohlfahrtshilfe mehr beziehen, beitragen kann. Bei Frauen hingegen wirken sich andere Faktoren - zusammengefasst als direkte Effekte von Unabhängigkeit von Wohlfahrtshilfe - positiv auf deren Gesundheit aus. Für jüngere Personen hat der Bezug von Wohlfahrtshilfe keine Auswirkungen auf die Gesundheit. In der dritte Studie werden verschiedene Inferenzmethoden für Schätzverfahren von Treatmenteffekten in kleinen Stichproben analysiert. In Simulationen mit empirischen Daten werden Konfidenzintervalle und p-Werte bestimmt, die sowohl auf analytisch berechneten Varianzen also auch auf Bootstrapmethoden beruhen. Die Evidenz zeigt, dass die Bootstrapmethoden generell genauer und schärfer sind als die analytischen Variixanzmethoden. Unterschiedliche Spezifikationen hinsichtlich der Stichprobengrösse, der Treatmentselektivität, der Effektheterogenität sowie der Zusammensetzung der Treatmentgruppe haben keinen Einfluss auf die Simulationsergebnisse. Die letzte Studie stellt eine "wilde" Bootstrap-Methode vor, die die Verteilung von Propensity Score Matching-Schätzern approximiert. Bei dieser Methode werden die unabhängigen Variablen konstant gehalten und die Approximation erfolgt durch eine zufällige Störung der Martingalrepresentation von Matching-Schätzern. Anhand einer Monte Carlo Simulation und einer empirischen Anwendung wird die Inferenzmethode in kleinen Stichproben getestet. Die Resultate zeigen, dass diese neue Bootstrap-Methode höhere Überdeckungswahrscheinlichkeiten von Konfidenzintervallen aufweist als ein Wurzel-n-konsistenter Schätzer.
Zugriffsoptionen:
Die folgenden Links führen aus den jeweiligen lokalen Bibliotheken zum Volltext:
In der vorliegenden Arbeit werden die einzelbetrieblichen Effekte zweier agrarpolitischer Programme (Agrarumweltmaßnahmen, Ausgleichszulage für benachteiligte Gebiete) auf den betrieblichen Faktoreinsatz (Boden, Arbeit, Kapital, Viehbesatz, Viehbesatzdichte, Ausgaben für Pflanzenschutz- und Düngemittel je Hektar), die Produktion (Umsatz) und die außerbetriebliche Erwerbsbeteiligung des Betriebsleiterpaares untersucht. Die Analyse basiert auf einer nicht repräsentativen Stichprobe mit über 20.000 deutschen, buchführenden Betrieben im Zeitraum von 2000 bis 2005. Für die empirische Analyse werden ein semi-parametrischer Matching-Ansatz (Propensity Score Matching) sowie verschiedene parametrische Panelmodelle verwendet.Die Ergebnisse der empirischen Analyse zeigen, dass die Teilnahme an Agrarumweltmaßnahmen (AUM) einen positiven Einfluss auf den betrieblichen Bodeneinsatz, insbesondere auf Grünland, hat: Die jährliche Wachstumsrate der landwirtschaftlich genutzten Fläche ist in Betrieben mit AUM-Teilnahme um etwa 1 % höher als in vergleichbaren Betrieben ohne Teilnahme. Bedingt durch das starke Flächenwachstum, wird infolge der AUM-Teilnahme die Nutzungsintensität (Rinderbesatzdichte, Ausgaben für Düngemittel je Hektar, Arbeitseinsatz je Hektar) und damit die Produktivität (Umsatz je Hektar) signifikant verringert. Der positive Einfluss der Ausgleichszulage (AZ) auf das betriebliche Flächenwachstum ist vergleichsweise gering und nur über mehrere Jahre betrachtet statistisch signifikant. Der Effekt beider Programme (AUM, AZ) auf die betriebliche Produktion und die außerbetriebliche Erwerbsbeteiligung ist statistisch nicht signifikant.Die empirischen Ergebnisse bestätigen auch die These heterogener Effekte von Agrarumweltmaßnahmen und der Ausgleichszulage: Die Höhe der Programmeffekte nimmt mit steigenden Agrarumweltzahlungen bzw. steigender Ausgleichszulage je Betrieb zu. Darüber hinaus beeinflussen betriebsindividuelle Faktoren die Wirkung beider Programme: Betriebe, deren Programmteilnahme aufgrund ihrer individuellen Merkmale (niedrige Nutzungsintensität, geringe Bodenqualität) sehr wahrscheinlich ist, ziehen den größten Nutzen aus der Programmteilnahme. Ackerbaubetriebe und Betriebe mit älteren Betriebsleitern weisen unter allen AUM-Teilnehmern das höchste Flächenwachstum auf.Neben der empirischen Fragestellung gilt ein besonderes Augenmerk der Beurteilung der Eignung der verwendeten Methoden für mikroökonomische Wirkungsanalysen agrarpolitischer Programme. Vorteile von Matching-Verfahren liegen in den weniger restriktiven Annahmen hinsichtlich der korrekten Spezifikation des empirischen Modells sowie der vergleichsweise einfachen Kommunizierbarkeit der Ergebnisse an ein nicht-wissenschaftliches Publikum. Zu den Nachteilen von Matching-Verfahren zählen die wenig effiziente Nutzung der zur Verfügung stehenden Information und der daraus resultierende große Datenbedarf sowie die eingeschränkten Möglichkeiten zur Überprüfung von Hypothesen. ; In this study, the farm level effects of two farm programs (agri-environment programs, less favoured areas scheme) on input use (land, labour, capital, livestock, pesticides, fertilizer), production (farm sales) and off-farm labour supply are analysed. Data used comprise a large, non-representative sample of more than 20,000 bookkeeping farms in Germany (2000 to 2005). The empirical analysis is based upon a semi-parametric matching approach (propensity score matching) and various parametric regression models for panel data.The analysis reveals a positive and significant treatment effect of agri-environment (AE) programs on the area under cultivation, in particular grassland: The annual growth rate of the area under cultivation of AE participants is about one percent higher as compared to similar farms with no participation. Due to the strong acreage growth under AE participation, land use intensity (as measured by livestock density, purchase of fertiliser per hectare, on-farm labour per hectare) and productivity (sales per hectare) is reduced significantly. A similar, although smaller, effect is observed for the less favoured areas scheme (LFA). For both programs (AE, LFA), no statistically significant effect on farm production and off-farm labour supply is observed.Empirical results also confirm the hypothesis of heterogeneous treatment effects for AE programs and the LFA scheme: The magnitude of treatment effects increases with the amount of programme payments received by a farm. Further more, individual farm characteristics influence the magnitude of treatment effects of both programs: Farms that have the highest probability to participate (low input farms, farms with marginal soils) can generate the largest benefit from program participation. Among all AE-participants, arable farms and farms of older operators show the largest acreage growth compared to similar farms without participation.A further focus of this study is on methods suitable to analyse the microeconomic effects of farm programs. Matching methods relies on less restrictive assumptions than parametric methods do. Further more, matching estimates are relatively easy to communicate to a non-scientific audience (e.g. policy makers). However, the major disadvantage of matching is the low efficiency of using available information which results in high data requirements. Matching also offers limited possibilities for hypothesis testing.
In Chapter 1 of the dissertation, the role of social networks is analyzed as an important determinant in the search behavior of the unemployed. Based on the hypothesis that the unemployed generate information on vacancies through their social network, search theory predicts that individuals with large social networks should experience an increased productivity of informal search, and reduce their search in formal channels. Due to the higher productivity of search, unemployed with a larger network are also expected to have a higher reservation wage than unemployed with a small network. The model-theoretic predictions are tested and confirmed empirically. It is found that the search behavior of unemployed is significantly affected by the presence of social contacts, with larger networks implying a stronger substitution away from formal search channels towards informal channels. The substitution is particularly pronounced for passive formal search methods, i.e., search methods that generate rather non-specific types of job offer information at low relative cost. We also find small but significant positive effects of an increase of the network size on the reservation wage. These results have important implications on the analysis of the job search monitoring or counseling measures that are usually targeted at formal search only. Chapter 2 of the dissertation addresses the labor market effects of vacancy information during the early stages of unemployment. The outcomes considered are the speed of exit from unemployment, the effects on the quality of employment and the short-and medium-term effects on active labor market program (ALMP) participation. It is found that vacancy information significantly increases the speed of entry into employment; at the same time the probability to participate in ALMP is significantly reduced. Whereas the long-term reduction in the ALMP arises in consequence of the earlier exit from unemployment, we also observe a short-run decrease for some labor market groups which suggest that caseworker use high and low intensity activation measures interchangeably which is clearly questionable from an efficiency point of view. For unemployed who find a job through vacancy information we observe a small negative effect on the weekly number of hours worked. In Chapter 3, the long-term effects of participation in ALMP are assessed for unemployed youth under 25 years of age. Complementary to the analysis in Chapter 2, the effects of participation in time- and cost-intensive measures of active labor market policies are examined. In particular we study the effects of job creation schemes, wage subsidies, short-and long-term training measures and measures to promote the participation in vocational training. The outcome variables of interest are the probability to be in regular employment, and participation in further education during the 60 months following program entry. The analysis shows that all programs, except job creation schemes have positive and long-term effects on the employment probability of youth. In the short-run only short-term training measures generate positive effects, as long-term training programs and wage subsidies exhibit significant locking-in'' effects. Measures to promote vocational training are found to increase the probability of attending education and training significantly, whereas all other programs have either no or a negative effect on training participation. Effect heterogeneity with respect to the pre-treatment level education shows that young people with higher pre-treatment educational levels benefit more from participation most programs. However, for longer-term wage subsidies we also find strong positive effects for young people with low initial education levels. The relative benefit of training measures is higher in West than in East Germany. In the evaluation studies of Chapters 2 and 3 semi-parametric balancing methods of Propensity Score Matching (PSM) and Inverse Probability Weighting (IPW) are used to eliminate the effects of counfounding factors that influence both the treatment participation as well as the outcome variable of interest, and to establish a causal relation between program participation and outcome differences. While PSM and IPW are intuitive and methodologically attractive as they do not require parametric assumptions, the practical implementation may become quite challenging due to their sensitivity to various data features. Given the importance of these methods in the evaluation literature, and the vast number of recent methodological contributions in this field, Chapter 4 aims to reduce the knowledge gap between the methodological and applied literature by summarizing new findings of the empirical and statistical literature and practical guidelines for future applied research. In contrast to previous publications this study does not only focus on the estimation of causal effects, but stresses that the balancing challenge can and should be discussed independent of question of causal identification of treatment effects on most empirical applications. Following a brief outline of the practical implementation steps required for PSM and IPW, these steps are presented in detail chronologically, outlining practical advice for each step. Subsequently, the topics of effect estimation, inference, sensitivity analysis and the combination with parametric estimation methods are discussed. Finally, new extensions of the methodology and avenues for future research are presented. ; In Kapitel 1 der Dissertation wird die Rolle von sozialen Netzwerken als Determinante im Suchverhalten von Arbeitslosen analysiert. Basierend auf der Hypothese, dass Arbeitslose durch ihr soziales Netzwerk Informationen über Stellenangebote generieren, sollten Personen mit großen sozialen Netzwerken eine erhöhte Produktivität ihrer informellen Suche erfahren, und ihre Suche in formellen Kanälen reduzieren. Durch die höhere Produktivität der Suche sollte für diese Personen zudem der Reservationslohn steigen. Die modelltheoretischen Vorhersagen werden empirisch getestet, wobei die Netzwerkinformationen durch die Anzahl guter Freunde, sowie Kontakthäufigkeit zu früheren Kollegen approximiert wird. Die Ergebnisse zeigen, dass das Suchverhalten der Arbeitslosen durch das Vorhandensein sozialer Kontakte signifikant beeinflusst wird. Insbesondere sinkt mit der Netzwerkgröße formelle Arbeitssuche - die Substitution ist besonders ausgeprägt für passive formelle Suchmethoden, d.h. Informationsquellen die eher unspezifische Arten von Jobangeboten bei niedrigen relativen Kosten erzeugen. Im Einklang mit den Vorhersagen des theoretischen Modells finden sich auch deutlich positive Auswirkungen einer Erhöhung der Netzwerkgröße auf den Reservationslohn. Kapitel 2 befasst sich mit den Arbeitsmarkteffekten von Vermittlungsangeboten (VI) in der frühzeitigen Aktivierungsphase von Arbeitslosen. Die Nutzung von VI könnte dabei eine "doppelte Dividende" versprechen. Zum einen reduziert die frühe Aktivierung die Dauer der Arbeitslosigkeit, und somit auch die Notwendigkeit späterer Teilnahme in Arbeitsmarktprogrammen (ALMP). Zum anderen ist die Aktivierung durch Information mit geringeren locking-in'' Effekten verbunden als die Teilnahme in ALMP. Ziel der Analyse ist es, die Effekte von frühen VI auf die Eingliederungsgeschwindigkeit, sowie die Teilnahmewahrscheinlichkeit in ALMP zu messen. Zudem werden mögliche Effekte auf die Qualität der Beschäftigung untersucht. Die Ergebnisse zeigen, dass VI die Beschäftigungswahrscheinlichkeit signifikant erhöhen, und dass gleichzeitig die Wahrscheinlichkeit in ALMP teilzunehmen signifikant reduziert wird. Für die meisten betrachteten Subgruppen ergibt sich die langfristige Reduktion der ALMP Teilnahme als Konsequenz der schnelleren Eingliederung. Für einzelne Arbeitsmarktgruppen ergibt sich zudem eine frühe und temporare Reduktion, was darauf hinweist, dass Maßnahmen mit hohen und geringen "locking-in" Effekten aus Sicht der Sachbearbeiter austauschbar sind, was aus Effizienzgesichtspunkten fragwürdig ist. Es wird ein geringer negativer Effekt auf die wöchentliche Stundenanzahl in der ersten abhängigen Beschäftigung nach Arbeitslosigkeit beobachtet. In Kapitel 3 werden die Langzeiteffekte von ALMP für arbeitslose Jugendliche unter 25 Jahren ermittelt. Die untersuchten ALMP sind ABM-Maßnahmen, Lohnsubventionen, kurz-und langfristige Maßnahmen der beruflichen Bildung sowie Maßnahmen zur Förderung der Teilnahme an Berufsausbildung. Ab Eintritt in die Maßnahme werden Teilnehmer und Nicht-Teilnehmer für einen Zeitraum von sechs Jahren beobachtet. Als Zielvariable wird die Wahrscheinlichkeit regulärer Beschäftigung, sowie die Teilnahme in Ausbildung untersucht. Die Ergebnisse zeigen, dass alle Programme, bis auf ABM, positive und langfristige Effekte auf die Beschäftigungswahrscheinlichkeit von Jugendlichen haben. Kurzfristig finden wir jedoch nur für kurze Trainingsmaßnahmen positive Effekte, da lange Trainingsmaßnahmen und Lohnzuschüsse mit signifikanten locking-in'' Effekten verbunden sind. Maßnahmen zur Förderung der Berufsausbildung erhöhen die Wahrscheinlichkeit der Teilnahme an einer Ausbildung, während alle anderen Programme keinen oder einen negativen Effekt auf die Ausbildungsteilnahme haben. Jugendliche mit höherem Ausbildungsniveau profitieren stärker von der Programmteilnahme. Jedoch zeigen sich für längerfristige Lohnsubventionen ebenfalls starke positive Effekte für Jugendliche mit geringer Vorbildung. Der relative Nutzen von Trainingsmaßnahmen ist höher in West- als in Ostdeutschland. In den Evaluationsstudien der Kapitel 2 und 3 werden die semi-parametrischen Gewichtungsverfahren Propensity Score Matching (PSM) und Inverse Probability Weighting (IPW) verwendet, um den Einfluss verzerrender Faktoren, die sowohl die Maßnahmenteilnahme als auch die Zielvariablen beeinflussen zu beseitigen, und kausale Effekte der Programmteilahme zu ermitteln. Während PSM and IPW intuitiv und methodisch sehr attraktiv sind, stellt die Implementierung der Methoden in der Praxis jedoch oft eine große Herausforderung dar. Das Ziel von Kapitel 4 ist es daher, praktische Hinweise zur Implementierung dieser Methoden zu geben. Zu diesem Zweck werden neue Erkenntnisse der empirischen und statistischen Literatur zusammengefasst und praxisbezogene Richtlinien für die angewandte Forschung abgeleitet. Basierend auf einer theoretischen Motivation und einer Skizzierung der praktischen Implementierungsschritte von PSM und IPW werden diese Schritte chronologisch dargestellt, wobei auch auf praxisrelevante Erkenntnisse aus der methodischen Forschung eingegangen wird. Im Anschluss werden die Themen Effektschätzung, Inferenz, Sensitivitätsanalyse und die Kombination von IPW und PSM mit anderen statistischen Methoden diskutiert. Abschließend werden neue Erweiterungen der Methodik aufgeführt.