Ein praktischer Leitfaden zur kausalen Inferenz in der Agrarökonomie

Arne Henningsen, Dagim Belay, Guy Low, David Wuepper, Hugo Storm, Tobias Dalhaus und Stefan Hirsch*

Agrarökonomische Forschung befasst sich häufig mit politisch relevanten Fragestellungen, von denen viele inhärent kausal sind. Klassische Fragestellungen beschäftigen sich etwa damit, wie eine bestimmte Politikmaßnahme, eine Anbauentscheidung oder eine Marktentwicklung ein Ergebnis wie das Konsumverhalten, das landwirtschaftliche Einkommen oder die Umwelt beeinflusst. Manchmal stammen die Daten aus randomisierten kontrollierten Studien mit einer gut ausbalancierten Behandlungs- (Treatment) und Kontrollgruppe, und die Analyse ist dann geradlinig und vergleichsweise einfach. Sobald festgestellt ist, dass sich Behandlungs- und Kontrollgruppe vor der Intervention sowohl hinsichtlich beobachtbarer als auch unbeobachtbarer Faktoren statistisch nicht unterscheiden, liegt es nahe, dass Unterschiede nach der Intervention wahrscheinlich durch diese verursacht wurden. In den meisten Fällen stammen die Daten jedoch nicht aus randomisierten kontrollierten Studien (randomized controlled trials). So müssen politische Entscheidungsträger beispielsweise darüber entscheiden, wie ein neues Agrarumweltprogramm ausgestaltet werden soll, und es bleibt keine Zeit, über mehrere Jahre hinweg ein randomisiertes Experiment durchzuführen, bevor man sagen kann, was funktioniert und was nicht. Darüber hinaus sind viele Forschungsfragen selbst dann, wenn politische Entscheidungsträger die nötige Zeit und Geduld hätten, grundsätzlich ungeeignet für randomisierte kontrollierte Studien. So ist es äußerst unpraktikabel, Regierungen zufällig ausgewählter Länder davon zu überzeugen, ihre Gesetze zu ändern, während Regierungen aller anderen Länder ihre Gesetze unverändert lassen sollen – allein um eine saubere kausale Inferenz zu ermöglichen. Diese Herausforderungen verdeutlichen, warum robuste kausale Inferenz ohne randomisierte kontrollierte Studien für die Gestaltung wirksamer agrarpolitischer Maßnahmen von zentraler Bedeutung ist.

Anstatt alle Forschungsfragen mit Hilfe randomisierter kontrollierter Studien zu beantworten, stützen sich Agrarökonominnen und Agrarökonomen in der Praxis meist auf die Analyse von Beobachtungsdaten und verwenden eine Vielzahl kausaler Inferenzansätze, die – unter der Voraussetzung unterschiedlicher Annahmen – für diesen Zweck geeignet sind.

In einem neuen Beitrag im Journal of Agricultural Economics (Henningsen et al., 2025) geben wir eine einführende Darstellung dieser kausalen Inferenzansätze für Beobachtungsdaten. Die grundlegende Herausforderung bei der Arbeit mit Beobachtungsdaten ist statistische Endogenität, also der Fall, dass erklärende Variablen mit unbeobachteten Faktoren korreliert sind, die die Zielvariable beeinflussen. Bei der Nutzung von Beobachtungsdaten schätzen wir zunächst Korrelationen, und nur durch die Wahl geeigneter Forschungsdesigns und die kritische Prüfung der zugrunde liegenden Identifikationsannahmen kann es gelingen, nicht-kausale Erklärungen dafür auszuschließen. Mögliche nicht-kausale Alternativen sind unbeobachtete Störfaktoren (unobserved confounders), umgekehrte Kausalität (reverse causality) und bestimmte Arten von Messfehlern (measurement errors).

Der Artikel beginnt mit der Diskussion von Ansätzen, die darauf abzielen, für alle Störfaktoren zu kontrollieren. So könnte man in einer Regression zum Zusammenhang zwischen betrieblichem Erfolg und Pflanzenschutzmitteleinsatz Umweltunterschiede wie Niederschlag und Temperatur berücksichtigen oder – noch besser – den Schädlingsdruck selbst. Anschließend werden Ansätze zur Schätzung kausaler Effekte vorgestellt, bei denen unbeobachtete Störfaktoren existieren können, etwa Methoden auf Basis von Instrumentenvariablen, Difference-in-Differences-Designs, die Synthetic-Control-Methode, Regression-Discontinuity-Designs sowie Difference-in-Discontinuities-Designs. Jedes dieser Forschungsdesigns beruht auf einer Reihe von Identifikationsannahmen, die in jeder Anwendung kritisch diskutiert und geprüft werden müssen. Oft lassen sich diese Annahmen nicht direkt testen, doch wenn zahlreiche Versuche, sie mithilfe von Theorie, Fachwissen und Daten zu falsifizieren, scheitern, kann dies als Hinweis darauf gewertet werden, dass es glaubwürdig ist, die geschätzten Zusammenhänge als kausale Effekte zu interpretieren.

Gute Studien, die kausale Effekte mit Beobachtungsdaten schätzen wollen, liefern leicht nachvollziehbare Erklärungen der empirischen Herausforderungen, die einer einfachen kausalen Interpretation von Korrelationen im Wege stehen. Darauf folgt eine Erläuterung des gewählten Forschungsdesigns, mit dem diese Herausforderungen adressiert werden sollen, sowie der Gründe, warum dieses Design als glaubwürdig angesehen werden kann, gestützt durch Argumente und empirische Evidenz. Entscheidend ist dabei, dass alle wichtigen Identifikationsannahmen genannt und diskutiert werden, zusammen mit einer Begründung, warum man an ihre Gültigkeit glauben sollte. Um dies zu leisten, müssen sowohl der Kontext als auch die Daten gut beschrieben werden. Für Letzteres können grafische Darstellungen hilfreich sein. Darüber hinaus sind Placebo-Tests häufig ein wirksames Mittel, um bestehende Bedenken zu zerstreuen.

Ein weiteres Kennzeichen überzeugender Analysen ist, dass die präsentierten Gesamtmuster in sich konsistent sind und mit den angenommenen Wirkmechanismen übereinstimmen. Wenn die zunächst dargestellten Korrelationen plausiblerweise durch eine positive Selektionsverzerrung überhöht sind, ist zu erwarten, dass ein kausales Forschungsdesign zu einer kleineren Schätzung führt; wird die Schätzung hingegen größer, kann dies ein Warnsignal sein. Ebenso gibt es umfangreiches Wissen über landwirtschaftliche Produktionsprozesse, das für Plausibilitätsprüfungen herangezogen werden kann. Manche Effekte zeigen sich nur mit zeitlicher Verzögerung, andere nehmen im Zeitverlauf ab. Tritt ein geschätzter Effekt unrealistisch schnell oder unrealistisch spät auf, kann dies Zweifel daran aufwerfen, ob es sich tatsächlich um einen kausalen Effekt handelt. Ebenso gibt es Beobachtungseinheiten und Zeiträume, für die ein Effekt größer, kleiner oder gar nicht zu erwarten ist, und es ist hilfreich zu überprüfen, ob die Analyse genau dies widerspiegelt. Wenn die Beobachtungseinheiten beispielsweise Ackerflächen sind und das interessierende Ergebnis kulturspezifisch ist, können bestimmte Effekte plausiblerweise nur dann auftreten, wenn diese Äcker tatsächlich mit der entsprechenden Kultur bestellt sind, nicht jedoch in Zeiten ohne Bewuchs oder mit einer anderen Kultur. Bestimmte Witterungseffekte können im Sommer stärker, im Frühling und Herbst schwächer und im Winter nicht vorhanden sein. Ebenso ist bei Informationsinterventionen häufig zu erwarten, dass sie nur unerfahrene Landwirte beeinflussen, nicht aber solche, die bereits über alle erforderlichen Informationen verfügen. Mit anderen Worten: Anstatt sich auf ein oder zwei Modellspezifikationen zu verlassen, die dann die gesamte Evidenz tragen müssen, ist es in der Regel ratsam, so weit wie möglich zu zeigen, dass sämtliche potenziell verfügbaren empirischen Befunde die Interpretation der Daten stützen. Ist dies nicht der Fall, sollten „Rätsel“ offen kommuniziert werden, etwa wenn empirische Muster nicht vollständig in das Narrativ des Beitrags passen.

Leider dauert es oft eine Weile, bis sich Fehlvorstellungen korrigieren. Ein bekanntes Beispiel ist die häufig wiederholte Aussage, eine Instrumentenvariable sei ausreichend stark, wenn ihre F-Statistik größer als 10 sei. Neuere Forschung hat jedoch gezeigt, dass die Frage, ob ein Instrument mit einem F-Wert von 10 akzeptabel ist, vom Kontext abhängt und dass die erforderliche Schwelle häufig deutlich über 10 liegt. Dennoch wiederholen viele Arbeiten schlicht die Aussage, dass bei einem F-Wert über 10 kein Anlass zur Sorge bestehe. Unsere Leitlinien sollen Forschende dabei unterstützen, fundiertere methodische Entscheidungen zu treffen, und die Glaubwürdigkeit kausaler Evidenz in der agrarökonomischen Forschung erhöhen.

Unser kurzer einführender Artikel kann selbstverständlich kein Thema in der Tiefe behandeln. Er ist als Überblick und Ausgangspunkt gedacht, etwa für etablierte Forschende zur Auffrischung ihrer Kenntnisse in der kausalen Inferenz oder für Forschende in frühen Karrierephasen zum Aufbau entsprechender Kompetenzen. Für weiterführende Lektüre gibt es vertiefende Darstellungen zu den einzelnen Themen. Für eine allgemeine Einführung in die agrarökonomische Forschung, einschließlich der Frage, wie überzeugende Argumente entwickelt werden können, bietet sich das Einführungsbuch „Doing Economics“ von Bellemare (2026) an. Detailliertere Darstellungen der verschiedenen kausalen Forschungsdesigns, einschließlich Beispielcode für unterschiedliche Software, finden sich in „The Mixtape“ von Cunningham (2026) und „The Effect“ von Huntington-Klein (2026). Zu einzelnen Forschungsdesigns existieren zudem spezialisierte Übersichtsarbeiten, etwa zu Difference-in-Differences-Designs einschließlich neuerer Erkenntnisse zu zeitlich versetzter Behandlung (Treatment) (Baker et al., 2025; Roth, Sant’Anna, Bilinski & Poe, 2023), zu Regression-Discontinuity-Designs (Wuepper & Finger, 2023) sowie zu Instrumentenvariablen, darunter auch Übersichtsarbeiten zu spezifischen, häufig verwendeten Instrumententypen wie Shift-Share-Instrumenten (Borusyak, Hull & Jaravel, 2025). Zugängliche Einführungen in maschinelles Lernen bieten Storm, Baylis & Heckelei (2020) sowie Baylis, Heckelei & Storm (2021).

Studie: Henningsen, A., Low, G., Wuepper, D., Dalhaus, T., Storm, H., Belay, D. & Hirsch, S. (2025). Estimating Causal Effects with Observational Data: Guidelines for Agricultural and Applied Economists. Journal of Agricultural Economics, forthcoming. https://doi.org/10.1111/1477-9552.70019 (Open Access)

*Von Arne Henningsen, Dagim Belay (Uni Copenhagen), Guy Low (Uni Göttingen), David Wuepper, Hugo Storm (Uni Bonn), Tobias Dalhaus (Hochschule Rhein-Waal) und Stefan Hirsch (Uni Hohenheim) Kontakt: arne@ifro.ku.dk.

Dieser Blog-Post ist eine Übersetzung des englischsprachigen Blog-Posts “A Practical Introduction to Causal Inference in Agricultural Economics” (https://www.ilr1.uni-bonn.de/en/research/research-groups/land-economics/land-economics-blog ).

Referenzen

Baker, A., Callaway, B., Cunningham, S., Goodman-Bacon, A. & Sant’Anna, P.H.C. (2025). Difference-in-differences designs: A practitioner’s guide. arXiv preprint arXiv:2503.13323

Baylis, K., Heckelei, T., & Storm, H. (2021). Machine learning in agricultural economics. In Handbook of Agricultural Economics (Vol. 5, pp. 4551-4612). Elsevier. 

Bellemare, M. F. (2022). Doing economics: What you should have learned in grad school—but didn’t. MIT Press. 

Borusyak, K., Hull, P., & Jaravel, X. (2025). A practical guide to shift-share instruments. Journal of Economic Perspectives, 39(1), 181-204. 

Cunningham, S. (2021). Causal inference: The mixtape. Yale University Press. 

Henningsen, A., Low, G., Wuepper, D., Dalhaus, T., Storm, H., Belay, D. & Hirsch, S. (2025). Estimating Causal Effects with Observational Data: Guidelines for Agricultural and Applied Economists. Journal of Agricultural Economics, forthcoming. https://doi.org/10.1111/1477-9552.70019

Huntington-Klein, N. (2025). The effect: An introduction to research design and causality. Chapman and Hall/CRC. 

Roth, J., Sant’Anna, P. H., Bilinski, A., & Poe, J. (2023). What’s trending in difference-in-differences? A synthesis of the recent econometrics literature. Journal of Econometrics, 235(2), 2218-2244. 

Storm, H., Baylis, K., & Heckelei, T. (2020). Machine learning in agricultural and applied economics. European Review of Agricultural Economics, 47(3), 849-892. 

Wuepper, D., & Finger, R. (2023). Regression discontinuity designs in agricultural and environmental economics. European Review of Agricultural Economics, 50(1), 1-28.

Hinterlasse einen Kommentar

About Robert Finger

I am professor of Agricultural Economics and Policy at ETH Zurich. Group Website: www.aecp.ethz.ch. Private Website: https://sites.google.com/view/fingerrobert/home