Methodology GuideMathematics & StatisticsSystematic Review
When Causality Meets Neural Networks: A Survey of Causal Deep Learning
Deep learning finds correlations. Causal inference finds causes. Jiao et al. survey the growing intersection where neural networks learn not just to predict, but to reason about interventions, counterfactuals, and structural mechanisms.
By Sean K.S. Shin
This blog summarizes research trends based on published paper abstracts. Specific numbers or findings may contain inaccuracies. For scholarly rigor, always consult the original papers cited in each post.
A neural network trained on hospital data might learn that patients who receive a particular drug have higher mortality ratesโnot because the drug is harmful, but because it is prescribed to the sickest patients. This is the problem of spurious correlation, and it is not a bug in deep learning. It is a feature. Deep networks are optimized to find any statistical pattern that reduces prediction error, regardless of whether that pattern reflects a causal mechanism or a confounding artifact.
Jiao et al.'s comprehensive survey in Research maps the rapidly growing field that aims to fix this: the integration of causal inference principles into deep learning architectures.
Why Correlation Is Not Enough
The distinction between correlation and causation is Statistics 101 material, yet it remains one of the most consequential gaps in modern AI systems. Consider the practical stakes:
- A hiring algorithm may learn to penalize applicants from certain zip codesโnot because location affects job performance, but because historical discrimination created a correlation.
- A medical imaging model may rely on hospital-specific metadata rather than pathological features, because these metadata happen to correlate with diagnosis in the training set.
In each case, the model captures a real statistical pattern that is simply the wrong one for the intended purpose. Causal inference provides the framework to distinguish patterns that reflect genuine mechanisms from those arising from confounding or selection bias.
The Three Rungs of Causal Reasoning
The survey organizes its treatment around Judea Pearl's causal hierarchy, which distinguishes three levels of causal reasoning:
Rung 1: Association. Observing that X and Y co-occur. This is the domain of standard deep learningโpattern recognition from observational data. The question answered: "What is the probability of Y given that I observe X?"
Rung 2: Intervention. Predicting what happens when one actively changes X. This requires understanding causal structure, not just statistical association. The question answered: "What would happen to Y if I set X to a particular value?"
Rung 3: Counterfactual. Reasoning about what would have happened under conditions that did not occur. The question answered: "Given that X = x and Y = y actually happened, what would Y have been if X had been x' instead?"
Most deep learning operates at Rung 1. The survey catalogs methods that push toward Rungs 2 and 3, where genuine causal reasoning begins.
Core Themes from the Survey
<
| Theme | Description | Key Challenge |
|---|
| Spurious correlation mitigation | Replacing correlation-based models with causal models | Identifying the correct causal graph |
| Causal representation learning | Learning representations that encode causal variables | Identifiability without strong assumptions |
| Treatment effect estimation | Using neural networks to estimate causal effects | High-dimensional confounders |
| Causal discovery from data | Inferring causal structure using deep learning | Scalability to large variable sets |
| Robustness and generalization | Using causal invariance for domain generalization | Defining and testing invariance |
The survey draws on ideas from cognitive neuroscience, noting that human brains perform causal reasoning naturallyโinferring causes from effects, imagining counterfactual scenarios, planning interventions. This brain-inspired perspective motivates the search for neural network architectures that can perform analogous causal computations.
Identification and Estimation
A central tension in causal deep learning is between identification and estimation. Identification asks: given the causal structure, can the causal quantity of interest be computed from observational data? Estimation asks: given that the quantity is identifiable, how do we compute it accurately from finite samples?
Classical causal inference has developed sophisticated identification strategiesโback-door adjustment, front-door criterion, instrumental variables, regression discontinuity. These strategies rely on assumptions about the causal graph, which in turn require domain knowledge.
Deep learning contributes primarily to the estimation side. Once a causal quantity is identified through domain expertise and graphical criteria, neural networks can estimate it from complex, high-dimensional data where traditional estimators struggle. Architectures like CEVAE (Causal Effect Variational Autoencoders) and Dragonnet target treatment effect estimation, while causal forests and their neural analogs estimate heterogeneous effects across subpopulations.
The survey notes that deep learning's strengthโflexible function approximationโis what is needed when treatment effects vary in complex, nonlinear ways.
Causal Discovery: Can Networks Find Causes?
The survey also covers the ambitious goal of using deep learning to discover causal structure from data. Approaches include score-based methods, continuous relaxation of the DAG search, and attention-based methods that interpret transformer weights as causal indicators.
The survey appropriately notes the limitations: causal discovery from observational data faces fundamental identifiability barriers. Without interventional data, multiple causal graphs may be equally consistent with the observed distribution. Deep learning provides better optimization within these theoretical limitsโit does not resolve them.
Open Questions
Scalability of causal graphs. Most causal inference methods assume a known or learnable causal graph with a manageable number of variables. Real-world systems may involve thousands of interacting variables, where specifying or learning the complete causal structure is intractable.
Causal reasoning in foundation models. Do large language models perform genuine causal reasoning, or do they mimic causal language from training data? This distinction is an active and contentious debate.
Benchmarking. Causal claims are difficult to evaluate empirically. The survey highlights the need for standardized benchmarks with known causal ground truth.
Integration with domain knowledge. Causal inference requires assumptions. Deep learning is good at minimizing the need for assumptions. The tension between these two philosophiesโone assumption-rich, one assumption-leanโhas not been fully resolved.
Closing Reflection
The marriage of causal inference and deep learning addresses a genuine deficiency: deep networks learn what patterns exist in data, but not why those patterns exist. Causal methods provide the whyโat the cost of requiring structural assumptions that pure data-driven approaches avoid.
Jiao et al.'s survey provides a useful map of this rapidly expanding territory. The field's ultimate test will be practical: can causal deep learning methods improve decisions in medicine, policy, and engineering where correlation-based predictions fall short? The theoretical foundations are maturing. The empirical validation is still catching up.
๋ฉด์ฑ
์กฐํญ: ์ด ๊ฒ์๋ฌผ์ ์ ๋ณด ์ ๊ณต์ ๋ชฉ์ ์ผ๋ก ํ ์ฐ๊ตฌ ๋ํฅ ๊ฐ์์ด๋ค. ํ์ ์ฐ๊ตฌ์์ ์ธ์ฉํ๊ธฐ ์ ์ ๊ตฌ์ฒด์ ์ธ ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ํต๊ณ ๋ฐ ์ฃผ์ฅ์ ์๋ณธ ๋
ผ๋ฌธ์ ํตํด ๋ฐ๋์ ๊ฒ์ฆํด์ผ ํ๋ค.
์ธ๊ณผ๊ด๊ณ์ ์ ๊ฒฝ๋ง์ ๋ง๋จ: ์ธ๊ณผ์ ๋ฅ๋ฌ๋ ์๋ฒ ์ด
๋ณ์ ๋ฐ์ดํฐ๋ก ํ๋ จ๋ ์ ๊ฒฝ๋ง์ ํน์ ์ฝ๋ฌผ์ ํฌ์ฌ๋ฐ์ ํ์์ ์ฌ๋ง๋ฅ ์ด ๋ ๋๋ค๋ ๊ฒ์ ํ์ตํ ์ ์๋ค. ์ด๋ ๊ทธ ์ฝ๋ฌผ์ด ํด๋กญ๊ธฐ ๋๋ฌธ์ด ์๋๋ผ, ๊ฐ์ฅ ์์คํ ํ์์๊ฒ ์ฒ๋ฐฉ๋๊ธฐ ๋๋ฌธ์ด๋ค. ์ด๊ฒ์ด ๋ฐ๋ก ํ์ ์๊ด๊ด๊ณ(spurious correlation) ๋ฌธ์ ์ด๋ฉฐ, ์ด๋ ๋ฅ๋ฌ๋์ ๋ฒ๊ทธ๊ฐ ์๋๋ค. ์คํ๋ ค ๋ฅ๋ฌ๋์ ํน์ฑ์ด๋ค. ๋ฅ ๋คํธ์ํฌ๋ ํด๋น ํจํด์ด ์ธ๊ณผ์ ๋ฉ์ปค๋์ฆ์ ๋ฐ์ํ๋์ง, ์๋๋ฉด ๊ต๋ ๋ณ์์ ์ํ ์ธ์์ ๊ฒฐ๊ณผ์ธ์ง์ ๊ด๊ณ์์ด ์์ธก ์ค๋ฅ๋ฅผ ์ค์ด๋ ํต๊ณ์ ํจํด์ ํ์ํ๋๋ก ์ต์ ํ๋์ด ์๋ค.
Research ์ ๋์ ๊ฒ์ฌ๋ Jiao et al.์ ํฌ๊ด์ ์ธ ์๋ฒ ์ด๋ ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํ๋ ๋น ๋ฅด๊ฒ ์ฑ์ฅํ๋ ๋ถ์ผ, ์ฆ ์ธ๊ณผ ์ถ๋ก ์๋ฆฌ์ ๋ฅ๋ฌ๋ ์ํคํ
์ฒ์ ํตํฉ์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ๋ค.
์๊ด๊ด๊ณ๋ง์ผ๋ก๋ ์ถฉ๋ถํ์ง ์์ ์ด์
์๊ด๊ด๊ณ์ ์ธ๊ณผ๊ด๊ณ์ ๊ตฌ๋ถ์ ํต๊ณํ ์
๋ฌธ ์์ค์ ๋ด์ฉ์ด์ง๋ง, ํ๋ AI ์์คํ
์์ ๊ฐ์ฅ ์ค์ํ ๋ฌธ์ ์ค ํ๋๋ก ๋จ์ ์๋ค. ์ค์ง์ ์ธ ์ํ ๋ถ๋ด์ ์ดํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค:
- ์ฑ์ฉ ์๊ณ ๋ฆฌ์ฆ์ ํน์ ์ฐํธ๋ฒํธ ์ถ์ ์ง์์๋ฅผ ๋ถ์ด์ต ์ฒ๋ฆฌํ๋๋ก ํ์ต๋ ์ ์๋ค. ์ด๋ ๊ฑฐ์ฃผ ์ง์ญ์ด ์ง๋ฌด ์ฑ๊ณผ์ ์ํฅ์ ๋ฏธ์น๊ธฐ ๋๋ฌธ์ด ์๋๋ผ, ๊ณผ๊ฑฐ์ ์ฐจ๋ณ์ด ์๊ด๊ด๊ณ๋ฅผ ๋ง๋ค์ด๋๊ธฐ ๋๋ฌธ์ด๋ค.
- ์๋ฃ ์์ ๋ชจ๋ธ์ ๋ณ๋ฆฌํ์ ํน์ง ๋์ ๋ณ์ ๊ณ ์ ์ ๋ฉํ๋ฐ์ดํฐ์ ์์กดํ ์ ์๋ค. ์ด ๋ฉํ๋ฐ์ดํฐ๊ฐ ํ๋ จ ๋ฐ์ดํฐ์
์์ ์ง๋จ๊ณผ ์ฐ์ฐํ ์๊ด๊ด๊ณ๋ฅผ ๊ฐ์ง๊ธฐ ๋๋ฌธ์ด๋ค.
๊ฐ๊ฐ์ ์ฌ๋ก์์ ๋ชจ๋ธ์ ์ค์ ํต๊ณ์ ํจํด์ ํฌ์ฐฉํ์ง๋ง, ๊ทธ๊ฒ์ ์๋๋ ๋ชฉ์ ์ ๋ถํฉํ์ง ์๋ ์๋ชป๋ ํจํด์ด๋ค. ์ธ๊ณผ ์ถ๋ก ์ ์ค์ ๋ฉ์ปค๋์ฆ์ ๋ฐ์ํ๋ ํจํด๊ณผ ๊ต๋ ๋ณ์ ๋๋ ์ ํ ํธํฅ์์ ๋น๋กฏ๋ ํจํด์ ๊ตฌ๋ถํ๊ธฐ ์ํ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ค.
์ธ๊ณผ์ ์ถ๋ก ์ ์ธ ๋จ๊ณ
์ด ์๋ฒ ์ด๋ ์ธ๊ณผ์ ์ถ๋ก ์ ์ธ ๊ฐ์ง ์์ค์ ๊ตฌ๋ถํ๋ Judea Pearl์ ์ธ๊ณผ ๊ณ์ธต ๊ตฌ์กฐ๋ฅผ ์ค์ฌ์ผ๋ก ๋ด์ฉ์ ๊ตฌ์ฑํ๋ค.
1๋จ๊ณ: ์ฐ๊ด(Association). X์ Y๊ฐ ํจ๊ป ๋ฐ์ํจ์ ๊ด์ฐฐํ๋ ๊ฒ์ด๋ค. ์ด๋ ๊ด์ฐฐ ๋ฐ์ดํฐ๋ก๋ถํฐ์ ํจํด ์ธ์, ์ฆ ํ์ค์ ์ธ ๋ฅ๋ฌ๋์ ์์ญ์ด๋ค. ๋ตํ๋ ์ง๋ฌธ: "X๋ฅผ ๊ด์ฐฐํ์ ๋ Y์ ํ๋ฅ ์ ๋ฌด์์ธ๊ฐ?"
2๋จ๊ณ: ๊ฐ์
(Intervention). X๋ฅผ ๋ฅ๋์ ์ผ๋ก ๋ณ๊ฒฝํ ๋ ์ด๋ค ์ผ์ด ๋ฐ์ํ๋์ง ์์ธกํ๋ ๊ฒ์ด๋ค. ์ด๋ ๋จ์ํ ํต๊ณ์ ์ฐ๊ด๊ด๊ณ๊ฐ ์๋ ์ธ๊ณผ ๊ตฌ์กฐ์ ๋ํ ์ดํด๋ฅผ ํ์๋ก ํ๋ค. ๋ตํ๋ ์ง๋ฌธ: "X๋ฅผ ํน์ ๊ฐ์ผ๋ก ์ค์ ํ๋ฉด Y๋ ์ด๋ป๊ฒ ๋๋๊ฐ?"
3๋จ๊ณ: ๋ฐ์ฌ์ค(Counterfactual). ์ค์ ๋ก ๋ฐ์ํ์ง ์์ ์กฐ๊ฑด ํ์์ ์ด๋ค ์ผ์ด ์ผ์ด๋ฌ์์ง๋ฅผ ์ถ๋ก ํ๋ ๊ฒ์ด๋ค. ๋ตํ๋ ์ง๋ฌธ: "์ค์ ๋ก X = x์ด๊ณ Y = y๊ฐ ๋ฐ์ํ์ ๋, X๊ฐ x'์๋ค๋ฉด Y๋ ์ด๋ค ๊ฐ์ ๊ฐ์ก์๊น?"
๋๋ถ๋ถ์ ๋ฅ๋ฌ๋์ 1๋จ๊ณ์์ ์๋ํ๋ค. ์ด ์๋ฒ ์ด๋ ์ง์ ํ ์ธ๊ณผ์ ์ถ๋ก ์ด ์์๋๋ 2๋จ๊ณ์ 3๋จ๊ณ๋ก ๋์๊ฐ๋ ๋ฐฉ๋ฒ๋ก ๋ค์ ์ฒด๊ณ์ ์ผ๋ก ์ ๋ฆฌํ๋ค.
์๋ฒ ์ด์ ํต์ฌ ์ฃผ์
<
| ์ฃผ์ | ์ค๋ช
| ํต์ฌ ๊ณผ์ |
|---|
| ํ์ ์๊ด๊ด๊ณ ์ํ | ์๊ด๊ด๊ณ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ์ธ๊ณผ ๋ชจ๋ธ๋ก ๋์ฒด | ์ฌ๋ฐ๋ฅธ ์ธ๊ณผ ๊ทธ๋ํ ์๋ณ |
| ์ธ๊ณผ ํํ ํ์ต | ์ธ๊ณผ ๋ณ์๋ฅผ ์ธ์ฝ๋ฉํ๋ ํํ ํ์ต | ๊ฐํ ๊ฐ์ ์์ด ์๋ณ ๊ฐ๋ฅ์ฑ ํ๋ณด |
| ์ฒ๋ฆฌ ํจ๊ณผ ์ถ์ | ์ ๊ฒฝ๋ง์ ํ์ฉํ ์ธ๊ณผ ํจ๊ณผ ์ถ์ | ๊ณ ์ฐจ์ ๊ต๋ ๋ณ์ ์ฒ๋ฆฌ |
| ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ธ๊ณผ ํ์ | ๋ฅ๋ฌ๋์ ํ์ฉํ ์ธ๊ณผ ๊ตฌ์กฐ ์ถ๋ก | ๋๊ท๋ชจ ๋ณ์ ์งํฉ์ผ๋ก์ ํ์ฅ์ฑ |
| ๊ฒฌ๊ณ ์ฑ ๋ฐ ์ผ๋ฐํ | ๋๋ฉ์ธ ์ผ๋ฐํ๋ฅผ ์ํ ์ธ๊ณผ ๋ถ๋ณ์ฑ ํ์ฉ | ๋ถ๋ณ์ฑ ์ ์ ๋ฐ ๊ฒ์ฆ |
์ด ์๋ฒ ์ด๋ ์ธ์ง ์ ๊ฒฝ๊ณผํ์ ๊ฐ๋
์ ์ฐธ๊ณ ํ๋ฉฐ, ์ธ๊ฐ์ ๋๊ฐ ์์ฐ์ค๋ฝ๊ฒ ์ธ๊ณผ์ ์ถ๋ก ์ ์ํํ๋ค๋ ์ ์ ์ฃผ๋ชฉํ๋ค. ์ฆ, ๊ฒฐ๊ณผ๋ก๋ถํฐ ์์ธ์ ์ถ๋ก ํ๊ณ , ๋ฐ์ฌ์ค์ ์๋๋ฆฌ์ค๋ฅผ ์์ํ๋ฉฐ, ๊ฐ์
์ ๊ณํํ๋ ๊ฒ์ด๋ค. ์ด๋ฌํ ๋ ์๊ฐ์ ๊ด์ ์ ์ ์ฌํ ์ธ๊ณผ์ ๊ณ์ฐ์ ์ํํ ์ ์๋ ์ ๊ฒฝ๋ง ์ํคํ
์ฒ๋ฅผ ํ์ํ๋ ๋๊ธฐ๊ฐ ๋๋ค.
์๋ณ๊ณผ ์ถ์
์ธ๊ณผ ๋ฐ๊ฒฌ: ๋คํธ์ํฌ๊ฐ ์์ธ์ ์ฐพ์ ์ ์๋๊ฐ?
์ธ๊ณผ์ ๋ฅ๋ฌ๋์ ํต์ฌ์ ์ธ ๊ธด์ฅ ๊ด๊ณ๋ ์๋ณ(identification)๊ณผ ์ถ์ (estimation) ์ฌ์ด์ ์กด์ฌํ๋ค. ์๋ณ์ ๋ค์์ ๋ฌป๋๋ค: ์ธ๊ณผ ๊ตฌ์กฐ๊ฐ ์ฃผ์ด์ก์ ๋, ๊ด์ฌ ์๋ ์ธ๊ณผ์ ์์ ๊ด์ธก ๋ฐ์ดํฐ๋ก๋ถํฐ ๊ณ์ฐํ ์ ์๋๊ฐ? ์ถ์ ์ ๋ค์์ ๋ฌป๋๋ค: ํด๋น ์์ด ์๋ณ ๊ฐ๋ฅํ๋ค๊ณ ํ ๋, ์ ํํ ํ๋ณธ์ผ๋ก๋ถํฐ ์ด๋ฅผ ์ ํํ ์ด๋ป๊ฒ ๊ณ์ฐํ๋๊ฐ?
๊ณ ์ ์ ์ธ๊ณผ ์ถ๋ก ์ ์ ๊ตํ ์๋ณ ์ ๋ต๋ค์ ๋ฐ์ ์์ผ ์๋คโ๋ท๋ฌธ ์กฐ์ (back-door adjustment), ์๋ฌธ ๊ธฐ์ค(front-door criterion), ๋๊ตฌ ๋ณ์(instrumental variables), ํ๊ท ๋ถ์ฐ์ ์ค๊ณ(regression discontinuity). ์ด๋ฌํ ์ ๋ต๋ค์ ์ธ๊ณผ ๊ทธ๋ํ์ ๋ํ ๊ฐ์ ์ ์์กดํ๋ฉฐ, ์ด๋ ๋ค์ ๋๋ฉ์ธ ์ง์์ ํ์๋ก ํ๋ค.
๋ฅ๋ฌ๋์ ์ฃผ๋ก ์ถ์ ์ธก๋ฉด์ ๊ธฐ์ฌํ๋ค. ์ธ๊ณผ์ ์์ด ๋๋ฉ์ธ ์ ๋ฌธ ์ง์๊ณผ ๊ทธ๋ํฝ ๊ธฐ์ค์ ํตํด ์๋ณ๋๊ณ ๋๋ฉด, ์ ๊ฒฝ๋ง์ ์ ํต์ ์ธ ์ถ์ ๋์ด ์ด๋ ค์์ ๊ฒช๋ ๋ณต์กํ๊ณ ๊ณ ์ฐจ์์ ์ธ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ด๋ฅผ ์ถ์ ํ ์ ์๋ค. CEVAE(Causal Effect Variational Autoencoders)์ Dragonnet๊ณผ ๊ฐ์ ์ํคํ
์ฒ๋ ์ฒ๋ฆฌ ํจ๊ณผ(treatment effect) ์ถ์ ์ ๋ชฉํ๋ก ํ๋ฉฐ, ์ธ๊ณผ ํฌ๋ ์คํธ(causal forests)์ ๊ทธ ์ ๊ฒฝ๋ง ์ ์ฌ์ฒด๋ค์ ํ์ ์ง๋จ ์ ๋ฐ์ ๊ฑธ์น ์ด์ง์ ํจ๊ณผ๋ฅผ ์ถ์ ํ๋ค.
ํด๋น ์๋ฒ ์ด๋ ๋ฅ๋ฌ๋์ ๊ฐ์ โ์ ์ฐํ ํจ์ ๊ทผ์ฌโ์ด ์ฒ๋ฆฌ ํจ๊ณผ๊ฐ ๋ณต์กํ๊ณ ๋น์ ํ์ ์ธ ๋ฐฉ์์ผ๋ก ๋ณํ ๋ ํ์ํ ๊ฒ์์ ์ง์ ํ๋ค.
์ธ๊ณผ ๋ฐ๊ฒฌ: ๋คํธ์ํฌ๊ฐ ์์ธ์ ์ฐพ์ ์ ์๋๊ฐ?
ํด๋น ์๋ฒ ์ด๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ธ๊ณผ ๊ตฌ์กฐ๋ฅผ ๋ฐ๊ฒฌํ๊ธฐ ์ํด ๋ฅ๋ฌ๋์ ์ฌ์ฉํ๋ ์ผ์ฌ์ฐฌ ๋ชฉํ๋ ๋ค๋ฃฌ๋ค. ์ ๊ทผ ๋ฐฉ์์ผ๋ก๋ ์ ์ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ(score-based methods), DAG ํ์์ ์ฐ์ ์ํ(continuous relaxation), ๊ทธ๋ฆฌ๊ณ ํธ๋์คํฌ๋จธ ๊ฐ์ค์น๋ฅผ ์ธ๊ณผ ์งํ๋ก ํด์ํ๋ ์ดํ
์
๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ด ์๋ค.
ํด๋น ์๋ฒ ์ด๋ ์ ์ ํ๊ฒ๋ ๊ทธ ํ๊ณ๋ฅผ ์ง์ ํ๋ค: ๊ด์ธก ๋ฐ์ดํฐ๋ก๋ถํฐ์ ์ธ๊ณผ ๋ฐ๊ฒฌ์ ๊ทผ๋ณธ์ ์ธ ์๋ณ ๊ฐ๋ฅ์ฑ ์ฅ๋ฒฝ์ ์ง๋ฉดํ๋ค. ๊ฐ์
๋ฐ์ดํฐ(interventional data) ์์ด๋ ์ฌ๋ฌ ์ธ๊ณผ ๊ทธ๋ํ๊ฐ ๊ด์ธก๋ ๋ถํฌ์ ๋๋ฑํ๊ฒ ์ผ์นํ ์ ์๋ค. ๋ฅ๋ฌ๋์ ์ด๋ฌํ ์ด๋ก ์ ํ๊ณ ๋ด์์ ๋ ๋์ ์ต์ ํ๋ฅผ ์ ๊ณตํ ๋ฟโ๊ทธ๊ฒ์ ํด๊ฒฐํ์ง๋ ๋ชปํ๋ค.
๋ฏธํด๊ฒฐ ๋ฌธ์ ๋ค
์ธ๊ณผ ๊ทธ๋ํ์ ํ์ฅ์ฑ. ๋๋ถ๋ถ์ ์ธ๊ณผ ์ถ๋ก ๋ฐฉ๋ฒ์ ๊ด๋ฆฌ ๊ฐ๋ฅํ ์์ ๋ณ์๋ฅผ ๊ฐ์ง ์๋ ค์ก๊ฑฐ๋ ํ์ต ๊ฐ๋ฅํ ์ธ๊ณผ ๊ทธ๋ํ๋ฅผ ๊ฐ์ ํ๋ค. ์ค์ ์์คํ
์๋ ์์ฒ ๊ฐ์ ์ํธ์์ฉํ๋ ๋ณ์๊ฐ ํฌํจ๋ ์ ์์ผ๋ฉฐ, ์ฌ๊ธฐ์ ์์ ํ ์ธ๊ณผ ๊ตฌ์กฐ๋ฅผ ๋ช
์ํ๊ฑฐ๋ ํ์ตํ๋ ๊ฒ์ ๋ค๋ฃจ๊ธฐ ์ด๋ ต๋ค.
๊ธฐ๋ฐ ๋ชจ๋ธ์์์ ์ธ๊ณผ ์ถ๋ก . ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ง์ ํ ์ธ๊ณผ ์ถ๋ก ์ ์ํํ๋๊ฐ, ์๋๋ฉด ํ๋ จ ๋ฐ์ดํฐ์ ์ธ๊ณผ์ ์ธ์ด๋ฅผ ๋ชจ๋ฐฉํ๋๊ฐ? ์ด ๊ตฌ๋ถ์ ํ์ฌ ํ๋ฐํ๊ณ ๋
ผ์์ ์ธ ํ ๋ก ์ ๋์์ด๋ค.
๋ฒค์น๋งํน. ์ธ๊ณผ์ ์ฃผ์ฅ์ ๊ฒฝํ์ ์ผ๋ก ํ๊ฐํ๊ธฐ ์ด๋ ต๋ค. ํด๋น ์๋ฒ ์ด๋ ์๋ ค์ง ์ธ๊ณผ์ ๊ทธ๋ผ์ด๋ ํธ๋ฃจ์ค(ground truth)๋ฅผ ๊ฐ์ถ ํ์คํ๋ ๋ฒค์น๋งํฌ์ ํ์์ฑ์ ๊ฐ์กฐํ๋ค.
๋๋ฉ์ธ ์ง์๊ณผ์ ํตํฉ. ์ธ๊ณผ ์ถ๋ก ์ ๊ฐ์ ์ ํ์๋ก ํ๋ค. ๋ฅ๋ฌ๋์ ๊ฐ์ ์ ํ์์ฑ์ ์ต์ํํ๋ ๋ฐ ๋ฅํ๋ค. ์ด ๋ ์ฒ ํโํ๋๋ ๊ฐ์ ์ด ํ๋ถํ๊ณ , ํ๋๋ ๊ฐ์ ์ด ์ ์โ์ฌ์ด์ ๊ธด์ฅ์ ์์ง ์์ ํ ํด์๋์ง ์์๋ค.
๋งบ์๋ง
์ธ๊ณผ ์ถ๋ก ๊ณผ ๋ฅ๋ฌ๋์ ๊ฒฐํฉ์ ์ค์ง์ ์ธ ๊ฒฐํ์ ํด์ํ๋ค: ๋ฅ ๋คํธ์ํฌ๋ ๋ฐ์ดํฐ์ ์ด๋ค ํจํด์ด ์กด์ฌํ๋์ง๋ฅผ ํ์ตํ์ง๋ง, ๊ทธ ํจํด์ด ์ ์กด์ฌํ๋์ง๋ ํ์ตํ์ง ๋ชปํ๋ค. ์ธ๊ณผ์ ๋ฐฉ๋ฒ์ ์๋ฅผ ์ ๊ณตํ๋คโ์์ํ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ด ํํผํ๋ ๊ตฌ์กฐ์ ๊ฐ์ ์ ํ์๋ก ํ๋ ๋๊ฐ๋ฅผ ์น๋ฅด๋ฉด์.
Jiao ์ธ์ ์๋ฒ ์ด๋ ๋น ๋ฅด๊ฒ ํ์ฅ๋๋ ์ด ์์ญ์ ์ ์ฉํ ์ง๋๋ฅผ ์ ๊ณตํ๋ค. ์ด ๋ถ์ผ์ ๊ถ๊ทน์ ์ธ ์ํ์ ์ค์ฉ์ ์ผ ๊ฒ์ด๋ค: ์ธ๊ณผ์ ๋ฅ๋ฌ๋ ๋ฐฉ๋ฒ์ด ์๊ด๊ด๊ณ ๊ธฐ๋ฐ ์์ธก์ด ๋ถ์กฑํ ์ํ, ์ ์ฑ
, ๊ณตํ ๋ถ์ผ์์ ์์ฌ๊ฒฐ์ ์ ๊ฐ์ ํ ์ ์๋๊ฐ? ์ด๋ก ์ ํ ๋๋ ์ฑ์ํด์ง๊ณ ์๋ค. ๊ฒฝํ์ ๊ฒ์ฆ์ ์์ง ๋ฐ๋ผ์ก๋ ์ค์ด๋ค.
References (1)
Jiao, L., Wang, Y., Liu, X., Li, L., Liu, F., Ma, W., Guo, Y., Chen, P., Yang, S. & Hou, B. (2024). Causal inference meets deep learning: A comprehensive survey. Research, 7, 0467.