This blog summarizes research trends based on published paper abstracts. Specific numbers or findings may contain inaccuracies. For scholarly rigor, always consult the original papers cited in each post.
Here is a question that should trouble every researcher in educational technology: when an adaptive learning platform recommends that a student study "linear equations" before "quadratic functions," does it know why this sequence works, or has it merely observed that students who followed this order scored higher on the final exam?
The distinction is not academic. A correlation-based system that recommends "linear equations first" because this sequence correlates with higher scores will fail catastrophically when deployed in a context where the correlation breaksโa different curriculum structure, a different student population, a different assessment instrument. A causal system that understands why linear equations causally enable quadratic reasoning will generalize, because the causal mechanism transfers even when the surface statistics do not.
This is the promise of integrating knowledge graphs with causal inference in education: moving from systems that predict learning outcomes to systems that explain learning mechanisms. And the early results, while preliminary, suggest that this shift may be as consequential for educational AI as the transition from behaviorist to cognitive models was for instructional design.
The Landscape: Two Technologies, One Convergence
Knowledge graphs in education represent curricula as structured networks of concepts (nodes) and prerequisite relationships (edges). Unlike flat taxonomies or linear syllabi, they capture the rich, non-linear dependency structure of knowledge: understanding "probability" requires not just "statistics" but also "set theory," "combinatorics," and (often overlooked) "proportional reasoning." Educational knowledge graphs have been built for mathematics (KnowEdu), computer science (CS Knowledge Graph), and medical education (MedEdKG), typically through expert annotation or automated extraction from textbooks and learning management system logs.
Causal inference is the statistical machinery for distinguishing correlation from causation in observational data. In education, the gold standard for causal claims is the randomized controlled trial (RCT)โrandomly assign students to different learning pathways and compare outcomes. But RCTs in education are expensive, ethically constrained (you cannot knowingly assign students to an inferior pathway), and often infeasible at the granularity needed (you cannot randomize the order of every concept in a curriculum). Causal inference methodsโinstrumental variables, regression discontinuity, double machine learning, do-calculusโoffer a path to causal claims from observational learning analytics data.
The convergence of these two technologies is recent and powerful. Sun (2025) explores this integration as a novel approach, demonstrating that knowledge graphs supply the structural assumptions (which concepts could causally affect which others) that causal inference algorithms require, while causal inference supplies the counterfactual reasoning (what would happen if a student skipped this concept?) that knowledge graphs cannot provide on their own.
Methods: How Causal Educational Knowledge Graphs Work
The technical pipeline, as described by Sun (2025) and Jin and Cui (2024), involves four stages:
Stage 1: Graph Construction. A knowledge graph is built from curriculum documents, expert input, and learning management system data. Nodes represent knowledge components (KCs)โdiscrete, assessable units of understanding. Edges represent prerequisite relationships, co-requisite relationships, and analogical mappings.
Stage 2: Behavioral Enrichment. Student interaction dataโtime-on-task, error patterns, help-seeking behavior, assessment performanceโis overlaid on the knowledge graph. This creates what Jin and Cui call a "User Behavioural Knowledge Graph" (UBKG): the curriculum structure annotated with empirical evidence of how real students traverse it.
Stage 3: Causal Discovery. Causal inference algorithms (typically PC algorithm, GES, or NOTEARS for structure learning, and do-calculus or double machine learning for effect estimation) are applied to the UBKG to identify which prerequisite relationships are genuinely causal and which are merely correlational artifacts. For example, the observation that "students who study set theory before probability score higher" could reflect a causal prerequisite relationship or a selection effect (stronger students choose to study set theory first). Causal discovery disentangles these.
Stage 4: Counterfactual Pathway Optimization. Given the causal graph, the system can answer counterfactual questions: "If this student had studied concept A before concept B, would their outcome on concept C have been different?" These counterfactual estimates enable the optimization of learning pathways that are not merely correlated with good outcomes but causally productive of them.
The Robustness Problem
Huang and Vidal (2026) address a critical limitation of this pipeline: knowledge graphs in the real world are incomplete, noisy, and subject to the Open World Assumption (the absence of an edge does not mean the absence of a relationship). Their "Joint Graph Learning" framework simultaneously infers missing graph structure and estimates causal effects, handling both missing data and interference effects (where one student's learning trajectory influences another's through peer interaction).
The technical contribution is substantialโthey demonstrate robustness to significant proportions of missing edges in the knowledge graphโbut the educational implication is even more important. It means that causal educational knowledge graphs do not require perfect curriculum models to be useful. They can work with the imperfect, partially-specified curriculum descriptions that characterize most real educational settings, especially in under-resourced contexts where detailed curriculum maps do not exist.
Claims and Evidence
<
| Claim | Evidence | Verdict |
|---|
| Knowledge graph + causal inference improves learning pathway recommendations over correlation-based methods | Sun (2025): improved prediction over correlation-based approaches; single study | โ ๏ธ Uncertain (promising but unreplicated) |
| Causal discovery can identify genuine prerequisite relationships from observational data | Jin & Cui (2024): SAIERec system outperforms existing recommendation models on multiple datasets using counterfactual causal inference | โ
Supported |
| Counterfactual pathway optimization generalizes across student populations | No cross-population validation studies published | โ ๏ธ Uncertain |
| Incomplete knowledge graphs can support robust causal inference | Huang & Vidal (2026): robust performance in incomplete and relationally complex KGs | โ
Supported |
| Causal educational AI reduces fairness concerns compared to correlation-based systems | Theoretical argument (causal mechanisms are more universal than correlations); no empirical test | โ ๏ธ Uncertain |
The Fairness Connection
The intersection of causal inference and educational fairness deserves particular attention. As Chinta, Wang, and Yin (2024) document extensively, correlation-based educational AI systems encode and amplify historical biases: if students from disadvantaged backgrounds have historically been tracked into lower-level courses, a correlation-based system will learn to recommend lower-level content to similar students, perpetuating the cycle.
Causal inference offers a potential escape from this trap. A causal model can distinguish between the effect of the learning pathway on the outcome and the effect of background characteristics on both the pathway chosen and the outcome. By intervening on the pathway (the do-operator) while controlling for background, causal models can identify the learning sequence that would be optimal for each student regardless of their demographic categoryโa fundamentally different optimization target than "recommend the pathway that similar students have historically taken."
This is theoretically compelling. But the practical barriers are formidable. Causal inference requires assumptionsโno unmeasured confounding, positivity, consistencyโthat are difficult to verify in educational settings. And the very concept of "demographic category" in causal models is contested: race, gender, and socioeconomic status are not interventions that can be randomly assigned, raising deep questions about what "the causal effect of being female on learning outcomes" even means.
Open Questions
Can causal educational knowledge graphs scale beyond STEM? Current implementations focus on mathematics and computer science, where prerequisite structures are relatively clear. Humanities, social sciences, and arts have more fluid, less hierarchical knowledge structures. Can causal discovery handle this ambiguity?How do we validate causal claims without RCTs? Sensitivity analysis and natural experiments provide partial answers, but the field needs agreed-upon standards for when observational causal inference is "strong enough" to guide educational practice.What is the role of student agency? Current systems optimize learning pathways for students. Can causal knowledge graphs instead be used to help students understand the causal structure of their own learningโempowering them to make informed choices about their educational trajectories?How do peer effects interact with individual pathways? Education is fundamentally social. A learning pathway that is causally optimal for an isolated individual may be suboptimal in a classroom where peer explanation, collaborative problem-solving, and social motivation shape outcomes. Incorporating interference effects into causal educational models remains an open technical challenge.Can we build self-updating causal knowledge graphs? As students learn, the curriculum evolves, and pedagogical research advances, the knowledge graph must adapt. Can causal discovery algorithms operate in a streaming, online mode, continuously refining their understanding of educational causal structure?Implications
The integration of knowledge graphs and causal inference represents a paradigm shift in educational AIโfrom systems that learn patterns in student data to systems that learn mechanisms of student learning. This shift has implications beyond technical performance:
For curriculum designers: causal knowledge graphs provide an empirical tool for evaluating curriculum structure. If causal analysis reveals that a widely-assumed prerequisite relationship is actually correlational, curricula can be restructured to eliminate unnecessary bottlenecks.
For educational researchers: causal inference on knowledge graphs offers a middle path between the rigor of RCTs and the scalability of observational studies. It will not replace experimental research, but it can generate causal hypotheses that prioritize which experiments are worth running.
For students: a particularly promising possibility is making causal structure visible. Imagine a student who can see not just "what to study next" but whyโthe causal pathways through which mastering this concept will enable future learning. This metacognitive transparency could transform passive consumers of recommended content into active navigators of their own intellectual development.
The field is early. The evidence base is thin. But the conceptual advanceโfrom correlation to causation in educational AIโis exactly the kind of paradigm shift that transforms what is possible.
๋ฉด์ฑ
์กฐํญ: ์ด ๊ฒ์๋ฌผ์ ์ ๋ณด ์ ๊ณต ๋ชฉ์ ์ ์ฐ๊ตฌ ๋ํฅ ๊ฐ์์ด๋ค. ํ์ ์ฐ๊ตฌ์์ ์ธ์ฉํ๊ธฐ ์ ์ ๊ตฌ์ฒด์ ์ธ ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ํต๊ณ, ์ฃผ์ฅ์ ์๋ฌธ ๋
ผ๋ฌธ๊ณผ ๋์กฐํ์ฌ ๊ฒ์ฆํด์ผ ํ๋ค.
๊ต์ก์์์ ์ง์ ๊ทธ๋ํ์ ์ธ๊ณผ ์ถ๋ก ์ ๋ง๋จ: ์๊ด๊ด๊ณ ์ค์ฌ ํ์ต์ ๋์ด์
๊ต์ก ๊ธฐ์ ์ฐ๊ตฌ์๋ผ๋ฉด ๋๊ตฌ๋ ํ ๋ฒ์ฏค ๊ณ ๋ฏผํด ๋ด์ผ ํ ์ง๋ฌธ์ด ์๋ค. ์ ์ํ ํ์ต ํ๋ซํผ์ด ํ์์๊ฒ "์ด์ฐจํจ์" ์ ์ "์ผ์ฐจ๋ฐฉ์ ์"์ ๊ณต๋ถํ๋๋ก ๊ถ์ฅํ ๋, ๊ทธ ์์คํ
์ ์ด ์์๊ฐ ์ ํจ๊ณผ์ ์ธ์ง ์๊ณ ์๋ ๊ฒ์ธ๊ฐ, ์๋๋ฉด ๋จ์ํ ์ด ์์๋ฅผ ๋ฐ๋ฅธ ํ์๋ค์ด ๊ธฐ๋ง ์ํ์์ ๋ ๋์ ์ ์๋ฅผ ๋ฐ์๋ค๋ ์ฌ์ค์ ๊ด์ฐฐํ ๊ฒ์ ๋ถ๊ณผํ๊ฐ?
์ด ์ฐจ์ด๋ ๊ฒฐ์ฝ ์ฌ์ํ ๋ฌธ์ ๊ฐ ์๋๋ค. "์ผ์ฐจ๋ฐฉ์ ์ ๋จผ์ "๋ฅผ ๊ถ์ฅํ๋ ์๊ด๊ด๊ณ ๊ธฐ๋ฐ ์์คํ
์ ํด๋น ์์๊ฐ ๋ ๋์ ์ ์์ ์๊ด๊ด๊ณ๊ฐ ์๋ค๋ ์ด์ ๋ง์ผ๋ก ์๋ํ๊ธฐ ๋๋ฌธ์, ๊ทธ ์๊ด๊ด๊ณ๊ฐ ์ฑ๋ฆฝํ์ง ์๋ ๋งฅ๋ฝโ๋ค๋ฅธ ๊ต์ก๊ณผ์ ๊ตฌ์กฐ, ๋ค๋ฅธ ํ์ ์ง๋จ, ๋ค๋ฅธ ํ๊ฐ ๋๊ตฌโ์ ์ ์ฉ๋ ๋ ์น๋ช
์ ์ผ๋ก ์คํจํ๋ค. ๋ฐ๋ฉด, ์ผ์ฐจ๋ฐฉ์ ์์ด ์ด์ฐจ ์ถ๋ก ์ ์ ์ธ๊ณผ์ ์ผ๋ก ๊ฐ๋ฅํ๊ฒ ํ๋์ง ์ดํดํ๋ ์ธ๊ณผ ์์คํ
์ ํ๋ฉด์ ํต๊ณ๊ฐ ๋ฌ๋ผ์ง๋๋ผ๋ ์ธ๊ณผ ๋ฉ์ปค๋์ฆ์ด ์ ์ง๋๊ธฐ ๋๋ฌธ์ ์ผ๋ฐํ๊ฐ ๊ฐ๋ฅํ๋ค.
์ด๊ฒ์ด ๋ฐ๋ก ๊ต์ก์์ ์ง์ ๊ทธ๋ํ์ ์ธ๊ณผ ์ถ๋ก ์ ํตํฉํ๋ ๊ฒ์ ๊ฐ์น์ด๋ค. ์ฆ, ํ์ต ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ๋ ์์คํ
์์ ํ์ต ๋ฉ์ปค๋์ฆ์ ์ค๋ช
ํ๋ ์์คํ
์ผ๋ก์ ์ ํ์ด๋ค. ์์ง ์ด๊ธฐ ๋จ๊ณ์ด์ง๋ง, ์ด๋ฌํ ์ ํ์ด ๊ต์ก AI์ ๋ฏธ์น๋ ์ํฅ์ ํ๋์ฃผ์ ๋ชจ๋ธ์์ ์ธ์ง ๋ชจ๋ธ๋ก์ ์ ํ์ด ๊ต์ ์ค๊ณ์ ๋ฏธ์ณค๋ ์ํฅ๋งํผ ์ค๋ํ ์ ์๋ค.
์ ๋ฐ์ ๋ํฅ: ๋ ๊ธฐ์ ์ ์๋ ด
๊ต์ก ๋ถ์ผ์์์ ์ง์ ๊ทธ๋ํ๋ ๊ต์ก๊ณผ์ ์ ๊ฐ๋
(๋
ธ๋)๊ณผ ์ ์ ๊ด๊ณ(์ฃ์ง)๋ก ๊ตฌ์ฑ๋ ๊ตฌ์กฐํ๋ ๋คํธ์ํฌ๋ก ํํํ๋ค. ํ๋ฉด์ ๋ถ๋ฅ ์ฒด๊ณ๋ ์ ํ์ ๊ต์์๋ชฉ๊ณผ ๋ฌ๋ฆฌ, ์ง์ ๊ทธ๋ํ๋ ์ง์์ ํ๋ถํ๊ณ ๋น์ ํ์ ์ธ ์์กด ๊ตฌ์กฐ๋ฅผ ํฌ์ฐฉํ๋ค. ์๋ฅผ ๋ค์ด, "ํ๋ฅ "์ ์ดํดํ๋ ค๋ฉด "ํต๊ณ"๋ฟ๋ง ์๋๋ผ "์งํฉ๋ก ," "์กฐํฉ๋ก ," ๊ทธ๋ฆฌ๊ณ (์ข
์ข
๊ฐ๊ณผ๋๋) "๋น๋ก ์ถ๋ก "๋ ํ์ํ๋ค. ๊ต์ก์ฉ ์ง์ ๊ทธ๋ํ๋ ์ํ(KnowEdu), ์ปดํจํฐ ๊ณผํ(CS Knowledge Graph), ์ํ ๊ต์ก(MedEdKG) ๋ถ์ผ์์ ์ ๋ฌธ๊ฐ ์ฃผ์ ๋๋ ๊ต๊ณผ์์ ํ์ต ๊ด๋ฆฌ ์์คํ
(LMS) ๋ก๊ทธ๋ก๋ถํฐ์ ์๋ ์ถ์ถ์ ํตํด ๊ตฌ์ถ๋์ด ์๋ค.
์ธ๊ณผ ์ถ๋ก ์ ๊ด์ฐฐ ๋ฐ์ดํฐ์์ ์๊ด๊ด๊ณ์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ๊ตฌ๋ถํ๊ธฐ ์ํ ํต๊ณ์ ๋ฐฉ๋ฒ๋ก ์ด๋ค. ๊ต์ก์์ ์ธ๊ณผ ์ฃผ์ฅ์ ํ์ค์ ๋ฌด์์ ๋์กฐ ์ํ(RCT)์ผ๋ก, ํ์๋ค์ ์๋ก ๋ค๋ฅธ ํ์ต ๊ฒฝ๋ก์ ๋ฌด์์๋ก ๋ฐฐ์ ํ๊ณ ๊ฒฐ๊ณผ๋ฅผ ๋น๊ตํ๋ค. ๊ทธ๋ฌ๋ ๊ต์ก ๋ถ์ผ์ RCT๋ ๋น์ฉ์ด ๋ง์ด ๋ค๊ณ , ์ค๋ฆฌ์ ์ ์ฝ์ด ์์ผ๋ฉฐ(ํ์๋ค์ ์๋์ ์ผ๋ก ์ด๋ฑํ ํ์ต ๊ฒฝ๋ก์ ๋ฐฐ์ ํ ์ ์์), ํ์ํ ์์ค์ ์ธ๋ฐํจ์์๋ ์คํ ์์ฒด๊ฐ ๋ถ๊ฐ๋ฅํ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค(๊ต์ก๊ณผ์ ์ ๋ชจ๋ ๊ฐ๋
์์๋ฅผ ๋ฌด์์ํํ ์ ์์). ๋๊ตฌ ๋ณ์, ํ๊ท ๋ถ์ฐ์, ์ด์ค ๊ธฐ๊ณ ํ์ต(double machine learning), do-๊ณ์ฐ๋ฒ(do-calculus)๊ณผ ๊ฐ์ ์ธ๊ณผ ์ถ๋ก ๋ฐฉ๋ฒ๋ค์ ๊ด์ฐฐ๋ ํ์ต ๋ถ์ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ธ๊ณผ ์ฃผ์ฅ์ ๋์ถํ๋ ๊ฒฝ๋ก๋ฅผ ์ ๊ณตํ๋ค.
์ด ๋ ๊ธฐ์ ์ ์๋ ด์ ์ต๊ทผ์ ์ผ์ด๋ฉฐ ๊ฐ๋ ฅํ ์ ์ฌ๋ ฅ์ ์ง๋๋ค. Sun(2025)์ ์ด ํตํฉ์ ์๋ก์ด ์ ๊ทผ ๋ฐฉ์์ผ๋ก ํ๊ตฌํ๋ฉฐ, ์ง์ ๊ทธ๋ํ๊ฐ ์ธ๊ณผ ์ถ๋ก ์๊ณ ๋ฆฌ์ฆ์ ํ์ํ ๊ตฌ์กฐ์ ๊ฐ์ (์ด๋ค ๊ฐ๋
์ด ๋ค๋ฅธ ๊ฐ๋
์ ์ธ๊ณผ์ ์ผ๋ก ์ํฅ์ ๋ฏธ์น ์ ์๋์ง)์ ์ ๊ณตํ๋ ๋ฐ๋ฉด, ์ธ๊ณผ ์ถ๋ก ์ ์ง์ ๊ทธ๋ํ๋ง์ผ๋ก๋ ์ ๊ณตํ ์ ์๋ ๋ฐ์ฌ์ค์ ์ถ๋ก (ํ์์ด ํน์ ๊ฐ๋
์ ๊ฑด๋๋ฐ๋ฉด ์ด๋ป๊ฒ ๋ ๊น?)์ ์ ๊ณตํ๋ค๋ ์ ์ ๋ณด์ฌ ์ค๋ค.
๋ฐฉ๋ฒ๋ก : ์ธ๊ณผ์ ๊ต์ก ์ง์ ๊ทธ๋ํ์ ์๋ ๋ฐฉ์
Sun(2025)๊ณผ Jin and Cui(2024)๊ฐ ๊ธฐ์ ํ ๊ธฐ์ ์ ํ์ดํ๋ผ์ธ์ ๋ค ๋จ๊ณ๋ก ์ด๋ฃจ์ด์ง๋ค.
1๋จ๊ณ: ๊ทธ๋ํ ๊ตฌ์ฑ. ๊ต์ก๊ณผ์ ๋ฌธ์, ์ ๋ฌธ๊ฐ ์
๋ ฅ, LMS ๋ฐ์ดํฐ๋ก๋ถํฐ ์ง์ ๊ทธ๋ํ๋ฅผ ๊ตฌ์ถํ๋ค. ๋
ธ๋๋ ์ง์ ๊ตฌ์ฑ์์(KC, Knowledge Component)โ์ด์ฐ์ ์ด๊ณ ํ๊ฐ ๊ฐ๋ฅํ ์ดํด ๋จ์โ๋ฅผ ๋ํ๋ธ๋ค. ์ฃ์ง๋ ์ ์ ๊ด๊ณ, ๊ณต๋ ์ด์ ๊ด๊ณ, ์ ์ถ์ ๋์ ๊ด๊ณ๋ฅผ ํํํ๋ค.
2๋จ๊ณ: ํ๋ ๊ฐํ(Behavioral Enrichment). ๊ณผ์ ์ํ ์๊ฐ, ์ค๋ฅ ํจํด, ๋์ ์์ฒญ ํ๋, ํ๊ฐ ์ฑ๊ณผ ๋ฑ ํ์ ์ํธ์์ฉ ๋ฐ์ดํฐ๊ฐ ์ง์ ๊ทธ๋ํ ์์ ๋ง์์์ง๋ค. ์ด๋ฅผ ํตํด Jin๊ณผ Cui๊ฐ "์ฌ์ฉ์ ํ๋ ์ง์ ๊ทธ๋ํ(User Behavioural Knowledge Graph, UBKG)"๋ผ๊ณ ๋ถ๋ฅด๋ ๊ฒ์ด ์์ฑ๋๋ค. ์ฆ, ์ค์ ํ์๋ค์ด ๊ต์ก๊ณผ์ ์ ์ด๋ป๊ฒ ์ด์ํ๋์ง์ ๋ํ ๊ฒฝํ์ ์ฆ๊ฑฐ๋ก ์ฃผ์์ด ๋ฌ๋ฆฐ ๊ต์ก๊ณผ์ ๊ตฌ์กฐ์ด๋ค.
3๋จ๊ณ: ์ธ๊ณผ ๋ฐ๊ฒฌ(Causal Discovery). UBKG์ ์ธ๊ณผ ์ถ๋ก ์๊ณ ๋ฆฌ์ฆโ๊ตฌ์กฐ ํ์ต์๋ ์ผ๋ฐ์ ์ผ๋ก PC ์๊ณ ๋ฆฌ์ฆ, GES, ๋๋ NOTEARS๊ฐ ์ฌ์ฉ๋๋ฉฐ, ํจ๊ณผ ์ถ์ ์๋ do-calculus ๋๋ ์ด์ค ๊ธฐ๊ณ ํ์ต(double machine learning)์ด ์ฌ์ฉ๋๋คโ์ ์ ์ฉํ์ฌ ์ด๋ค ์ ์ ๊ด๊ณ๊ฐ ์ง์ ํ ์ธ๊ณผ ๊ด๊ณ์ด๊ณ ์ด๋ค ๊ฒ์ด ๋จ์ํ ์๊ด๊ด๊ณ์ ์ฐ๋ฌผ์ธ์ง๋ฅผ ์๋ณํ๋ค. ์๋ฅผ ๋ค์ด, "์งํฉ๋ก ์ ํ๋ฅ ๋ณด๋ค ๋จผ์ ๊ณต๋ถํ ํ์๋ค์ด ๋ ๋์ ์ ์๋ฅผ ๋ฐ๋๋ค"๋ ๊ด์ฐฐ์ ์ธ๊ณผ์ ์ ์ ๊ด๊ณ๋ฅผ ๋ฐ์ํ ์๋ ์๊ณ , ์ ํ ํจ๊ณผ(์ฐ์ํ ํ์๋ค์ด ๋จผ์ ์งํฉ๋ก ์ ์ ํํ๋ ๊ฒฝํฅ)๋ฅผ ๋ฐ์ํ ์๋ ์๋ค. ์ธ๊ณผ ๋ฐ๊ฒฌ์ ์ด ๋ ๊ฐ์ง๋ฅผ ๋ถ๋ฆฌํด๋ธ๋ค.
4๋จ๊ณ: ๋ฐ์ฌ์ค์ ๊ฒฝ๋ก ์ต์ ํ(Counterfactual Pathway Optimization). ์ธ๊ณผ ๊ทธ๋ํ๊ฐ ์ฃผ์ด์ง๋ฉด, ์์คํ
์ ๋ฐ์ฌ์ค์ ์ง๋ฌธ์ ๋ตํ ์ ์๋ค. "์ด ํ์์ด ๊ฐ๋
B ์ด์ ์ ๊ฐ๋
A๋ฅผ ๊ณต๋ถํ๋๋ผ๋ฉด, ๊ฐ๋
C์ ๋ํ ๊ฒฐ๊ณผ๊ฐ ๋ฌ๋ผ์ก์๊น?" ์ด๋ฌํ ๋ฐ์ฌ์ค์ ์ถ์ ์ ๋จ์ํ ์ข์ ๊ฒฐ๊ณผ์ ์๊ด๊ด๊ณ๊ฐ ์๋ ๊ฒ์ด ์๋๋ผ ์ธ๊ณผ์ ์ผ๋ก ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์ฐ์ถํ๋ ํ์ต ๊ฒฝ๋ก์ ์ต์ ํ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
๊ฐ๊ฑด์ฑ ๋ฌธ์
Huang๊ณผ Vidal(2026)์ ์ด ํ์ดํ๋ผ์ธ์ ์ค์ํ ํ๊ณ๋ฅผ ๋ค๋ฃฌ๋ค. ํ์ค ์ธ๊ณ์ ์ง์ ๊ทธ๋ํ๋ ๋ถ์์ ํ๊ณ ์ก์์ด ๋ง์ผ๋ฉฐ, ๊ฐ๋ฐฉ ์ธ๊ณ ๊ฐ์ (Open World Assumption)โ๊ฐ์ ์ ๋ถ์ฌ๊ฐ ๊ด๊ณ์ ๋ถ์ฌ๋ฅผ ์๋ฏธํ์ง ์๋๋ค๋ ๊ฐ์ โ์ ์ํฅ์ ๋ฐ๋๋ค. ์ด๋ค์ "๊ฒฐํฉ ๊ทธ๋ํ ํ์ต(Joint Graph Learning)" ํ๋ ์์ํฌ๋ ๋๋ฝ๋ ๊ทธ๋ํ ๊ตฌ์กฐ๋ฅผ ์ถ๋ก ํ๋ ๋์์ ์ธ๊ณผ ํจ๊ณผ๋ฅผ ์ถ์ ํ๋ฉฐ, ๊ฒฐ์ธก ๋ฐ์ดํฐ์ ๊ฐ์ญ ํจ๊ณผโํ ํ์์ ํ์ต ๊ถค์ ์ด ๋๋ฃ ์ํธ์์ฉ์ ํตํด ๋ค๋ฅธ ํ์์๊ฒ ์ํฅ์ ๋ฏธ์น๋ ํ์โ๋ฅผ ๋ชจ๋ ์ฒ๋ฆฌํ๋ค.
๊ธฐ์ ์ ๊ธฐ์ฌ๋ ์๋นํ๋คโ์ด๋ค์ ์ง์ ๊ทธ๋ํ์์ ์๋นํ ๋น์จ์ ๊ฐ์ ์ด ๋๋ฝ๋ ๊ฒฝ์ฐ์๋ ๊ฐ๊ฑด์ฑ์ ์
์ฆํ๋คโ๊ทธ๋ฌ๋ ๊ต์ก์ ํจ์๋ ๋์ฑ ์ค์ํ๋ค. ์ด๋ ์ธ๊ณผ์ ๊ต์ก ์ง์ ๊ทธ๋ํ๊ฐ ์ ์ฉํ๊ฒ ๊ธฐ๋ฅํ๊ธฐ ์ํด ์๋ฒฝํ ๊ต์ก๊ณผ์ ๋ชจ๋ธ์ ํ์๋ก ํ์ง ์์์ ์๋ฏธํ๋ค. ๋๋ถ๋ถ์ ์ค์ ๊ต์ก ํ๊ฒฝ, ํนํ ์์ธํ ๊ต์ก๊ณผ์ ์ง๋๊ฐ ์กด์ฌํ์ง ์๋ ์์ ๋ถ์กฑ ๋งฅ๋ฝ์์ ๋ํ๋๋ ๋ถ์์ ํ๊ณ ๋ถ๋ถ์ ์ผ๋ก๋ง ๋ช
์ธ๋ ๊ต์ก๊ณผ์ ์ค๋ช
์ผ๋ก๋ ์๋ํ ์ ์๋ค.
์ฃผ์ฅ๊ณผ ๊ทผ๊ฑฐ
<
| ์ฃผ์ฅ | ๊ทผ๊ฑฐ | ํ์ |
|---|
| ์ง์ ๊ทธ๋ํ์ ์ธ๊ณผ ์ถ๋ก ์ ๊ฒฐํฉ์ด ์๊ด๊ด๊ณ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ณด๋ค ํ์ต ๊ฒฝ๋ก ์ถ์ฒ์ ๊ฐ์ ํ๋ค | Sun(2025): ์๊ด๊ด๊ณ ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ ๋๋น ์์ธก๋ ฅ ํฅ์; ๋จ์ผ ์ฐ๊ตฌ | โ ๏ธ ๋ถํ์ค(์ ๋งํ๋ ๋ฏธ๋ณต์ ) |
| ์ธ๊ณผ ๋ฐ๊ฒฌ์ด ๊ด์ฐฐ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ง์ ํ ์ ์ ๊ด๊ณ๋ฅผ ์๋ณํ ์ ์๋ค | Jin & Cui(2024): SAIERec ์์คํ
์ด ๋ฐ์ฌ์ค์ ์ธ๊ณผ ์ถ๋ก ์ ์ฌ์ฉํ์ฌ ๋ค์ค ๋ฐ์ดํฐ์
์์ ๊ธฐ์กด ์ถ์ฒ ๋ชจ๋ธ์ ๋ฅ๊ฐ | โ
์ง์ง๋จ |
| ๋ฐ์ฌ์ค์ ๊ฒฝ๋ก ์ต์ ํ๊ฐ ํ์ ์ง๋จ ์ ๋ฐ์ ๊ฑธ์ณ ์ผ๋ฐํ๋๋ค | ๊ต์ฐจ ์ง๋จ ๊ฒ์ฆ ์ฐ๊ตฌ ์์ | โ ๏ธ ๋ถํ์ค |
| ๋ถ์์ ํ ์ง์ ๊ทธ๋ํ๊ฐ ๊ฐ๊ฑดํ ์ธ๊ณผ ์ถ๋ก ์ ์ง์ํ ์ ์๋ค | Huang & Vidal(2026): ๋ถ์์ ํ๊ณ ๊ด๊ณ์ ์ผ๋ก ๋ณต์กํ KG์์ ๊ฐ๊ฑดํ ์ฑ๋ฅ | โ
์ง์ง๋จ |
| ์ธ๊ณผ์ ๊ต์ก AI๊ฐ ์๊ด๊ด๊ณ ๊ธฐ๋ฐ ์์คํ
๋๋น ๊ณต์ ์ฑ ์ฐ๋ ค๋ฅผ ๊ฐ์์ํจ๋ค | ์ด๋ก ์ ๋
ผ๊ฑฐ(์ธ๊ณผ ๋ฉ์ปค๋์ฆ์ ์๊ด๊ด๊ณ๋ณด๋ค ๋ณดํธ์ ์ด๋ค); ๊ฒฝํ์ ๊ฒ์ฆ ์์ | โ ๏ธ ๋ถํ์ค |
๊ณต์ ์ฑ๊ณผ์ ์ฐ๊ฒฐ
์ธ๊ณผ ์ถ๋ก ๊ณผ ๊ต์ก์ ๊ณต์ ์ฑ์ ๊ต์ฐจ์ ์ ํน๋ณํ ์ฃผ์๋ฅผ ๊ธฐ์ธ์ผ ํ์๊ฐ ์๋ค. Chinta, Wang, Yin(2024)์ด ๊ด๋ฒ์ํ๊ฒ ๊ธฐ์ ํ๋ฏ, ์๊ด๊ด๊ณ ๊ธฐ๋ฐ ๊ต์ก AI ์์คํ
์ ์ญ์ฌ์ ํธํฅ์ ๋ด์ฌํํ๊ณ ์ฆํญ์ํจ๋ค. ๋ถ์ด์ต์ ๋ฐ๋ ๋ฐฐ๊ฒฝ์ ํ์๋ค์ด ์ญ์ฌ์ ์ผ๋ก ๋ฎ์ ์์ค์ ๊ณผ์ ์ ๋ฐฐ์น๋์ด ์๋ค๋ฉด, ์๊ด๊ด๊ณ ๊ธฐ๋ฐ ์์คํ
์ ์ ์ฌํ ํ์๋ค์๊ฒ ๋ฎ์ ์์ค์ ์ฝํ
์ธ ๋ฅผ ์ถ์ฒํ๋๋ก ํ์ตํ์ฌ ๊ทธ ์ํ์ ์์์ํจ๋ค.
์ธ๊ณผ ์ถ๋ก ์ ์ด ํจ์ ์์ ๋ฒ์ด๋ ์ ์๋ ์ ์ฌ์ ์ถ๊ตฌ๋ฅผ ์ ๊ณตํ๋ค. ์ธ๊ณผ ๋ชจ๋ธ์ ํ์ต ๊ฒฝ๋ก๊ฐ ๊ฒฐ๊ณผ์ ๋ฏธ์น๋ ํจ๊ณผ์ ๋ฐฐ๊ฒฝ ํน์ฑ์ด ์ ํ๋ ๊ฒฝ๋ก์ ๊ฒฐ๊ณผ ๋ชจ๋์ ๋ฏธ์น๋ ํจ๊ณผ๋ฅผ ๊ตฌ๋ณํ ์ ์๋ค. ๋ฐฐ๊ฒฝ์ ํต์ ํ๋ฉด์ ๊ฒฝ๋ก์ ๊ฐ์
(do-์ฐ์ฐ์)ํจ์ผ๋ก์จ, ์ธ๊ณผ ๋ชจ๋ธ์ "์ ์ฌํ ํ์๋ค์ด ์ญ์ฌ์ ์ผ๋ก ๊ฑธ์ด์จ ๊ฒฝ๋ก๋ฅผ ์ถ์ฒํ๋ค"๋ ๊ฒ๊ณผ๋ ๊ทผ๋ณธ์ ์ผ๋ก ๋ค๋ฅธ ์ต์ ํ ๋ชฉํ์ธ, ์ธ๊ตฌํต๊ณํ์ ๋ฒ์ฃผ์ ๊ด๊ณ์์ด ๊ฐ ํ์์๊ฒ ์ต์ ์ธ ํ์ต ์์๋ฅผ ์๋ณํ ์ ์๋ค.
์ด๋ ์ด๋ก ์ ์ผ๋ก ์ค๋๋ ฅ์ด ์๋ค. ๊ทธ๋ฌ๋ ํ์ค์ ์ฅ๋ฒฝ์ ๋ง๋ง์น ์๋ค. ์ธ๊ณผ ์ถ๋ก ์ ๊ต์ก ํ๊ฒฝ์์ ๊ฒ์ฆํ๊ธฐ ์ด๋ ค์ด ๊ฐ์ ๋คโ์ธก์ ๋์ง ์์ ๊ต๋ ๋ณ์ ์์(no unmeasured confounding), ์์ฑ์ฑ(positivity), ์ผ๊ด์ฑ(consistency)โ์ ํ์๋ก ํ๋ค. ๋๋ถ์ด ์ธ๊ณผ ๋ชจ๋ธ์์ "์ธ๊ตฌํต๊ณํ์ ๋ฒ์ฃผ"๋ผ๋ ๊ฐ๋
์์ฒด๋ ๋
ผ์์ ์ฌ์ง๊ฐ ์๋ค. ์ธ์ข
, ์ฑ๋ณ, ์ฌํ๊ฒฝ์ ์ ์ง์๋ ๋ฌด์์๋ก ๋ฐฐ์ ๋ ์ ์๋ ๊ฐ์
์ด ์๋๋ฏ๋ก, "์ฌ์ฑ์์ ํ์ต ๊ฒฐ๊ณผ์ ๋ํ ์ธ๊ณผ ํจ๊ณผ"๊ฐ ๋ฌด์์ ์๋ฏธํ๋์ง์ ๋ํ ์ฌ์ธต์ ์ธ ๋ฌผ์์ด ์ ๊ธฐ๋๋ค.
๋ฏธํด๊ฒฐ ๊ณผ์
์ธ๊ณผ์ ๊ต์ก ์ง์ ๊ทธ๋ํ๋ STEM์ ๋์ด ํ์ฅ๋ ์ ์๋๊ฐ? ํ์ฌ์ ๊ตฌํ์ ์ ์ ๊ตฌ์กฐ๊ฐ ๋น๊ต์ ๋ช
ํํ ์ํ๊ณผ ์ปดํจํฐ ๊ณผํ์ ์ง์ค๋์ด ์๋ค. ์ธ๋ฌธํ, ์ฌํ๊ณผํ, ์์ ์ ๋ณด๋ค ์ ๋์ ์ด๊ณ ๋ ์๊ณ์ ์ธ ์ง์ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๋ค. ์ธ๊ณผ ๋ฐ๊ฒฌ(causal discovery)์ ์ด๋ฌํ ๋ชจํธ์ฑ์ ๋ค๋ฃฐ ์ ์๋๊ฐ?RCT ์์ด ์ธ๊ณผ์ ์ฃผ์ฅ์ ์ด๋ป๊ฒ ๊ฒ์ฆํ๋๊ฐ? ๋ฏผ๊ฐ๋ ๋ถ์(sensitivity analysis)๊ณผ ์์ฐ ์คํ(natural experiment)์ด ๋ถ๋ถ์ ์ธ ๋ต์ ์ ๊ณตํ์ง๋ง, ๊ด์ฐฐ์ ์ธ๊ณผ ์ถ๋ก ์ด ๊ต์ก ์ค์ฒ์ ์๋ดํ๊ธฐ์ "์ถฉ๋ถํ ๊ฐ๋ ฅํ" ์์ ์ ๋ํ ํฉ์๋ ๊ธฐ์ค์ด ์ด ๋ถ์ผ์ ํ์ํ๋ค.ํ์ ์ฃผ์ฒด์ฑ์ ์ญํ ์ ๋ฌด์์ธ๊ฐ? ํ์ฌ ์์คํ
์ ํ์๋ค์ ์ํด ํ์ต ๊ฒฝ๋ก๋ฅผ ์ต์ ํํ๋ค. ์ธ๊ณผ ์ง์ ๊ทธ๋ํ๋ฅผ ํ์๋ค์ด ์์ ์ ํ์ต์ ๋ํ ์ธ๊ณผ ๊ตฌ์กฐ๋ฅผ ์ดํดํ๋๋ก ๋๋ ๋ฐ ํ์ฉํจ์ผ๋ก์จ, ๊ต์ก ๊ถค์ ์ ๊ดํ ์ ๋ณด์ ์
๊ฐํ ์ ํ์ ๋ด๋ฆด ์ ์๋๋ก ์ญ๋์ ๊ฐํํ ์๋ ์๋๊ฐ?๋๋ฃ ํจ๊ณผ๋ ๊ฐ์ธ ๊ฒฝ๋ก์ ์ด๋ป๊ฒ ์ํธ์์ฉํ๋๊ฐ? ๊ต์ก์ ๊ทผ๋ณธ์ ์ผ๋ก ์ฌํ์ ์ด๋ค. ๊ณ ๋ฆฝ๋ ๊ฐ์ธ์๊ฒ ์ธ๊ณผ์ ์ผ๋ก ์ต์ ์ธ ํ์ต ๊ฒฝ๋ก๊ฐ, ๋๋ฃ ์ค๋ช
, ํ๋ ฅ์ ๋ฌธ์ ํด๊ฒฐ, ์ฌํ์ ๋๊ธฐ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ํ์ฑํ๋ ๊ต์ค์์๋ ์ฐจ์ ์ฑ
์ด ๋ ์ ์๋ค. ์ธ๊ณผ์ ๊ต์ก ๋ชจ๋ธ์ ๊ฐ์ญ ํจ๊ณผ(interference effect)๋ฅผ ํตํฉํ๋ ๊ฒ์ ์ฌ์ ํ ๋ฏธํด๊ฒฐ๋ ๊ธฐ์ ์ ๊ณผ์ ๋ก ๋จ์ ์๋ค.์๊ธฐ ๊ฐฑ์ (self-updating) ์ธ๊ณผ ์ง์ ๊ทธ๋ํ๋ฅผ ๊ตฌ์ถํ ์ ์๋๊ฐ? ํ์๋ค์ด ํ์ตํ๊ณ , ๊ต์ก๊ณผ์ ์ด ๋ฐ์ ํ๋ฉฐ, ๊ต์๋ฒ ์ฐ๊ตฌ๊ฐ ์ง์ ๋จ์ ๋ฐ๋ผ ์ง์ ๊ทธ๋ํ๋ ์ ์ํด์ผ ํ๋ค. ์ธ๊ณผ ๋ฐ๊ฒฌ ์๊ณ ๋ฆฌ์ฆ์ ์คํธ๋ฆฌ๋ฐ ๋ฐฉ์์ ์จ๋ผ์ธ ๋ชจ๋๋ก ์๋ํ๋ฉด์ ๊ต์ก ์ธ๊ณผ ๊ตฌ์กฐ์ ๋ํ ์ดํด๋ฅผ ์ง์์ ์ผ๋ก ์ ๊ตํํ ์ ์๋๊ฐ?์์ฌ์
์ง์ ๊ทธ๋ํ์ ์ธ๊ณผ ์ถ๋ก ์ ํตํฉ์ ๊ต์ก AI์์ ํ๋์ ํจ๋ฌ๋ค์ ์ ํ์ ๋ํ๋ธ๋คโํ์ ๋ฐ์ดํฐ์ ํจํด์ ํ์ตํ๋ ์์คํ
์์ ํ์ ํ์ต์ ๋ฉ์ปค๋์ฆ์ ํ์ตํ๋ ์์คํ
์ผ๋ก์ ์ ํ. ์ด ์ ํ์ ๊ธฐ์ ์ ์ฑ๋ฅ์ ๋์ด์๋ ํจ์๋ฅผ ์ง๋๋ค.
๊ต์ก๊ณผ์ ์ค๊ณ์์๊ฒ: ์ธ๊ณผ ์ง์ ๊ทธ๋ํ๋ ๊ต์ก๊ณผ์ ๊ตฌ์กฐ๋ฅผ ํ๊ฐํ๊ธฐ ์ํ ์ค์ฆ์ ๋๊ตฌ๋ฅผ ์ ๊ณตํ๋ค. ์ธ๊ณผ ๋ถ์์ ํตํด ๋๋ฆฌ ๊ฐ์ ๋์ด ์จ ์ ์ ๊ด๊ณ๊ฐ ์ค์ ๋ก๋ ์๊ด๊ด๊ณ์ ๋ถ๊ณผํจ์ด ๋๋ฌ๋๋ค๋ฉด, ๋ถํ์ํ ๋ณ๋ชฉ์ ์ ๊ฑฐํ๊ธฐ ์ํด ๊ต์ก๊ณผ์ ์ ์ฌ๊ตฌ์ฑํ ์ ์๋ค.
๊ต์ก ์ฐ๊ตฌ์์๊ฒ: ์ง์ ๊ทธ๋ํ์ ๋ํ ์ธ๊ณผ ์ถ๋ก ์ RCT์ ์๋ฐ์ฑ๊ณผ ๊ด์ฐฐ ์ฐ๊ตฌ์ ํ์ฅ์ฑ ์ฌ์ด์ ์ค๊ฐ ๊ฒฝ๋ก๋ฅผ ์ ๊ณตํ๋ค. ์ด๋ ์คํ ์ฐ๊ตฌ๋ฅผ ๋์ฒดํ์ง๋ ์๊ฒ ์ง๋ง, ์ด๋ค ์คํ์ด ์ํํ ๊ฐ์น๊ฐ ์๋์ง๋ฅผ ์ฐ์ ์์ํํ๋ ์ธ๊ณผ ๊ฐ์ค์ ์์ฑํ ์ ์๋ค.
ํ์์๊ฒ: ํนํ ์ ๋งํ ๊ฐ๋ฅ์ฑ์ ์ธ๊ณผ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ํํ๋ ๊ฒ์ด๋ค. "๋ค์์ ๋ฌด์์ ๊ณต๋ถํด์ผ ํ๋์ง"๋ฟ๋ง ์๋๋ผ ์โ์ฆ ์ด ๊ฐ๋
์ ์๋ฌํจ์ผ๋ก์จ ๋ฏธ๋ ํ์ต์ด ๊ฐ๋ฅํด์ง๋ ์ธ๊ณผ ๊ฒฝ๋กโ๋ฅผ ๋ณผ ์ ์๋ ํ์์ ์์ํด๋ณด๋ผ. ์ด๋ฌํ ๋ฉํ์ธ์ง์ ํฌ๋ช
์ฑ์ ์ถ์ฒ ์ฝํ
์ธ ์ ์๋์ ์๋น์๋ฅผ ์์ ์ ์ง์ ๋ฐ๋ฌ์ ๋ฅ๋์ ํญํด์๋ก ๋ณํ์ํฌ ์ ์๋ค.
์ด ๋ถ์ผ๋ ์์ง ์ด๊ธฐ ๋จ๊ณ์ด๋ค. ๊ทผ๊ฑฐ ๊ธฐ๋ฐ์ ๋น์ฝํ๋ค. ๊ทธ๋ฌ๋ ๊ต์ก AI์์ ์๊ด๊ด๊ณ์์ ์ธ๊ณผ๊ด๊ณ๋ก์ ๊ฐ๋
์ ์ง์ ์ ๊ฐ๋ฅํ ๊ฒ์ ๋ณํ์ํค๋ ๋ฐ๋ก ๊ทธ๋ฌํ ์ข
๋ฅ์ ํจ๋ฌ๋ค์ ์ ํ์ด๋ค.
References (4)
[1] Sun, L. (2025). Integrating Knowledge Graphs and Causal Inference for AI-Driven Personalized Learning in Education. AI Education Science & Engineering, 1(1).
[2] Jin, S. & Cui, L. (2024). A Context-Aware Intelligent Educational Recommender System Incorporating User Behavioural Knowledge Graph and Causal Inference. Proc. IEEE ICCVIT 2024.
[3] Huang, H. & Vidal, M.-E. (2026). Joint Graph Learning for Robust Causal Inference over Knowledge Graphs. Proc. ACM Web Conference 2026.
[4] Chinta, S.V., Wang, Z., Yin, Z., Hoang, N., Gonzalez, M., Le Quy, T., & Zhang, W. (2024). FairAIED: Navigating Fairness, Bias, and Ethics in Educational AI Applications. arXiv:2407.18745.