Trend AnalysisCommunication & MediaSystematic Review
Data Journalism and Computational Reporting: When Algorithms Write the Story
Data journalism has evolved from a specialized niche into a core newsroom capability, while generative AI threatens to automate the reporter out of the loop entirely. Four papers trace this transformation, revealing that the epistemological assumptions embedded in code and algorithms are as consequential as the stories they produce.
By Sean K.S. Shin
This blog summarizes research trends based on published paper abstracts. Specific numbers or findings may contain inaccuracies. For scholarly rigor, always consult the original papers cited in each post.
Data journalismโthe collection, analysis, and presentation of quantitative datasets as newsโhas evolved from an exotic specialization practiced by a handful of innovative newsrooms into a core journalistic capability. The Panama Papers, COVID-19 dashboards, election forecast models, and climate change visualizations have demonstrated that data-driven reporting can produce stories of enormous public significance that traditional reporting methods cannot access.
But the field is now confronting a more fundamental transformation: the automation of journalism itself. Generative AI systems can write news articles, create data visualizations, and even conduct preliminary data analysis. This raises a question that goes beyond efficiency: when algorithms participate in producing journalism, who is the gatekeeper? And what epistemological assumptions are embedded in the code that shapes the story?
Reconceptualizing Gatekeeping
Voinea (2025) provides the most cited and theoretically ambitious contribution. While the paper's primary focus is AI-driven news curation and automated journalism broadly, its theoretical framework bears directly on how data journalism fits into a transformed gatekeeping ecology. The paper develops a framework to reconceptualize gatekeepingโthe classic media theory concept describing how editors and journalists select what becomes newsโin the age of AI-driven news systems.
The traditional gatekeeping model assumed human editorial judgment at every decision point: which stories to pursue, what sources to consult, how to frame the narrative, and when to publish. AI disrupts each of these stages. Algorithmic curation determines what stories reach audiences. Automated systems can generate routine news reports (earnings announcements, sports scores, weather updates) without human involvement. LLMs can draft more complex narratives from structured data.
Voinea integrates classic media theoriesโgatekeeping, agenda-setting, framingโwith computational frameworks to argue that AI creates a new form of "algorithmic gatekeeping" in which editorial decisions are encoded in software rather than exercised by human judgment. The significance is that algorithmic gates are simultaneously more consistent (they apply the same criteria to every item) and less accountable (their criteria are opaque and often proprietary).
Data-Driven Reporting: A Systematic Review
Mintoo (2024) provides a PRISMA-guided systematic review of 65 papers on data-driven journalism, synthesizing findings on how data analytics and visualization have reshaped the news landscape. The review identifies three primary contributions of data journalism: enhanced accuracy (quantitative evidence reduces reliance on anecdotal reporting), deeper storytelling (data visualization enables audiences to explore complex patterns), and increased audience engagement (interactive data presentations outperform static text on engagement metrics).
The review also identifies persistent challenges: data literacy among journalists remains uneven, the infrastructure for data journalism requires investment that many newsrooms cannot afford, and the pressure to publish quickly conflicts with the time required for rigorous data analysis. Perhaps most critically, the review finds that data journalism can create an illusion of objectivityโnumbers appear neutral even when the choices about what to count, how to categorize, and what to display are deeply editorial.
The Epistemology of Code
Abhishek and Graves (2024) take a critical code studies approach to examine what programming code reveals about the epistemological assumptions of data journalism. While code underlies much of data journalism, few studies focus on it directly. The authors argue that examining the codeโthe actual scripts, data processing pipelines, and visualization algorithmsโreveals editorial decisions that are invisible in the published output.
The analysis reveals that coding choices function as epistemic choices: how missing data is handled (deleted, imputed, flagged), how categories are defined (which incidents count as "gun violence"), how outliers are treated (included or excluded), and how uncertainty is represented (or not represented). These choices, embedded in code, determine what the data "says" as surely as editorial decisions determine what a traditional story says. But unlike traditional editorial decisions, coding choices are typically not transparent to audiences and often not articulated even within newsrooms.
Public Understanding and Data Journalism
Peng (2025) examines the downstream effect: does data journalism actually enhance public understanding of complex issues? The study surveys 400 respondents (including news consumers and journalists) to assess audience preferences, trust, and organizational challenges.
The findings are mixed. Audiences report higher trust in data-supported reporting and greater comprehension of complex topics when presented with data visualizations compared to text-only reporting. However, the study also finds that audience data literacy significantly moderates these effects: viewers with low data literacy may misinterpret visualizations, draw incorrect conclusions from correct data, or place unwarranted confidence in data presentations they do not fully understand.
Data Journalism Capability Spectrum
<
| Capability Level | Human Role | AI Role | Example | Current Prevalence |
|---|
| Traditional data journalism | Full: collection, analysis, narrative | None | Investigative team + spreadsheets | Declining |
| Augmented data journalism | Direction, interpretation, narrative | Data processing, pattern detection | AI finds anomalies; journalist investigates | Growing |
| Semi-automated reporting | Oversight, editing, framing | Draft generation from structured data | AI writes earnings report; editor reviews | Common (routine news) |
| Fully automated reporting | Minimal (system design) | End-to-end from data to publication | Automated sports scores, weather | Established (narrow domains) |
| AI-driven investigation | Selection, accountability | Pattern discovery, cross-referencing | LLM analyzes leaked documents | Experimental |
What To Watch
The integration of large language models into data journalism workflows is the most consequential current development. LLMs can translate between natural language and code (enabling journalists without programming skills to analyze data), generate narrative explanations of statistical findings, and even identify newsworthy patterns in large datasets. But LLMs also hallucinate, generate plausible-but-false statistics, and lack the adversarial skepticism that defines good journalism. The newsrooms that navigate this transition successfully will be those that treat AI as a tool that augments human editorial judgment rather than replaces itโand that develop new forms of transparency about where human judgment ends and algorithmic processing begins.
๋ฉด์ฑ
์กฐํญ: ์ด ๊ฒ์๋ฌผ์ ์ ๋ณด ์ ๊ณต์ ๋ชฉ์ ์ผ๋ก ํ ์ฐ๊ตฌ ๋ํฅ ๊ฐ์์ด๋ค. ํ์ ๋
ผ๋ฌธ์ ์ธ์ฉํ๊ธฐ ์ ์ ๊ตฌ์ฒด์ ์ธ ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ํต๊ณ ๋ฐ ์ฃผ์ฅ์ ์๋ณธ ๋
ผ๋ฌธ์ ํตํด ๋ฐ๋์ ๊ฒ์ฆํด์ผ ํ๋ค.
๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ๊ณผ ์ปดํจํฐ ๊ธฐ๋ฐ ๋ณด๋: ์๊ณ ๋ฆฌ์ฆ์ด ์ด์ผ๊ธฐ๋ฅผ ์ธ ๋
๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆโ์ ๋์ ๋ฐ์ดํฐ์
์ ๋ด์ค๋ก ์์งยท๋ถ์ยท์ ์ํ๋ ํ๋โ์ ์์์ ํ์ ์ ์ธ ๋ด์ค๋ฃธ์์๋ง ํํด์ง๋ ์ด์์ ์ธ ์ ๋ฌธ ๋ถ์ผ์์ ํต์ฌ์ ์ธ ์ ๋๋ฆฌ์ฆ ์ญ๋์ผ๋ก ์งํํด ์๋ค. ํ๋๋ง ํ์ดํผ์ค(Panama Papers), COVID-19 ๋์๋ณด๋, ์ ๊ฑฐ ์์ธก ๋ชจ๋ธ, ๊ธฐํ๋ณํ ์๊ฐํ ์๋ฃ ๋ฑ์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋ณด๋๊ฐ ์ ํต์ ์ธ ์ทจ์ฌ ๋ฐฉ์์ผ๋ก๋ ์ ๊ทผํ ์ ์๋, ์์ฒญ๋ ๊ณต์ ์๋ฏธ๋ฅผ ์ง๋ ๊ธฐ์ฌ๋ฅผ ์์ฐํ ์ ์์์ ์
์ฆํ๋ค.
๊ทธ๋ฌ๋ ์ด ๋ถ์ผ๋ ์ด์ ๋ณด๋ค ๊ทผ๋ณธ์ ์ธ ๋ณํ์ ์ง๋ฉดํด ์๋ค. ๋ฐ๋ก ์ ๋๋ฆฌ์ฆ ์์ฒด์ ์๋ํ์ด๋ค. ์์ฑํ AI ์์คํ
์ ๋ด์ค ๊ธฐ์ฌ๋ฅผ ์์ฑํ๊ณ , ๋ฐ์ดํฐ ์๊ฐํ๋ฅผ ๋ง๋ค๋ฉฐ, ์๋น์ ์ธ ๋ฐ์ดํฐ ๋ถ์๊น์ง ์ํํ ์ ์๋ค. ์ด๋ ํจ์จ์ฑ์ ๋์ด์๋ ์ง๋ฌธ์ ์ ๊ธฐํ๋ค. ์๊ณ ๋ฆฌ์ฆ์ด ์ ๋๋ฆฌ์ฆ ์์ฐ์ ์ฐธ์ฌํ ๋, ๋๊ฐ ๊ฒ์ดํธํคํผ(gatekeeper)์ธ๊ฐ? ๊ทธ๋ฆฌ๊ณ ์ด์ผ๊ธฐ๋ฅผ ํ์ฑํ๋ ์ฝ๋ ์์๋ ์ด๋ค ์ธ์๋ก ์ ๊ฐ์ ์ด ๋ด์ฌ๋์ด ์๋๊ฐ?
๊ฒ์ดํธํคํ์ ์ฌ๊ฐ๋
ํ
Voinea(2025)๋ ๊ฐ์ฅ ๋ง์ด ์ธ์ฉ๋๊ณ ์ด๋ก ์ ์ผ๋ก๋ ์ผ์ฌ์ฐฌ ์ฐ๊ตฌ๋ฅผ ์ ์ํ๋ค. ์ด ๋
ผ๋ฌธ์ ์ฃผ๋ ์ด์ ์ AI ๊ธฐ๋ฐ ๋ด์ค ํ๋ ์ด์
๊ณผ ์๋ํ ์ ๋๋ฆฌ์ฆ ์ ๋ฐ์ ์์ง๋ง, ๊ทธ ์ด๋ก ์ ํ๋ ์์ํฌ๋ ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ์ด ๋ณํ๋ ๊ฒ์ดํธํคํ ์ํ๊ณ ์์์ ์ด๋ป๊ฒ ์์นํ๋์ง์ ์ง์ ์ ์ผ๋ก ๊ด๋ จ๋๋ค. ์ด ๋
ผ๋ฌธ์ AI ๊ธฐ๋ฐ ๋ด์ค ์์คํ
์๋์ ๊ฒ์ดํธํคํโํธ์ง์์ ์ ๋๋ฆฌ์คํธ๊ฐ ๋ฌด์์ด ๋ด์ค๊ฐ ๋ ์ง๋ฅผ ์ ํํ๋ ๋ฐฉ์์ ์ค๋ช
ํ๋ ๊ณ ์ ์ ์ธ ๋ฏธ๋์ด ์ด๋ก ๊ฐ๋
โ์ ์ฌ๊ฐ๋
ํํ๊ธฐ ์ํ ํ๋ ์์ํฌ๋ฅผ ๊ฐ๋ฐํ๋ค.
์ ํต์ ์ธ ๊ฒ์ดํธํคํ ๋ชจ๋ธ์ ์ด๋ค ๊ธฐ์ฌ๋ฅผ ์ถ์งํ ์ง, ์ด๋ค ์์ํต์ ๋ฌธ์ํ ์ง, ์์ฌ๋ฅผ ์ด๋ป๊ฒ ๊ตฌ์ฑํ ์ง, ์ธ์ ์ถ๊ณ ํ ์ง ๋ฑ ๋ชจ๋ ์์ฌ๊ฒฐ์ ์ง์ ์์ ์ธ๊ฐ์ ํธ์ง ํ๋จ์ ์ ์ ํ๋ค. AI๋ ์ด ๊ฐ๊ฐ์ ๋จ๊ณ๋ฅผ ๊ต๋ํ๋ค. ์๊ณ ๋ฆฌ์ฆ์ ํ๋ ์ด์
์ด ์ด๋ค ๊ธฐ์ฌ๊ฐ ์์ฉ์์๊ฒ ๋๋ฌํ ์ง๋ฅผ ๊ฒฐ์ ํ๋ค. ์๋ํ ์์คํ
์ ์ธ๊ฐ์ ๊ฐ์
์์ด ์ ํ์ ์ธ ๋ด์ค ๋ณด๋(์ค์ ๋ฐํ, ์คํฌ์ธ ์ ์, ๋ ์จ ์
๋ฐ์ดํธ)๋ฅผ ์์ฑํ ์ ์๋ค. LLM์ ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ณด๋ค ๋ณต์กํ ์์ฌ๋ฅผ ์ด์์ผ๋ก ์์ฑํ ์ ์๋ค.
Voinea๋ ๊ฒ์ดํธํคํ, ์์ ์ค์ , ํ๋ ์ด๋ฐ ๋ฑ ๊ณ ์ ์ ์ธ ๋ฏธ๋์ด ์ด๋ก ์ ๊ณ์ฐ์ ํ๋ ์์ํฌ์ ํตํฉํ์ฌ, AI๊ฐ ํธ์ง ๊ฒฐ์ ์ด ์ธ๊ฐ์ ํ๋จ์ ์ํด ํ์ฌ๋๋ ๊ฒ์ด ์๋๋ผ ์ํํธ์จ์ด์ ์ฝ๋ํ๋๋ ์๋ก์ด ํํ์ "์๊ณ ๋ฆฌ์ฆ์ ๊ฒ์ดํธํคํ(algorithmic gatekeeping)"์ ๋ง๋ค์ด๋ธ๋ค๊ณ ์ฃผ์ฅํ๋ค. ์ด ์๋ฏธ๋, ์๊ณ ๋ฆฌ์ฆ์ ๊ฒ์ดํธ๋ ๋์์ ๋ ์ผ๊ด์ ์ด๋ฉด์๋(๋ชจ๋ ํญ๋ชฉ์ ๋์ผํ ๊ธฐ์ค์ ์ ์ฉํ๋ค) ๋ ์ฑ
์ ๊ฐ๋ฅํ๋ค(๊ทธ ๊ธฐ์ค์ด ๋ถํฌ๋ช
ํ๋ฉฐ ์ข
์ข
๋
์ ์ ์ด๋ค)๋ ๋ฐ ์๋ค.
๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋ณด๋: ์ฒด๊ณ์ ๋ฌธํ ๊ณ ์ฐฐ
Mintoo(2024)๋ ๋ฐ์ดํฐ ๋ถ์๊ณผ ์๊ฐํ๊ฐ ๋ด์ค ํ๊ฒฝ์ ์ด๋ป๊ฒ ์ฌํ์ฑํ๋์ง์ ๊ดํ 65ํธ์ ๋
ผ๋ฌธ์ ์ข
ํฉํ, ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ ๋๋ฆฌ์ฆ์ ๋ํ PRISMA ๊ธฐ๋ฐ ์ฒด๊ณ์ ๋ฌธํ ๊ณ ์ฐฐ์ ์ ์ํ๋ค. ์ด ๊ณ ์ฐฐ์ ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ์ ์ธ ๊ฐ์ง ์ฃผ์ ๊ธฐ์ฌ๋ฅผ ํ์ธํ๋ค. ์ ํ์ฑ ํฅ์(์ ๋์ ๊ทผ๊ฑฐ๋ ์ผํ์ ๋ณด๋์ ๋ํ ์์กด๋๋ฅผ ์ค์ธ๋ค), ์ฌ์ธต์ ์คํ ๋ฆฌํ
๋ง(๋ฐ์ดํฐ ์๊ฐํ๋ ์์ฉ์๊ฐ ๋ณต์กํ ํจํด์ ํ์ํ ์ ์๊ฒ ํ๋ค), ์์ฉ์ ์ฐธ์ฌ ์ฆ๋(์ธํฐ๋ํฐ๋ธ ๋ฐ์ดํฐ ํํ์ ์ฐธ์ฌ ์งํ์์ ์ ์ ์ธ ํ
์คํธ๋ณด๋ค ์ฐ์ํ ์ฑ๊ณผ๋ฅผ ๋ณด์ธ๋ค)๊ฐ ๊ทธ๊ฒ์ด๋ค.
๋ํ ์ด ๊ณ ์ฐฐ์ ์ง์์ ์ธ ๊ณผ์ ๋ค๋ ํ์ธํ๋ค. ์ ๋๋ฆฌ์คํธ๋ค์ ๋ฐ์ดํฐ ๋ฆฌํฐ๋ฌ์๋ ์ฌ์ ํ ๋ถ๊ท ๋ฑํ๊ณ , ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ์ ์ํ ์ธํ๋ผ๋ ๋ง์ ๋ด์ค๋ฃธ์ด ๊ฐ๋นํ๊ธฐ ์ด๋ ค์ด ํฌ์๋ฅผ ํ์๋ก ํ๋ฉฐ, ์ ์ํ ์ถ๊ณ ์๋ฐ์ ์๋ฐํ ๋ฐ์ดํฐ ๋ถ์์ ํ์ํ ์๊ฐ๊ณผ ์ถฉ๋ํ๋ค. ์๋ง๋ ๊ฐ์ฅ ์ค์ํ ์ ์, ์ด ๊ณ ์ฐฐ์ด ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ์ด ๊ฐ๊ด์ฑ์ ํ์์ ๋ง๋ค์ด๋ผ ์ ์๋ค๋ ์ ์ ๋ฐ๊ฒฌํ๋ค๋ ๊ฒ์ด๋ค. ์ฆ, ๋ฌด์์ ์ง๊ณํ๊ณ , ์ด๋ป๊ฒ ๋ถ๋ฅํ๋ฉฐ, ๋ฌด์์ ํ์ํ ์ง์ ๋ํ ์ ํ์ด ๊น์ด ํธ์ง์ ์์๋ ๋ถ๊ตฌํ๊ณ , ์ซ์๋ ์ค๋ฆฝ์ ์ผ๋ก ๋ณด์ธ๋ค.
์ฝ๋์ ์ธ์๋ก
๊ณต์ค ์ดํด์ ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ
Abhishek์ Graves(2024)๋ ๋นํ์ ์ฝ๋ ์ฐ๊ตฌ ์ ๊ทผ๋ฒ์ ํตํด ํ๋ก๊ทธ๋๋ฐ ์ฝ๋๊ฐ ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ์ ์ธ์๋ก ์ ๊ฐ์ ์ ๋ํด ๋ฌด์์ ๋๋ฌ๋ด๋์ง ๊ฒํ ํ๋ค. ์ฝ๋๋ ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ์ ์๋น ๋ถ๋ถ์ ๋ท๋ฐ์นจํ์ง๋ง, ์ด๋ฅผ ์ง์ ์ ์ผ๋ก ๋ค๋ฃจ๋ ์ฐ๊ตฌ๋ ๊ฑฐ์ ์๋ค. ์ ์๋ค์ ์ค์ ์คํฌ๋ฆฝํธ, ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ์ดํ๋ผ์ธ, ์๊ฐํ ์๊ณ ๋ฆฌ์ฆ ๋ฑ ์ฝ๋๋ฅผ ์ดํด๋ณด๋ฉด ์ต์ข
์ถํ๋ฌผ์์๋ ๋ณด์ด์ง ์๋ ํธ์ง ๊ฒฐ์ ๋ค์ด ๋๋ฌ๋๋ค๊ณ ์ฃผ์ฅํ๋ค.
๋ถ์ ๊ฒฐ๊ณผ, ์ฝ๋ฉ ์ ํ์ ์ธ์๋ก ์ ์ ํ์ผ๋ก ๊ธฐ๋ฅํ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค. ์ฆ, ๊ฒฐ์ธก ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ์ฒ๋ฆฌํ๋์ง(์ญ์ , ๋์ฒด, ํ์), ๋ฒ์ฃผ๋ฅผ ์ด๋ป๊ฒ ์ ์ํ๋์ง(์ด๋ค ์ฌ๊ฑด์ "์ด๊ธฐ ํญ๋ ฅ"์ผ๋ก ๋ณผ ๊ฒ์ธ์ง), ์ด์๊ฐ์ ์ด๋ป๊ฒ ๋ค๋ฃจ๋์ง(ํฌํจ ๋๋ ์ ์ธ), ๋ถํ์ค์ฑ์ ์ด๋ป๊ฒ ํํํ๋์ง(ํน์ ํํํ์ง ์๋์ง)๊ฐ ์ด์ ํด๋นํ๋ค. ์ฝ๋์ ๋ด์ฌ๋ ์ด๋ฌํ ์ ํ๋ค์, ์ ํต์ ์ธ ํธ์ง ๊ฒฐ์ ์ด ๊ธฐ์กด ๊ธฐ์ฌ์ ๋ด์ฉ์ ๊ฒฐ์ ํ๋ ๊ฒ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก, ๋ฐ์ดํฐ๊ฐ "๋งํ๋" ๋ฐ๋ฅผ ๊ฒฐ์ ํ๋ค. ๊ทธ๋ฌ๋ ์ ํต์ ์ธ ํธ์ง ๊ฒฐ์ ๊ณผ ๋ฌ๋ฆฌ, ์ฝ๋ฉ ์ ํ์ ๋์ฒด๋ก ๋
์์๊ฒ ํฌ๋ช
ํ๊ฒ ๊ณต๊ฐ๋์ง ์์ผ๋ฉฐ, ๋ด์ค๋ฃธ ๋ด๋ถ์์์กฐ์ฐจ ๋ช
ํํ ์ค๋ช
๋์ง ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค.
๊ณต์ค ์ดํด์ ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ
Peng(2025)์ ํ๋ฅ ํจ๊ณผ๋ฅผ ๊ฒํ ํ๋ค. ์ฆ, ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ์ด ์ค์ ๋ก ๋ณต์กํ ๋ฌธ์ ์ ๋ํ ๊ณต์ค์ ์ดํด๋ฅผ ํฅ์์ํค๋๊ฐ ํ๋ ๊ฒ์ด๋ค. ์ด ์ฐ๊ตฌ๋ ๋ด์ค ์๋น์์ ์ ๋๋ฆฌ์คํธ๋ฅผ ํฌํจํ 400๋ช
์ ์๋ต์๋ฅผ ๋์์ผ๋ก ์ค๋ฌธ์กฐ์ฌ๋ฅผ ์ค์ํ์ฌ ๋
์ ์ ํธ๋, ์ ๋ขฐ๋, ์กฐ์ง์ ๊ณผ์ ๋ฅผ ํ๊ฐํ๋ค.
์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ ๋ณตํฉ์ ์ด๋ค. ๋
์๋ค์ ํ
์คํธ๋ง ์ ๊ณต๋ ๋ณด๋์ ๋นํด ๋ฐ์ดํฐ ์๊ฐํ์ ํจ๊ป ์ ์๋ ๊ฒฝ์ฐ, ๋ฐ์ดํฐ๊ฐ ๋ท๋ฐ์นจ๋๋ ๋ณด๋์ ๋ ๋์ ์ ๋ขฐ๋ฅผ ๋ณด์ด๊ณ ๋ณต์กํ ์ฃผ์ ์ ๋ํ ์ดํด๋๋ ๋ ๋๋ค๊ณ ์๋ตํ์๋ค. ๊ทธ๋ฌ๋ ์ด ์ฐ๊ตฌ๋ ๋
์์ ๋ฐ์ดํฐ ๋ฆฌํฐ๋ฌ์๊ฐ ์ด๋ฌํ ํจ๊ณผ๋ฅผ ์๋น ๋ถ๋ถ ์กฐ์ ํ๋ค๋ ์ ๋ ๋ฐ๊ฒฌํ์๋ค. ๋ฐ์ดํฐ ๋ฆฌํฐ๋ฌ์๊ฐ ๋ฎ์ ๋
์๋ ์๊ฐํ๋ฅผ ์๋ชป ํด์ํ๊ฑฐ๋, ์ ํํ ๋ฐ์ดํฐ๋ก๋ถํฐ ์๋ชป๋ ๊ฒฐ๋ก ์ ๋์ถํ๊ฑฐ๋, ์ถฉ๋ถํ ์ดํดํ์ง ๋ชปํ ๋ฐ์ดํฐ ์ ์์ ๊ทผ๊ฑฐ ์๋ ํ์ ์ ๊ฐ์ง ์ ์๋ค.
๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ ์ญ๋ ์คํํธ๋ผ
<
| ์ญ๋ ์์ค | ์ธ๊ฐ์ ์ญํ | AI์ ์ญํ | ์ฌ๋ก | ํ์ฌ ๋ณด๊ธ ์์ค |
|---|
| ์ ํต์ ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ | ์ ๋ด: ์์ง, ๋ถ์, ์์ | ์์ | ์ทจ์ฌํ + ์คํ๋ ๋์ํธ | ๊ฐ์ ์ค |
| ์ฆ๊ฐ ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ | ๋ฐฉํฅ ์ค์ , ํด์, ์์ | ๋ฐ์ดํฐ ์ฒ๋ฆฌ, ํจํด ํ์ง | AI๊ฐ ์ด์๊ฐ ๋ฐ๊ฒฌ, ์ ๋๋ฆฌ์คํธ๊ฐ ์ทจ์ฌ | ์ฑ์ฅ ์ค |
| ๋ฐ์๋ํ ๋ณด๋ | ๊ฐ๋
, ํธ์ง, ํ๋ ์ด๋ฐ | ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ด์ ์์ฑ | AI๊ฐ ์ค์ ๋ณด๊ณ ์ ์์ฑ, ํธ์ง์๊ฐ ๊ฒํ | ์ผ๋ฐ์ (์ ํ ๋ด์ค) |
| ์์ ์๋ํ ๋ณด๋ | ์ต์ํ(์์คํ
์ค๊ณ) | ๋ฐ์ดํฐ์์ ์ถํ๊น์ง ์ ๊ณผ์ | ์๋ํ๋ ์คํฌ์ธ ์ ์, ๋ ์จ | ์ ์ฐฉ๋จ(ํ์ํ ์์ญ) |
| AI ์ฃผ๋ ํ์ฌ ๋ณด๋ | ์ ํ, ์ฑ
์ | ํจํด ๋ฐ๊ฒฌ, ๊ต์ฐจ ์ฐธ์กฐ | LLM์ด ์ ์ถ ๋ฌธ์ ๋ถ์ | ์คํ์ |
์ฃผ๋ชฉํ ๋ํฅ
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋ฐ์ดํฐ ์ ๋๋ฆฌ์ฆ ์ํฌํ๋ก ํตํฉ์ ํ์ฌ ๊ฐ์ฅ ์ค์ํ ๋ฐ์ ์ด๋ค. LLM์ ์์ฐ์ด์ ์ฝ๋ ๊ฐ์ ๋ฒ์ญ(ํ๋ก๊ทธ๋๋ฐ ๊ธฐ์ ์ด ์๋ ์ ๋๋ฆฌ์คํธ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ ์ ์๋๋ก ์ง์), ํต๊ณ ๊ฒฐ๊ณผ์ ๋ํ ์์ ์ ์ค๋ช
์์ฑ, ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์์ ๋ด์ค ๊ฐ์น ์๋ ํจํด ์๋ณ ๋ฑ์ ์ํํ ์ ์๋ค. ๊ทธ๋ฌ๋ LLM์ ํ๊ฐ์ ์ผ์ผํค๊ณ , ๊ทธ๋ด๋ฏํ์ง๋ง ํ์์ธ ํต๊ณ๋ฅผ ์์ฑํ๋ฉฐ, ํ๋ฅญํ ์ ๋๋ฆฌ์ฆ์ ์ ์ํ๋ ๋นํ์ ํ์์ฃผ์๊ฐ ๊ฒฐ์ฌ๋์ด ์๋ค. ์ด ์ ํ๊ธฐ๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ํค์ณ๋๊ฐ๋ ๋ด์ค๋ฃธ์ AI๋ฅผ ์ธ๊ฐ์ ํธ์ง์ ํ๋จ์ ๋์ฒดํ๋ ๊ฒ์ด ์๋๋ผ ์ฆ๊ฐํ๋ ๋๊ตฌ๋ก ํ์ฉํ๊ณ , ์ธ๊ฐ์ ํ๋จ์ด ๋๋๋ ์ง์ ๊ณผ ์๊ณ ๋ฆฌ์ฆ ์ฒ๋ฆฌ๊ฐ ์์๋๋ ์ง์ ์ ๋ํด ์๋ก์ด ํํ์ ํฌ๋ช
์ฑ์ ๊ฐ๋ฐํ๋ ๊ณณ์ด ๋ ๊ฒ์ด๋ค.
References (4)
[1] Voinea, D. (2025). Reconceptualizing Gatekeeping in the Age of Artificial Intelligence: A Theoretical Exploration of Artificial Intelligence-Driven News Curation and Automated Journalism. Journalism and Media, 6(2), 68.
[2] Mintoo, A.A. (2024). Data-Driven Journalism: Advancing News Reporting Through Analytics with a PRISMA-Guided Review. Journal of Machine Learning in Data Engineering and Data Science, 1(1), 39.
[3] Abhishek, A. & Graves, L. (2024). Analyzing Code: What a Critical Code Studies Approach Reveals About the Epistemology of Data Journalism. Digital Journalism, 12(8), 2345205.
[4] Peng, C. (2025). The Role Of Data Journalism In Enhancing Public Understanding Of Complex Issues.