Linguistics & NLP
LLMs as Discourse Analysts: What Social Media Mining Reveals About Public Opinion
Large language models are increasingly used to analyze public discourse on social media platforms. Studies from Chinese Weibo and Xiaohongshu reveal how LLM-assisted analysis can uncover sentiment patterns, amplification dynamics, and cultural attitudes at scaleโwhile also encoding its own biases.
By Sean K.S. Shin
This blog summarizes research trends based on published paper abstracts. Specific numbers or findings may contain inaccuracies. For scholarly rigor, always consult the original papers cited in each post.
Social media platforms generate vast quantities of text that capture public attitudes, emotional reactions, and discursive patterns in near real-time. Traditional content analysisโhuman coders reading and categorizing postsโcannot keep pace with this volume. Large language models offer an alternative: automated classification of sentiment, topic, and discourse features across millions of posts. But using LLMs as analytical instruments raises methodological questions: how reliable are their classifications? What biases do they introduce? And what can they reveal that human analysis cannot?
The Research Landscape
Geopolitical Discourse and LLM Bias
Rogers and Zhang (2024), with 15 citations, provide the most methodologically rigorous study, analyzing discourse about the Russia-Ukraine war across Chinese social media platforms (Weibo and Douyin) using both manual and LLM-assisted classification.
Their most striking finding is methodological: LLM classification systematically coded more posts as "neutral" than human coders did. Posts that human analysts identified as subtly pro-Russian (through ironic framing, what-aboutism, or selective emphasis) were classified as "neutral" by the LLM. This "bias toward neutrality" reflects the LLM's training: safety fine-tuning encourages models to avoid taking sides on politically sensitive topics, creating a systematic undercount of non-neutral sentiment.
The substantive finding is equally significant: Chinese social media discourse about the war showed "mass amplification of Russian state positions"โnot through explicit pro-Russia statements (which are relatively rare) but through selective topic emphasis, framing effects, and narrative repetition. This amplification is largely invisible to LLM classification because it operates at the discourse level (how topics are framed) rather than the sentiment level (how individual posts are classified).
The implication for computational discourse analysis is clear: LLMs can classify individual posts but struggle with discourse-level phenomena that emerge from patterns across posts.
Food Safety Sentiment Evolution
Ma and Zheng (2024), with 12 citations, apply text mining and sentiment analysis to food safety incidents on Weibo, tracking how public sentiment evolves over time during food safety crises. Their contribution is the temporal dimension: not just what people feel, but how those feelings change as events unfold.
The analysis reveals a consistent pattern:
Initial shock (hours 0-24): High negative sentiment, dominated by fear and anger.
Blame attribution (days 1-3): Sentiment shifts from generalized anxiety to directed angerโtargeting specific companies, regulatory bodies, or government agencies.
Normalization (days 3-14): Sentiment gradually returns to baseline as media attention fades, but a residual distrust persists in subsequent discussions of related topics.
Reactivation: Future food safety incidents reactivate the accumulated distrust, producing stronger initial reactions than the objective severity of the new incident would predict.This temporal pattern has practical implications for crisis communication: the window for effective response is narrow (the first 24-48 hours), and failure to respond during this window allows blame attribution to solidify into durable public narratives.
Rural Landscape Sentiment
Zhang, Jin, and Rogers & Zhang (2024), with 5 citations, demonstrate a different application: analyzing public sentiment toward rural landscapes on Weibo using deep learning models. The study goes beyond simple sentiment classification to identify specific dimensions of landscape appreciationโaesthetic, ecological, nostalgic, economicโand their relative prevalence in public discourse.
The finding that "nostalgia" is the dominant sentiment dimension in rural landscape discussions (more prevalent than aesthetic appreciation or economic valuation) has implications for rural planning: public support for rural preservation may be driven more by emotional attachment to an idealized past than by ecological or economic arguments.
Marriage Discourse
Ye and Gao (2025) apply LLM-assisted content analysis to 219,358 marriage-related posts from Weibo and Xiaohongshu, examining how declining marriage rates in China are discussed on social media. The analysis identifies moral foundations underlying marriage discourseโcare, fairness, loyalty, authority, sanctityโand how these foundations differ between platforms and demographic groups.
Critical Analysis: Claims and Evidence
<
| Claim | Evidence | Verdict |
|---|
| LLMs show systematic bias toward neutrality in political discourse classification | Rogers & Zhang's manual vs. automated comparison | โ
Supported โ safety fine-tuning creates undercounting of non-neutral sentiment |
| Social media sentiment during crises follows predictable temporal patterns | Ma & Zheng's food safety crisis analysis | โ
Supported โ consistent across multiple incidents |
| Nostalgia dominates public discourse about rural landscapes | Zhang et al.'s sentiment dimension analysis | โ
Supported โ nostalgia > aesthetics > economics in Weibo data |
| LLMs capture discourse-level phenomena (framing, amplification) | Rogers & Zhang's analysis | โ Refuted โ LLMs classify posts but miss discourse-level patterns |
Open Questions
The neutrality bias: If LLMs systematically undercount non-neutral sentiment, how should researchers calibrate their classifications? Human validation on representative subsamples is necessary but expensive.Platform effects: Different platforms (Weibo vs. Xiaohongshu vs. Douyin) have different content moderation policies, user demographics, and algorithmic curation. How should cross-platform analyses account for these differences?Multilingual discourse: Most social media discourse analysis uses monolingual models. How should code-switching (common in multilingual societies) be handled?Ethics of mass analysis: Analyzing millions of social media posts without individual consent raises privacy and ethical questions, even when posts are publicly available.What This Means for Your Research
For computational linguists, Rogers and Zhang's finding about neutrality bias is methodologically important: LLM classifications should be validated against human judgments, especially for politically sensitive content.
For crisis communication researchers, Ma and Zheng's temporal pattern provides an empirically grounded framework for response timing.
Explore related work through ORAA ResearchBrain.
๋ฉด์ฑ
์กฐํญ: ์ด ๊ฒ์๋ฌผ์ ์ ๋ณด ์ ๊ณต ๋ชฉ์ ์ ์ฐ๊ตฌ ๋ํฅ ๊ฐ์์ด๋ค. ํ์ ์ฐ๊ตฌ์์ ์ธ์ฉํ๊ธฐ ์ ์ ๊ตฌ์ฒด์ ์ธ ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ํต๊ณ ๋ฐ ์ฃผ์ฅ์ ์๋ณธ ๋
ผ๋ฌธ๊ณผ ๋์กฐํ์ฌ ํ์ธํด์ผ ํ๋ค.
๋ด๋ก ๋ถ์๊ฐ๋ก์์ LLM: ์์
๋ฏธ๋์ด ๋ง์ด๋์ด ์ฌ๋ก ์ ๋ํด ๋ฐํ๋ ๊ฒ
์์
๋ฏธ๋์ด ํ๋ซํผ์ ๊ณต๊ณต์ ํ๋, ๊ฐ์ ์ ๋ฐ์, ๋ด๋ก ์ ํจํด์ ๊ฑฐ์ ์ค์๊ฐ์ผ๋ก ํฌ์ฐฉํ๋ ๋ฐฉ๋ํ ์์ ํ
์คํธ๋ฅผ ์์ฑํ๋ค. ์ ํต์ ์ธ ๋ด์ฉ ๋ถ์โ์ฌ๋์ด ์ง์ ๊ฒ์๋ฌผ์ ์ฝ๊ณ ๋ถ๋ฅํ๋ ๋ฐฉ์โ์ ์ด ๊ท๋ชจ์ ๋ฐ๋ง์ถ ์ ์๋ค. ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋์์ ์ ์ํ๋ค. ์๋ฐฑ๋ง ๊ฑด์ ๊ฒ์๋ฌผ์ ๊ฑธ์ณ ๊ฐ์ฑ, ์ฃผ์ , ๋ด๋ก ์ ํน์ง์ ์๋์ผ๋ก ๋ถ๋ฅํ๋ ๊ฒ์ด๋ค. ๊ทธ๋ฌ๋ LLM์ ๋ถ์ ๋๊ตฌ๋ก ํ์ฉํ๋ ๊ฒ์ ๋ฐฉ๋ฒ๋ก ์ ์ง๋ฌธ์ ์ ๊ธฐํ๋ค. ๋ถ๋ฅ์ ์ ๋ขฐ๋๋ ์ด๋ ์ ๋์ธ๊ฐ? ์ด๋ค ํธํฅ์ ๋์
ํ๋๊ฐ? ๊ทธ๋ฆฌ๊ณ ์ธ๊ฐ ๋ถ์์ผ๋ก๋ ๋ฐํ ์ ์๋ ๊ฒ์ ๋ฌด์์ ๋๋ฌ๋ผ ์ ์๋๊ฐ?
์ฐ๊ตฌ ๋ํฅ
์ง์ ํ์ ๋ด๋ก ๊ณผ LLM ํธํฅ
Rogers and Zhang (2024)์ 15ํ ์ธ์ฉ์ผ๋ก, ๋ฐฉ๋ฒ๋ก ์ ์ผ๋ก ๊ฐ์ฅ ์๋ฐํ ์ฐ๊ตฌ๋ฅผ ์ ๊ณตํ๋ฉฐ, ์๋ ๋ถ๋ฅ์ LLM ๋ณด์กฐ ๋ถ๋ฅ๋ฅผ ๋ชจ๋ ํ์ฉํ์ฌ ์ค๊ตญ ์์
๋ฏธ๋์ด ํ๋ซํผ(Weibo์ Douyin)์์ ๋ฌ์์-์ฐํฌ๋ผ์ด๋ ์ ์์ ๊ดํ ๋ด๋ก ์ ๋ถ์ํ๋ค.
์ด ์ฐ๊ตฌ์์ ๊ฐ์ฅ ์ฃผ๋ชฉํ ๋งํ ๋ฐ๊ฒฌ์ ๋ฐฉ๋ฒ๋ก ์ ์ธ ๊ฒ์ด๋ค. LLM ๋ถ๋ฅ๋ ์ธ๊ฐ ์ฝ๋๋ณด๋ค ๋ ๋ง์ ๊ฒ์๋ฌผ์ "์ค๋ฆฝ"์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ์ฝ๋ฉํ์๋ค. ์ธ๊ฐ ๋ถ์๊ฐ๊ฐ ๋ฏธ๋ฌํ๊ฒ ์น๋ฌ์์์ ์ด๋ผ๊ณ ์๋ณํ ๊ฒ์๋ฌผ(์์ด๋ฌ๋ํ ํ๋ ์ด๋ฐ, ํ์ ์ ํ์ ๋
ผ๋ฆฌ(what-aboutism), ๋๋ ์ ํ์ ๊ฐ์กฐ๋ฅผ ํตํด)์ LLM์ "์ค๋ฆฝ"์ผ๋ก ๋ถ๋ฅํ์๋ค. ์ด๋ฌํ "์ค๋ฆฝ ํธํฅ"์ LLM์ ํ์ต ๋ฐฉ์์์ ๋น๋กฏ๋๋ค. ์์ ๋ฏธ์ธ์กฐ์ (safety fine-tuning)์ ๋ชจ๋ธ์ด ์ ์น์ ์ผ๋ก ๋ฏผ๊ฐํ ์ฃผ์ ์ ๋ํด ์
์ฅ ํ๋ช
์ ํผํ๋๋ก ์ ๋ํ๋ฉฐ, ์ด๋ก ์ธํด ๋น์ค๋ฆฝ์ ๊ฐ์ฑ์ด ์ฒด๊ณ์ ์ผ๋ก ๊ณผ์ ๊ณ์ฐ๋๋ค.
์ค์ง์ ์ธ ๋ฐ๊ฒฌ ๋ํ ๊ทธ์ ๋ชป์ง์๊ฒ ์ค์ํ๋ค. ์ ์์ ๊ดํ ์ค๊ตญ ์์
๋ฏธ๋์ด ๋ด๋ก ์ "๋ฌ์์ ๊ตญ๊ฐ ์
์ฅ์ ๋๊ท๋ชจ ์ฆํญ"์ ๋ณด์ฌ์ฃผ์๋ค. ์ด๋ ๋ช
์์ ์ธ ์น๋ฌ์์ ์ง์ (๋น๊ต์ ๋๋ฌธ)์ ํตํด์๊ฐ ์๋๋ผ, ์ ํ์ ์ฃผ์ ๊ฐ์กฐ, ํ๋ ์ด๋ฐ ํจ๊ณผ, ์์ฌ ๋ฐ๋ณต์ ํตํด ์ด๋ฃจ์ด์ก๋ค. ์ด๋ฌํ ์ฆํญ์ ๊ฐ์ฑ ์์ค(๊ฐ๋ณ ๊ฒ์๋ฌผ์ด ์ด๋ป๊ฒ ๋ถ๋ฅ๋๋์ง)์ด ์๋ ๋ด๋ก ์์ค(์ฃผ์ ๊ฐ ์ด๋ป๊ฒ ํ๋ ์ด๋ฐ๋๋์ง)์์ ์๋ํ๊ธฐ ๋๋ฌธ์ LLM ๋ถ๋ฅ์๋ ๋์ฒด๋ก ํฌ์ฐฉ๋์ง ์๋๋ค.
๊ณ์ฐ ๋ด๋ก ๋ถ์์ ๋ํ ์์ฌ์ ์ ๋ช
ํํ๋ค. LLM์ ๊ฐ๋ณ ๊ฒ์๋ฌผ์ ๋ถ๋ฅํ ์ ์์ง๋ง, ๊ฒ์๋ฌผ ์ ๋ฐ์ ํจํด์์ ๋ํ๋๋ ๋ด๋ก ์์ค์ ํ์์ ํ์
ํ๊ธฐ ์ด๋ ต๋ค.
์ํ ์์ ๊ฐ์ฑ์ ๋ณํ
Ma and Zheng (2024)์ 12ํ ์ธ์ฉ์ผ๋ก, Weibo์ ์ํ ์์ ์ฌ๊ฑด์ ํ
์คํธ ๋ง์ด๋๊ณผ ๊ฐ์ฑ ๋ถ์์ ์ ์ฉํ์ฌ ์ํ ์์ ์๊ธฐ ๊ธฐ๊ฐ ๋์ ๊ณต์ค ๊ฐ์ฑ์ด ์๊ฐ์ ๋ฐ๋ผ ์ด๋ป๊ฒ ๋ณํํ๋์ง๋ฅผ ์ถ์ ํ๋ค. ์ด ์ฐ๊ตฌ์ ๊ธฐ์ฌ๋ ์๊ฐ์ ์ฐจ์์ ์๋ค. ๋จ์ํ ์ฌ๋๋ค์ด ๋ฌด์์ ๋๋ผ๋์ง๊ฐ ์๋๋ผ, ์ฌ๊ฑด์ด ์ ๊ฐ๋จ์ ๋ฐ๋ผ ๊ทธ ๊ฐ์ ์ด ์ด๋ป๊ฒ ๋ณํํ๋์ง๋ฅผ ๋ถ์ํ๋ค.
๋ถ์์ ์ผ๊ด๋ ํจํด์ ๋๋ฌ๋ธ๋ค.
์ด๊ธฐ ์ถฉ๊ฒฉ (0-24์๊ฐ): ๊ณตํฌ์ ๋ถ๋
ธ๊ฐ ์ง๋ฐฐํ๋ ๋์ ๋ถ์ ์ ๊ฐ์ฑ.
์ฑ
์ ๊ท์ธ (1-3์ผ): ๊ฐ์ฑ์ด ์ผ๋ฐํ๋ ๋ถ์์์ ํน์ ๊ธฐ์
, ๊ท์ ๊ธฐ๊ด, ๋๋ ์ ๋ถ ๊ธฐ๊ด์ ๊ฒจ๋ฅํ ๋ถ๋
ธ๋ก ์ ํ.
์ ์ํ (3-14์ผ): ๋ฏธ๋์ด ๊ด์ฌ์ด ์ฌ๋ผ์ง๋ฉด์ ๊ฐ์ฑ์ด ์ ์ฐจ ๊ธฐ์ค์ ์ผ๋ก ํ๊ทํ์ง๋ง, ๊ด๋ จ ์ฃผ์ ์ ๋ํ ํ์ ๋
ผ์์์ ์๋ฅ์ ๋ถ์ ์ด ์ง์.
์ฌํ์ฑํ: ํฅํ ์ํ ์์ ์ฌ๊ฑด์ด ์ถ์ ๋ ๋ถ์ ์ ์ฌํ์ฑํํ์ฌ, ์๋ก์ด ์ฌ๊ฑด์ ๊ฐ๊ด์ ์ฌ๊ฐ์ฑ์ด ์์ธกํ๋ ๊ฒ๋ณด๋ค ๋ ๊ฐํ ์ด๊ธฐ ๋ฐ์์ ์ ๋ฐ.์ด๋ฌํ ์๊ฐ์ ํจํด์ ์๊ธฐ ์ปค๋ฎค๋์ผ์ด์
์ ์ค์ง์ ์ธ ์์ฌ์ ์ ์ ๊ณตํ๋ค. ํจ๊ณผ์ ์ธ ๋์์ ์ํ ์ฐฝ(window)์ ์ข์ผ๋ฉฐ(์ด๊ธฐ 24-48์๊ฐ), ์ด ์ฐฝ ๋ด์ ๋์ํ์ง ๋ชปํ ๊ฒฝ์ฐ ์ฑ
์ ๊ท์ธ์ด ์ง์์ ์ธ ๊ณต์ค ์์ฌ๋ก ๊ณ ์ฐฉํ๋๋ค.
๋์ด ๊ฒฝ๊ด ๊ฐ์ฑ
Zhang, Jin, Rogers & Zhang(2024)๋
5ํ ์ธ์ฉ์ผ๋ก ๋ค๋ฅธ ์ ์ฉ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋ค: ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ์ฉํ์ฌ Weibo์์ ๋์ด ๊ฒฝ๊ด์ ๋ํ ๊ณต์ค ๊ฐ์ ์ ๋ถ์ํ ๊ฒ์ด๋ค. ์ด ์ฐ๊ตฌ๋ ๋จ์ํ ๊ฐ์ ๋ถ๋ฅ๋ฅผ ๋์ด ๊ฒฝ๊ด ๊ฐ์์ ๊ตฌ์ฒด์ ์ธ ์ฐจ์โ๋ฏธ์ , ์ํ์ , ํฅ์์ , ๊ฒฝ์ ์ โ๊ณผ ๊ณต๊ณต ๋ด๋ก ์์ ๊ฐ ์ฐจ์์ ์๋์ ์ฐ์ธ๋ฅผ ๊ท๋ช
ํ๋ค.
๋์ด ๊ฒฝ๊ด ๋
ผ์์์ 'ํฅ์(nostalgia)'๊ฐ ์ง๋ฐฐ์ ์ธ ๊ฐ์ ์ฐจ์์ด๋ผ๋ ๋ฐ๊ฒฌ(๋ฏธ์ ๊ฐ์์ด๋ ๊ฒฝ์ ์ ํ๊ฐ๋ณด๋ค ๋ ์ฐ์ธํจ)์ ๋์ด ๊ณํ์ ์์ฌ์ ์ ์ ๊ณตํ๋ค: ๋์ด ๋ณด์กด์ ๋ํ ๊ณต์ค์ ์ง์ง๋ ์ํ์ ๋๋ ๊ฒฝ์ ์ ๋
ผ๊ฑฐ๋ณด๋ค ์ด์ํ๋ ๊ณผ๊ฑฐ์ ๋ํ ์ ์์ ์ ์ฐฉ์ ์ํด ๋ ๋ง์ด ์ถ๋๋ ์ ์๋ค.
๊ฒฐํผ ๋ด๋ก
Ye์ Gao(2025)๋ LLM ๋ณด์กฐ ๋ด์ฉ ๋ถ์์ Weibo์ Xiaohongshu์์ ์์งํ ๊ฒฐํผ ๊ด๋ จ ๊ฒ์๋ฌผ 219,358๊ฑด์ ์ ์ฉํ์ฌ, ์ค๊ตญ์ ํผ์ธ์จ ๊ฐ์๊ฐ ์์
๋ฏธ๋์ด์์ ์ด๋ป๊ฒ ๋
ผ์๋๋์ง ๊ฒํ ํ๋ค. ์ด ๋ถ์์ ๊ฒฐํผ ๋ด๋ก ์ ๊ทผ์ ์ ์๋ ๋๋์ ํ ๋โ๋ฐฐ๋ ค, ๊ณต์ ์ฑ, ์ถฉ์ฑ, ๊ถ์, ์ ์ฑํจโ์ ์ด๋ฌํ ํ ๋๊ฐ ํ๋ซํผ ๋ฐ ์ธ๊ตฌํต๊ณํ์ ์ง๋จ์ ๋ฐ๋ผ ์ด๋ป๊ฒ ๋ฌ๋ผ์ง๋์ง๋ฅผ ๊ท๋ช
ํ๋ค.
๋นํ์ ๋ถ์: ์ฃผ์ฅ๊ณผ ์ฆ๊ฑฐ
<
| ์ฃผ์ฅ | ์ฆ๊ฑฐ | ํ์ |
|---|
| LLM์ ์ ์น ๋ด๋ก ๋ถ๋ฅ์์ ์ค๋ฆฝ ํธํฅ์ ์ฒด๊ณ์ ์ผ๋ก ๋๋ฌ๋ธ๋ค | Rogers & Zhang์ ์๋ vs. ์๋ ๋น๊ต | โ
์ง์ง๋จ โ ์์ ์ฑ ๋ฏธ์ธ ์กฐ์ ์ด ๋น์ค๋ฆฝ ๊ฐ์ ์ ๊ณผ์ ์ฐ์ ์ ์ด๋ํ๋ค |
| ์๊ธฐ ์ํฉ์์ ์์
๋ฏธ๋์ด ๊ฐ์ ์ ์์ธก ๊ฐ๋ฅํ ์๊ฐ์ ํจํด์ ๋ฐ๋ฅธ๋ค | Ma & Zheng์ ์ํ ์์ ์๊ธฐ ๋ถ์ | โ
์ง์ง๋จ โ ๋ณต์์ ์ฌ๊ฑด์ ๊ฑธ์ณ ์ผ๊ด๋จ |
| ํฅ์๊ฐ ๋์ด ๊ฒฝ๊ด์ ๋ํ ๊ณต๊ณต ๋ด๋ก ์ ์ง๋ฐฐํ๋ค | Zhang et al.์ ๊ฐ์ ์ฐจ์ ๋ถ์ | โ
์ง์ง๋จ โ Weibo ๋ฐ์ดํฐ์์ ํฅ์ > ๋ฏธ์ ๊ฐ์ > ๊ฒฝ์ ์ ๊ณ ๋ ค |
| LLM์ ๋ด๋ก ์์ค์ ํ์(ํ๋ ์ด๋ฐ, ์ฆํญ)์ ํฌ์ฐฉํ๋ค | Rogers & Zhang์ ๋ถ์ | โ ๋ฐ๋ฐ๋จ โ LLM์ ๊ฐ๋ณ ๊ฒ์๋ฌผ์ ๋ถ๋ฅํ์ง๋ง ๋ด๋ก ์์ค์ ํจํด์ ํฌ์ฐฉํ์ง ๋ชปํ๋ค |
๋ฏธํด๊ฒฐ ๋ฌธ์
์ค๋ฆฝ ํธํฅ: LLM์ด ์ฒด๊ณ์ ์ผ๋ก ๋น์ค๋ฆฝ ๊ฐ์ ์ ๊ณผ์ ์ฐ์ ํ๋ค๋ฉด, ์ฐ๊ตฌ์๋ค์ ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ฅผ ์ด๋ป๊ฒ ๋ณด์ ํด์ผ ํ๋๊ฐ? ๋ํ ํ์ ํ๋ณธ์ ๋ํ ์ธ๊ฐ ๊ฒ์ฆ์ด ํ์ํ์ง๋ง ๋น์ฉ์ด ๋ง์ด ๋ ๋ค.ํ๋ซํผ ํจ๊ณผ: ํ๋ซํผ๋ง๋ค(Weibo vs. Xiaohongshu vs. Douyin) ์ฝํ
์ธ ์กฐ์ ์ ์ฑ
, ์ด์ฉ์ ์ธ๊ตฌ ๊ตฌ์ฑ, ์๊ณ ๋ฆฌ์ฆ ํ๋ ์ด์
์ด ๋ค๋ฅด๋ค. ๊ต์ฐจ ํ๋ซํผ ๋ถ์์ ์ด๋ฌํ ์ฐจ์ด๋ฅผ ์ด๋ป๊ฒ ๊ณ ๋ คํด์ผ ํ๋๊ฐ?๋ค์ธ์ด ๋ด๋ก : ๋๋ถ๋ถ์ ์์
๋ฏธ๋์ด ๋ด๋ก ๋ถ์์ ๋จ์ผ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ๋ค. ์ฝ๋ ์ ํ(๋ค์ธ์ด ์ฌํ์์ ํํ ๋ํ๋จ)์ ์ด๋ป๊ฒ ์ฒ๋ฆฌํด์ผ ํ๋๊ฐ?๋๊ท๋ชจ ๋ถ์์ ์ค๋ฆฌ: ๊ฒ์๋ฌผ์ด ๊ณต๊ฐ์ ์ผ๋ก ์ด์ฉ ๊ฐ๋ฅํ๋๋ผ๋, ๊ฐ์ธ ๋์ ์์ด ์๋ฐฑ๋ง ๊ฑด์ ์์
๋ฏธ๋์ด ๊ฒ์๋ฌผ์ ๋ถ์ํ๋ ๊ฒ์ ํ๋ผ์ด๋ฒ์ ๋ฐ ์ค๋ฆฌ์ ๋ฌธ์ ๋ฅผ ์ ๊ธฐํ๋ค.์ฐ๊ตฌ์ ์ฃผ๋ ์์ฌ์
์ ์ฐ ์ธ์ดํ์์๊ฒ๋ Rogers์ Zhang์ ์ค๋ฆฝ ํธํฅ ๋ฐ๊ฒฌ์ด ๋ฐฉ๋ฒ๋ก ์ ์ผ๋ก ์ค์ํ๋ค: LLM ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ ํนํ ์ ์น์ ์ผ๋ก ๋ฏผ๊ฐํ ์ฝํ
์ธ ์ ๊ฒฝ์ฐ ์ธ๊ฐ์ ํ๋จ๊ณผ ๋น๊ตํ์ฌ ๊ฒ์ฆ๋์ด์ผ ํ๋ค.
์๊ธฐ ์ปค๋ฎค๋์ผ์ด์
์ฐ๊ตฌ์์๊ฒ๋ Ma์ Zheng์ ์๊ฐ์ ํจํด์ด ๋์ ์์ ๊ฒฐ์ ์ ์ํ ๊ฒฝํ์ ๊ทผ๊ฑฐ๋ฅผ ๊ฐ์ถ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ค.
๊ด๋ จ ์ฐ๊ตฌ๋ ORAA ResearchBrain์ ํตํด ํ์ํ ์ ์๋ค.
References (4)
[1] Rogers, R. & Zhang, X. (2024). The RussiaโUkraine War in Chinese Social Media: LLM Analysis Yields a Bias Toward Neutrality. Social Media + Society.
[2] Ma, B. & Zheng, R. (2024). Exploring Food Safety Emergency Incidents on Sina Weibo: Using Text Mining and Sentiment Evolution. Journal of Food Protection, 100418.
[3] Zhang, J., Jin, G., & Liu, Y. (2024). Attention and sentiment of Chinese public toward rural landscape based on Sina Weibo. Scientific Reports.
[4] Ye, F. & Gao, X. (2025). Marriage Discourse on Chinese Social Media: An LLM-assisted Analysis. [Preprint].