Trend AnalysisHistory & Area Studies
Oral History Methodology in the Digital Age: Voice, Memory, and Machine
Oral history, the systematic collection and preservation of personal testimony, has long served as a corrective to archives dominated by the powerful and literate. The voices of workers, refugees, ind...
By Sean K.S. Shin
This blog summarizes research trends based on published paper abstracts. Specific numbers or findings may contain inaccuracies. For scholarly rigor, always consult the original papers cited in each post.
Why It Matters
Oral history, the systematic collection and preservation of personal testimony, has long served as a corrective to archives dominated by the powerful and literate. The voices of workers, refugees, indigenous communities, women, and survivors of atrocity rarely appear in official records. Oral history captures what written sources cannot: emotion, ambiguity, the texture of lived experience.
The digital revolution has simultaneously expanded and complicated this practice. Automated transcription, NLP-driven topic modeling, and searchable audio databases make it possible to work with oral collections at unprecedented scale. A researcher can now query thousands of interviews for thematic patterns that would take decades to identify through manual listening. Yet this computational power raises methodological questions: does algorithmic processing strip oral testimony of the very qualities (hesitation, tone, silence) that make it historically valuable?
The tension between scale and intimacy defines the current moment in oral history methodology.
The Science
NLP and the Densho Collection
Chen et al. (2024) applied NLP and data analytics to 904 oral interview transcripts from the Densho digital collection, which documents Japanese American incarceration during World War II. Their analysis used topic modeling, sentiment analysis, and named entity recognition to identify recurring themes across testimonies, revealing patterns of resistance and resilience that close reading of individual interviews had not systematically captured.
The State of the Field
Chen et al. (2024), in Oxford's Very Short Introduction series, surveys oral history from its mid-20th-century origins to its digital present. The book emphasizes that recording technology has always shaped the practice: from reel-to-reel tape to smartphones, each medium alters what narrators share and how archives preserve testimony. Digital preservation now ensures longevity but introduces new challenges of format obsolescence and metadata standardization.
Algorithmic Resistance and Memory
Boyd (2025) introduced the concept of "ethno-curatorial rememory," examining how Black and Indigenous communities use embodied curation, ritual, oral history, and art, to resist what she terms "algorithmic authoritarianism": the erasure of collective memory by platform algorithms that prioritize engagement over truth. The paper argues that oral history practice must actively counter digital memory hierarchies.
Intangible Heritage Transmission
Gladden (2025) used oral history methodology to document the transmission of traditional dance knowledge in China and Korea, exploring how digitalization both preserves and transforms performance traditions. Their interview-based study found that practitioners view digital documentation as a supplement, never a substitute, for embodied transmission.
Digital Oral History: Opportunities and Risks
<
| Dimension | Opportunity | Risk |
|---|
| Scale | Process thousands of interviews computationally | Lose individual narrative nuance |
| Access | Global online availability | Digital divide excludes source communities |
| Preservation | Multi-format backup, long-term storage | Format obsolescence, metadata loss |
| Analysis | NLP topic modeling, sentiment analysis | Algorithmic bias, decontextualization |
| Ethics | Informed consent platforms, access controls | Surveillance potential, data sovereignty |
What To Watch
The next generation of oral history tools will integrate automatic speech recognition, speaker diarization, and emotion detection to create richly annotated audio archives. Multilingual ASR models are making it feasible to process testimonies in under-resourced languages without English translation as an intermediary. The critical challenge for 2026 and beyond is governance: who controls access to digitized testimony, and how do communities retain sovereignty over their own stories in an age of data extraction?
๋ฉด์ฑ
์กฐํญ: ์ด ๊ฒ์๋ฌผ์ ์ ๋ณด ์ ๊ณต์ ๋ชฉ์ ์ผ๋ก ํ ์ฐ๊ตฌ ๋ํฅ ๊ฐ์์ด๋ค. ํ์ ์ ์๋ฌผ์์ ์ธ์ฉํ๊ธฐ ์ ์ ๊ตฌ์ฒด์ ์ธ ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ํต๊ณ ๋ฐ ์ฃผ์ฅ์ ์๋ณธ ๋
ผ๋ฌธ์ ํตํด ๊ฒ์ฆํด์ผ ํ๋ค.
์ค์์ฑ
๊ตฌ์ ์ฌ(oral history)๋ ๊ฐ์ธ ์ฆ์ธ์ ์ฒด๊ณ์ ์ผ๋ก ์์งํ๊ณ ๋ณด์กดํ๋ ์ค์ฒ์ผ๋ก, ๊ถ๋ ฅ์์ ๋ฌธ์ ํด๋์ ์ค์ฌ์ ๊ธฐ๋ก๊ด์ ๋ํ ๊ต์ ์ญํ ์ ์ค๋ซ๋์ ์ํํด์๋ค. ๋
ธ๋์, ๋๋ฏผ, ์์ฃผ๋ฏผ ๊ณต๋์ฒด, ์ฌ์ฑ, ๊ทธ๋ฆฌ๊ณ ์ํน ํ์ ์์กด์๋ค์ ๋ชฉ์๋ฆฌ๋ ๊ณต์ ๊ธฐ๋ก์ ๊ฑฐ์ ๋ฑ์ฅํ์ง ์๋๋ค. ๊ตฌ์ ์ฌ๋ ๋ฌธํ ์๋ฃ๊ฐ ๋ด์๋ผ ์ ์๋ ๊ฒ, ์ฆ ๊ฐ์ , ๋ชจํธํจ, ์ด์๋ธ ๊ฒฝํ์ ์ง๊ฐ์ ํฌ์ฐฉํ๋ค.
๋์งํธ ํ๋ช
์ ์ด ์ค์ฒ์ ๋์์ ํ์ฅํ๊ณ ๋ณต์กํ๊ฒ ๋ง๋ค์๋ค. ์๋ ์ ์ฌ(automated transcription), NLP ๊ธฐ๋ฐ ํ ํฝ ๋ชจ๋ธ๋ง(topic modeling), ๊ฒ์ ๊ฐ๋ฅํ ์ค๋์ค ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋๋ถ์ ์ ๋ก ์๋ ๊ท๋ชจ๋ก ๊ตฌ์ ์ปฌ๋ ์
์ ๋ค๋ฃจ๋ ๊ฒ์ด ๊ฐ๋ฅํด์ก๋ค. ์ฐ๊ตฌ์๋ ์ด์ ์์ฒ ๊ฑด์ ์ธํฐ๋ทฐ์์ ์๋ ์ฒญ์ทจ๋ก๋ ์์ญ ๋
์ด ๊ฑธ๋ฆด ์ฃผ์ ์ ํจํด์ ๊ฒ์ํ ์ ์๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ ์ปดํจํฐ ์ฐ์ฐ ๋ฅ๋ ฅ์ ๋ฐฉ๋ฒ๋ก ์ ์ง๋ฌธ์ ์ ๊ธฐํ๋ค. ์๊ณ ๋ฆฌ์ฆ ์ฒ๋ฆฌ๋ ๊ตฌ์ ์ฆ์ธ์ด ์ญ์ฌ์ ์ผ๋ก ๊ฐ์น ์๊ฒ ๋ง๋๋ ๋ฐ๋ก ๊ทธ ํน์ง(๋ง์ค์, ์ด์กฐ, ์นจ๋ฌต)์ ๋ฐํํ๋๊ฐ?
๊ท๋ชจ์ ์น๋ฐ์ฑ ์ฌ์ด์ ๊ธด์ฅ์ด ๊ตฌ์ ์ฌ ๋ฐฉ๋ฒ๋ก ์ ํ์ฌ ์์ ์ ๊ท์ ํ๋ค.
์ฐ๊ตฌ ๋ด์ฉ
NLP์ Densho ์ปฌ๋ ์
Chen et al. (2024)์ ์ 2์ฐจ ์ธ๊ณ๋์ ์ค ์ผ๋ณธ๊ณ ๋ฏธ๊ตญ์ธ ๊ฐ์ ์์ฉ์ ๊ธฐ๋กํ Densho ๋์งํธ ์ปฌ๋ ์
์ ๊ตฌ์ ์ธํฐ๋ทฐ ์ ์ฌ๋ณธ 904๊ฑด์ NLP์ ๋ฐ์ดํฐ ๋ถ์์ ์ ์ฉํ์๋ค. ์ด๋ค์ ๋ถ์์ ํ ํฝ ๋ชจ๋ธ๋ง, ๊ฐ์ฑ ๋ถ์(sentiment analysis), ๊ฐ์ฒด๋ช
์ธ์(named entity recognition)์ ํ์ฉํ์ฌ ์ฆ์ธ ์ ๋ฐ์ ๊ฑธ์น ๋ฐ๋ณต์ ์ฃผ์ ๋ฅผ ์๋ณํ์์ผ๋ฉฐ, ๊ฐ๋ณ ์ธํฐ๋ทฐ์ ์ ๋
์ผ๋ก๋ ์ฒด๊ณ์ ์ผ๋ก ํฌ์ฐฉ๋์ง ์์๋ ์ ํญ๊ณผ ํ๋ณตํ๋ ฅ์ฑ์ ํจํด์ ๋๋ฌ๋๋ค.
๋ถ์ผ์ ํํฉ
Chen et al. (2024)์ Oxford์ Very Short Introduction ์๋ฆฌ์ฆ์์ 20์ธ๊ธฐ ์ค๋ฐ ๊ธฐ์๋ถํฐ ๋์งํธ ํ์ฌ์ ์ด๋ฅด๊ธฐ๊น์ง ๊ตฌ์ ์ฌ๋ฅผ ๊ฐ๊ดํ๋ค. ์ด ์ฑ
์ ๋
น์ ๊ธฐ์ ์ด ํญ์ ์ค์ฒ ๋ฐฉ์์ ํ์ฑํด์์์ ๊ฐ์กฐํ๋ค. ๋ฆดํฌ๋ฆด(reel-to-reel) ํ
์ดํ์์ ์ค๋งํธํฐ์ ์ด๋ฅด๊ธฐ๊น์ง, ๊ฐ ๋งค์ฒด๋ ํ์๊ฐ ๊ณต์ ํ๋ ๋ด์ฉ๊ณผ ๊ธฐ๋ก๊ด์ด ์ฆ์ธ์ ๋ณด์กดํ๋ ๋ฐฉ์์ ๋ณํ์ํจ๋ค. ๋์งํธ ๋ณด์กด์ ์ด์ ์ฅ๊ธฐ์ ์ง์์ฑ์ ๋ณด์ฅํ์ง๋ง, ํฌ๋งท ๋
ธํํ์ ๋ฉํ๋ฐ์ดํฐ ํ์คํ๋ผ๋ ์๋ก์ด ๊ณผ์ ๋ฅผ ๋์
ํ๋ค.
์๊ณ ๋ฆฌ์ฆ์ ์ ํญ๊ณผ ๊ธฐ์ต
Boyd (2025)๋ "๋ฏผ์กฑ-ํ๋ ์ดํฐ์ ํ๊ณ (ethno-curatorial rememory)"์ ๊ฐ๋
์ ๋์
ํ์ฌ, ํ์ธ ๋ฐ ์์ฃผ๋ฏผ ๊ณต๋์ฒด๊ฐ ๊ตฌํ์ ํ๋ ์ด์
(embodied curation), ์๋ก, ๊ตฌ์ ์ฌ, ์์ ์ ํ์ฉํ์ฌ ํ๋ซํผ ์๊ณ ๋ฆฌ์ฆ์ด ์ง์ค๋ณด๋ค ์ฐธ์ฌ๋ฅผ ์ฐ์ ์ํจ์ผ๋ก์จ ์ง๋จ ๊ธฐ์ต์ ์ง์ด๋ค๊ณ ๊ทธ๋
๊ฐ ๋ช
๋ช
ํ๋ "์๊ณ ๋ฆฌ์ฆ์ ๊ถ์์ฃผ์(algorithmic authoritarianism)"์ ์ ํญํ๋ ๋ฐฉ์์ ๊ณ ์ฐฐํ๋ค. ์ด ๋
ผ๋ฌธ์ ๊ตฌ์ ์ฌ ์ค์ฒ์ด ๋์งํธ ๊ธฐ์ต ์๊ณ์ ๋ฅ๋์ ์ผ๋ก ๋ํญํด์ผ ํ๋ค๊ณ ์ฃผ์ฅํ๋ค.
๋ฌดํ ์ ์ฐ ์ ์น
Gladden (2025)์ ๊ตฌ์ ์ฌ ๋ฐฉ๋ฒ๋ก ์ ํ์ฉํ์ฌ ์ค๊ตญ๊ณผ ํ๊ตญ์ ์ ํต ๋ฌด์ฉ ์ง์ ์ ์น์ ๊ธฐ๋กํ๊ณ , ๋์งํธํ๊ฐ ๊ณต์ฐ ์ ํต์ ์ด๋ป๊ฒ ๋ณด์กดํ๋ ๋์์ ๋ณํ์ํค๋์ง๋ฅผ ํ๊ตฌํ์๋ค. ์ธํฐ๋ทฐ ๊ธฐ๋ฐ ์ฐ๊ตฌ์์, ์ค์ฒ๊ฐ๋ค์ ๋์งํธ ๊ธฐ๋ก์ ๊ตฌํ์ ์ ์น์ ๋์ฒด์ฌ๊ฐ ์๋ ๋ณด์์ฌ๋ก ์ธ์ํ๋ค๋ ์ ์ ๋ฐ๊ฒฌํ์๋ค.
๋์งํธ ๊ตฌ์ ์ฌ: ๊ธฐํ์ ์ํ
<
| ์ฐจ์ | ๊ธฐํ | ์ํ |
|---|
| ๊ท๋ชจ | ์์ฒ ๊ฑด์ ์ธํฐ๋ทฐ๋ฅผ ์ปดํจํฐ ์ฐ์ฐ์ผ๋ก ์ฒ๋ฆฌ | ๊ฐ๋ณ ์์ฌ์ ๋์์ค ์์ค |
| ์ ๊ทผ์ฑ | ์ ์ธ๊ณ ์จ๋ผ์ธ ์ด์ฉ ๊ฐ๋ฅ | ๋์งํธ ๊ฒฉ์ฐจ๋ก ์ธํ ์์ฒ ๊ณต๋์ฒด ๋ฐฐ์ |
| ๋ณด์กด | ๋ค์ค ํฌ๋งท ๋ฐฑ์
, ์ฅ๊ธฐ ์ ์ฅ | ํฌ๋งท ๋
ธํํ, ๋ฉํ๋ฐ์ดํฐ ์์ค |
| ๋ถ์ | NLP ํ ํฝ ๋ชจ๋ธ๋ง, ๊ฐ์ฑ ๋ถ์ | ์๊ณ ๋ฆฌ์ฆ ํธํฅ, ํ๋งฅ๋ฝํ |
| ์ค๋ฆฌ | ์ ๋ณด์ ๊ทผ๊ฑฐํ ๋์ ํ๋ซํผ, ์ ๊ทผ ํต์ | ๊ฐ์ ๊ฐ๋ฅ์ฑ, ๋ฐ์ดํฐ ์ฃผ๊ถ |
์ฃผ๋ชฉํ ์ฌํญ
๊ตฌ์ ์ฌ ๋๊ตฌ์ ์ฐจ์ธ๋ ์ธ๋๋ ์๋ ์์ฑ ์ธ์(ASR), ํ์ ๋ถ๋ฆฌ(speaker diarization), ๊ฐ์ ๊ฐ์ง(emotion detection)๋ฅผ ํตํฉํ์ฌ ํ๋ถํ๊ฒ ์ฃผ์์ด ๋ฌ๋ฆฐ ์ค๋์ค ์์นด์ด๋ธ๋ฅผ ์์ฑํ ๊ฒ์ด๋ค. ๋ค๊ตญ์ด ASR ๋ชจ๋ธ์ ์์ด ๋ฒ์ญ์ ์ค๊ฐ ๋งค๊ฐ ์์ด๋ ์์์ด ๋ถ์กฑํ ์ธ์ด๋ก ๋ ์ฆ์ธ์ ์ฒ๋ฆฌํ๋ ๊ฒ์ ์คํ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค๊ณ ์๋ค. 2026๋
์ดํ์ ํต์ฌ ๊ณผ์ ๋ ๊ฑฐ๋ฒ๋์ค(governance)์ด๋ค. ์ฆ, ๋์งํธํ๋ ์ฆ์ธ์ ๋ํ ์ ๊ทผ๊ถ์ ๋๊ฐ ํต์ ํ๋ฉฐ, ๋ฐ์ดํฐ ์ถ์ถ์ ์๋์ ๊ณต๋์ฒด๊ฐ ์์ ๋ค์ ์ด์ผ๊ธฐ์ ๋ํ ์ฃผ๊ถ์ ์ด๋ป๊ฒ ์ ์งํ ๊ฒ์ธ๊ฐ์ ๋ฌธ์ ์ด๋ค.
References (4)
Chen, H., Kim, J. (., Chen, J., & Sakata, A. (2024). Demystifying oral history with natural language processing and data analytics: a case study of the Densho digital collection. The Electronic Library, 42(4), 643-663.
Boyd, D. A. (2025). Oral History.
Gladden, S. N. (2025). Call and response in the digital age, from plantation blues to algorithmic hymns: Ethno-curatorial rememory and algorithmic authoritarianism. Dialogues on Digital Society, 1(3), 478-482.
Shi, Q., & Kim, J. (2025). Rethinking Tradition in the Digital Age: An Oral History with Professor Joo-Young Kim on the Transmission and Development of Traditional Dance in China and Korea. Global Review of Humanities, Arts, and Society, 1(5), 31-36.