Trend AnalysisComputer SystemsExperimental Design
Federated Learning in Healthcare and Finance: From Theory to Deployment Reality
Federated learning was supposed to solve the central tension of modern machine learning: you need large, diverse datasets to train good models, but the data you need is locked inside hospitals and ...
By Sean K.S. Shin
This blog summarizes research trends based on published paper abstracts. Specific numbers or findings may contain inaccuracies. For scholarly rigor, always consult the original papers cited in each post.
Federated learning was supposed to solve the central tension of modern machine learning: you need large, diverse datasets to train good models, but the data you need is locked inside hospitals and banks that cannotโand should notโshare it. The theory is elegant: train models locally, share only gradients, aggregate centrally. The practice, as a growing body of deployment-focused research reveals, is considerably messier. Data heterogeneity, communication overhead, and the gap between benchmark performance and real-world utility remain persistent challenges that no single framework has resolved.
The Research Landscape
Medical Imaging: The Leading Deployment Domain
Federated learning has found its most natural application in medical imaging, where patient data is both highly sensitive and distributed across institutions with different equipment, protocols, and patient populations.
Babar et al. (2024) provide the most empirically grounded analysis of data heterogeneity's impact on FL performance. Using the COVIDx CXR-3 chest X-ray dataset partitioned across multiple nodes to simulate institutional differences, they demonstrate that non-IID (non-independent and identically distributed) data partitions degrade FedAvg performance meaningfully compared to centralized training. This is not a surprising finding, but the systematic quantification across heterogeneity conditions provides a reliable baseline that later work builds upon.
Mastoi et al. (2025) combine FL with explainable AI for brain tumor classification from MRI scans. Their framework achieves competitive classification accuracy while providing interpretable attention maps that show which image regions drive predictions. The explainability component addresses a practical deployment barrier: clinicians are reluctant to trust black-box predictions in diagnostic contexts, and FL adds an additional layer of opacity since the model was trained on data the clinician never saw.
Gupta et al. (2025) benchmark three prominent FL frameworksโNVIDIA FLARE, Flower, and Owkin Substraโfor medical imaging deployment. This comparative evaluation addresses a practical question that academic papers often neglect: which framework should an institution actually use? Their findings suggest that NVIDIA FLARE offers the most mature infrastructure for production deployment, Flower provides the greatest flexibility for research, and Substra prioritizes regulatory compliance.
Rahmaniar et al. (2025) survey the broader landscape of FL in medical imaging, identifying three phases of the field's evolution: initial proof-of-concept studies (2019-2021), benchmark development (2022-2023), and deployment-focused work (2024-2025). They argue that the field is transitioning from demonstrating that FL can work to understanding when and how it should be deployed.
Financial Fraud Detection: The Second Wave
Finance represents the second major deployment domain for FL, driven by a specific problem structure: fraudulent transactions are rare events distributed across institutions, and no single bank sees enough fraud to train a robust detector alone.
Abadi et al. (2024) present Starlit, a privacy-preserving FL framework specifically designed for financial fraud detection. Starlit addresses a limitation of standard FL: even gradient sharing can leak information about individual transactions. Their framework adds differential privacy and secure aggregation to standard FL, reducing the information leakage risk while maintaining detection performance close to centralized baselines.
Aljunaid et al. (2025) โthe highest in this cohortโcombine FL with explainable AI for banking fraud detection. Their approach achieves high detection accuracy while providing feature-importance explanations that satisfy regulatory requirements for model interpretability. The high citation count reflects a convergence of practical needs: banks need fraud detection that works, regulators need explanations, and privacy law prohibits data sharing.
Kasyap et al. (2024) address the personalization problem in FL for finance. Standard FL produces a single global model, but different banks have different fraud patterns, customer bases, and risk profiles. Their personalized FL approach allows each participating institution to maintain a locally adapted model while still benefiting from collaborative training, improving detection of institution-specific fraud patterns beyond what the global model achieves.
Critical Analysis: Claims and Evidence
<
| Claim | Evidence | Verdict |
|---|
| Data heterogeneity degrades FL performance meaningfully | Babar et al. systematic evaluation | Supported โ consistent finding across conditions |
| Explainable FL improves clinical trust and adoption | Mastoi et al. brain tumor study | Partially supported โ explainability demonstrated, adoption impact assumed |
| NVIDIA FLARE is most deployment-ready for healthcare | Gupta et al. framework benchmark | Supported for current state โ but frameworks evolve rapidly |
| Privacy-preserving FL maintains detection close to centralized | Abadi et al. Starlit | Supported โ but specific to their experimental setup |
| Personalized FL outperforms global FL for institution-specific fraud | Kasyap et al. personalization study | Supported โ 5-12% improvement on local fraud patterns |
| FL has matured from proof-of-concept to deployment | Rahmaniar et al. survey | Partially supported โ deployment-focused work exists, but large-scale production deployments remain limited |
Open Questions and Future Directions
The heterogeneity gap. Babar et al. show 8-15% degradation with non-IID data. Can this gap be closed, or is it a fundamental cost of privacy preservation? Approaches like FedProx and SCAFFOLD reduce but do not eliminate it.Regulatory alignment. Healthcare (HIPAA, GDPR) and finance (PSD2, AI Act) have different regulatory frameworks. FL frameworks that work for one domain may not satisfy the requirements of another. Cross-domain frameworks are needed.Communication efficiency at scale. Most FL studies involve 5-20 participating nodes. Real hospital networks or banking consortia may involve hundreds. Communication overhead scales with participant count, and current compression techniques may be insufficient.Adversarial robustness. FL is vulnerable to poisoning attacks where a malicious participant submits corrupted gradients. In healthcare and finance, the consequences of a poisoned model are severe. Robust aggregation methods exist but add computational and communication overhead.Incentive design. Why should institutions participate in FL? The benefits are asymmetricโinstitutions with less data benefit more from collaboration. Without proper incentive mechanisms, the institutions with the best data may decline to participate.What This Means for Practitioners
The message from this body of work is cautiously optimistic. FL works for both healthcare imaging and financial fraud detection, but deploying it requires careful attention to data heterogeneity, framework selection, and regulatory compliance. For healthcare institutions evaluating FL, Gupta et al.'s framework comparison provides a practical starting point. For financial institutions, the combination of personalized FL (Kasyap et al.) with privacy-preserving aggregation (Abadi et al.) represents the current best practice.
The gap between academic benchmarks and production deployment remains the field's central challenge. Closing it requires not just algorithmic advances but engineering maturity in areas like monitoring, debugging, and model governance.
Explore related work through ORAA ResearchBrain.
๋ฉด์ฑ
์กฐํญ: ์ด ํฌ์คํธ๋ ์ ๋ณด ์ ๊ณต์ ๋ชฉ์ ์ผ๋ก ํ ์ฐ๊ตฌ ๋ํฅ ๊ฐ์์ด๋ค. ํ์ ์ฐ๊ตฌ์์ ์ธ์ฉํ๊ธฐ ์ ์ ๊ตฌ์ฒด์ ์ธ ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ํต๊ณ ๋ฐ ์ฃผ์ฅ์ ์๋ณธ ๋
ผ๋ฌธ์ ํตํด ๋ฐ๋์ ๊ฒ์ฆํด์ผ ํ๋ค.
์๋ฃ ๋ฐ ๊ธ์ต ๋ถ์ผ์ ์ฐํฉ ํ์ต: ์ด๋ก ์์ ์ค์ ๋ฐฐํฌ๊น์ง
์ฐํฉ ํ์ต(Federated Learning)์ ํ๋ ๋จธ์ ๋ฌ๋์ ํต์ฌ์ ์ธ ๊ธด์ฅ ๊ด๊ณ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๊ณ ์๋์๋ค. ์ฆ, ์ฐ์ํ ๋ชจ๋ธ์ ํ๋ จํ๋ ค๋ฉด ํฌ๊ณ ๋ค์ํ ๋ฐ์ดํฐ์
์ด ํ์ํ์ง๋ง, ํ์ํ ๋ฐ์ดํฐ๋ ๊ณต์ ํ ์ ์๊ฑฐ๋ ๊ณต์ ํด์๋ ์ ๋๋ ๋ณ์๊ณผ ์ํ ๋ด์ ๊ฐํ ์๋ค. ์ด๋ก ์ ์ฐ์ํ๋ค. ๋ก์ปฌ์์ ๋ชจ๋ธ์ ํ๋ จํ๊ณ , ๊ทธ๋๋์ธํธ(gradient)๋ง ๊ณต์ ํ๋ฉฐ, ์ค์์์ ์ง๊ณํ๋ฉด ๋๋ค. ํ์ง๋ง ๋ฐฐํฌ์ ์ด์ ์ ๋ง์ถ ์ฐ๊ตฌ๋ค์ด ์ ์ ๋์ด๋๋ฉด์ ๋๋ฌ๋๋ ์ค์ ์์์ ์๋นํ ๋ณต์กํ๋ค. ๋ฐ์ดํฐ ์ด์ง์ฑ(data heterogeneity), ํต์ ์ค๋ฒํค๋, ๊ทธ๋ฆฌ๊ณ ๋ฒค์น๋งํฌ ์ฑ๋ฅ๊ณผ ์ค์ ํ์ฉ์ฑ ์ฌ์ด์ ๊ฒฉ์ฐจ๋ ์ด๋ค ๋จ์ผ ํ๋ ์์ํฌ๋ ํด๊ฒฐํ์ง ๋ชปํ ๊ณ ์ง์ ์ธ ๋ฌธ์ ๋ก ๋จ์ ์๋ค.
์ฐ๊ตฌ ํํฉ
์๋ฃ ์์: ์ ๋์ ์ธ ๋ฐฐํฌ ๋๋ฉ์ธ
์ฐํฉ ํ์ต์ ์๋ฃ ์์ ๋ถ์ผ์์ ๊ฐ์ฅ ์์ฐ์ค๋ฌ์ด ์ ์ฉ์ฒ๋ฅผ ์ฐพ์๋ค. ํ์ ๋ฐ์ดํฐ๋ ๋ฏผ๊ฐ๋๊ฐ ๋งค์ฐ ๋์ ๋์์, ์๋ก ๋ค๋ฅธ ์ฅ๋น, ํ๋กํ ์ฝ, ํ์ ์ง๋จ์ ๋ณด์ ํ ๊ธฐ๊ด๋ค์ ๋ถ์ฐ๋์ด ์๊ธฐ ๋๋ฌธ์ด๋ค.
Babar et al. (2024)์ ๋ฐ์ดํฐ ์ด์ง์ฑ์ด FL ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ์ ๋ํด ๊ฐ์ฅ ์ค์ฆ์ ์ผ๋ก ๊ทผ๊ฑฐ ์๋ ๋ถ์์ ์ ์ํ๋ค. ๊ธฐ๊ด ๊ฐ ์ฐจ์ด๋ฅผ ์๋ฎฌ๋ ์ด์
ํ๊ธฐ ์ํด COVIDx CXR-3 ํ๋ถ X์ ๋ฐ์ดํฐ์
์ ์ฌ๋ฌ ๋
ธ๋์ ๋ถํ ํ์ฌ ํ์ฉํ ์ด๋ค์ ์ฐ๊ตฌ๋, non-IID(๋น๋
๋ฆฝ๋์ผ๋ถํฌ) ๋ฐ์ดํฐ ๋ถํ ์ด ์ค์์ง์ค์ ํ๋ จ ๋๋น FedAvg ์ฑ๋ฅ์ ์ ์๋ฏธํ๊ฒ ์ ํ์ํจ๋ค๋ ์ ์ ์
์ฆํ๋ค. ์ด๋ ๋๋ผ์ด ๋ฐ๊ฒฌ์ ์๋์ง๋ง, ์ด์ง์ฑ ์กฐ๊ฑด ์ ๋ฐ์ ๊ฑธ์น ์ฒด๊ณ์ ์ธ ์ ๋ํ๋ ํ์ ์ฐ๊ตฌ์ ํ ๋๊ฐ ๋๋ ์ ๋ขฐํ ๋งํ ๊ธฐ์ค์ ์ ์ ๊ณตํ๋ค.
Mastoi et al. (2025)์ MRI ์ค์บ์ ํตํ ๋์ข
์ ๋ถ๋ฅ์ FL๊ณผ ์ค๋ช
๊ฐ๋ฅํ AI(explainable AI)๋ฅผ ๊ฒฐํฉํ๋ค. ์ด๋ค์ ํ๋ ์์ํฌ๋ ๊ฒฝ์๋ ฅ ์๋ ๋ถ๋ฅ ์ ํ๋๋ฅผ ๋ฌ์ฑํ๋ ๋์์, ์ด๋ค ์ด๋ฏธ์ง ์์ญ์ด ์์ธก์ ์ฃผ๋ํ๋์ง ๋ณด์ฌ์ฃผ๋ ํด์ ๊ฐ๋ฅํ ์ดํ
์
๋งต(attention map)์ ์ ๊ณตํ๋ค. ์ค๋ช
๊ฐ๋ฅ์ฑ ์์๋ ์ค์ ๋ฐฐํฌ์ ์ฅ๋ฒฝ์ ํด์ํ๋ค. ์์์๋ค์ ์ง๋จ ์ํฉ์์ ๋ธ๋๋ฐ์ค ์์ธก์ ์ ๋ขฐํ๊ธฐ๋ฅผ ๊บผ๋ฆฌ๋๋ฐ, FL์ ์์์๊ฐ ํ ๋ฒ๋ ๋ณธ ์ ์๋ ๋ฐ์ดํฐ๋ก ๋ชจ๋ธ์ด ํ๋ จ๋์๋ค๋ ์ ์์ ๋ถํฌ๋ช
์ฑ์ ํ ์ธต ๋ ๊ฐ์ค์ํค๊ธฐ ๋๋ฌธ์ด๋ค.
Gupta et al. (2025)์ ์๋ฃ ์์ ๋ฐฐํฌ๋ฅผ ์ํ ์ธ ๊ฐ์ง ์ฃผ์ FL ํ๋ ์์ํฌโNVIDIA FLARE, Flower, Owkin Substraโ๋ฅผ ๋ฒค์น๋งํฌ ํ๊ฐํ๋ค. ์ด ๋น๊ต ํ๊ฐ๋ ํ์ ๋
ผ๋ฌธ์ด ์ข
์ข
๊ฐ๊ณผํ๋ ์ค์ฉ์ ์ง๋ฌธ์ ๋ค๋ฃฌ๋ค. ๊ธฐ๊ด์ด ์ค์ ๋ก ์ด๋ค ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํด์ผ ํ๋๊ฐ? ์ด๋ค์ ์ฐ๊ตฌ ๊ฒฐ๊ณผ์ ๋ฐ๋ฅด๋ฉด, NVIDIA FLARE๋ ํ๋ก๋์
๋ฐฐํฌ๋ฅผ ์ํ ๊ฐ์ฅ ์ฑ์ํ ์ธํ๋ผ๋ฅผ ์ ๊ณตํ๊ณ , Flower๋ ์ฐ๊ตฌ๋ฅผ ์ํ ๊ฐ์ฅ ๋์ ์ ์ฐ์ฑ์ ์ ๊ณตํ๋ฉฐ, Substra๋ ๊ท์ ์ค์๋ฅผ ์ฐ์ ์ํ๋ค.
Rahmaniar et al. (2025)์ ์๋ฃ ์์ ๋ถ์ผ FL์ ๋ ๋์ ํํฉ์ ๊ฐ๊ดํ๋ฉฐ, ํด๋น ๋ถ์ผ์ ๋ฐ์ ์ ์ธ ๋จ๊ณ๋ก ๊ตฌ๋ถํ๋ค. ์ด๊ธฐ ๊ฐ๋
์ฆ๋ช
์ฐ๊ตฌ(2019-2021), ๋ฒค์น๋งํฌ ๊ฐ๋ฐ(2022-2023), ๊ทธ๋ฆฌ๊ณ ๋ฐฐํฌ ์ค์ฌ ์ฐ๊ตฌ(2024-2025)๊ฐ ๊ทธ๊ฒ์ด๋ค. ์ด๋ค์ ํด๋น ๋ถ์ผ๊ฐ FL์ด ์๋ํ ์ ์์์ ์
์ฆํ๋ ๋จ๊ณ์์ ์ธ์ , ์ด๋ป๊ฒ ๋ฐฐํฌํด์ผ ํ๋์ง๋ฅผ ์ดํดํ๋ ๋จ๊ณ๋ก ์ ํ ์ค์ด๋ผ๊ณ ์ฃผ์ฅํ๋ค.
๊ธ์ต ์ฌ๊ธฐ ํ์ง: ๋ ๋ฒ์งธ ๋ฌผ๊ฒฐ
๊ธ์ต ๋ถ์ผ๋ FL์ ๋ ๋ฒ์งธ ์ฃผ์ ๋ฐฐํฌ ๋๋ฉ์ธ์ผ๋ก, ํน์ ํ ๋ฌธ์ ๊ตฌ์กฐ์ ์ํด ์ฃผ๋๋๋ค. ์ฌ๊ธฐ ๊ฑฐ๋๋ ๊ธฐ๊ด๋ค์ ๋ถ์ฐ๋ ํฌ๊ท ์ฌ๊ฑด์ด๋ฉฐ, ์ด๋ค ๋จ์ผ ์ํ๋ ๊ฐ๋ ฅํ ํ์ง๊ธฐ๋ฅผ ๋จ๋
์ผ๋ก ํ๋ จํ ๋งํผ ์ถฉ๋ถํ ์ฌ๊ธฐ ๋ฐ์ดํฐ๋ฅผ ๋ณด์ ํ์ง ๋ชปํ๋ค.
Abadi et al. (2024)์ ๊ธ์ต ์ฌ๊ธฐ ํ์ง๋ฅผ ์ํด ํน๋ณํ ์ค๊ณ๋ ํ๋ผ์ด๋ฒ์ ๋ณด์กด FL ํ๋ ์์ํฌ์ธ Starlit์ ์ ์ํ๋ค. Starlit์ ํ์ค FL์ ํ๊ณ๋ฅผ ํด๊ฒฐํ๋ค. ๊ทธ๋๋์ธํธ ๊ณต์ ๋ง์ผ๋ก๋ ๊ฐ๋ณ ๊ฑฐ๋ ์ ๋ณด๊ฐ ์ ์ถ๋ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค. ์ด๋ค์ ํ๋ ์์ํฌ๋ ํ์ค FL์ ์ฐจ๋ฑ ํ๋ผ์ด๋ฒ์(differential privacy)์ ๋ณด์ ์ง๊ณ(secure aggregation)๋ฅผ ์ถ๊ฐํ์ฌ, ์ค์์ง์ค์ ๊ธฐ์ค์ ์ ๊ทผ์ ํ ํ์ง ์ฑ๋ฅ์ ์ ์งํ๋ฉด์ ์ ๋ณด ์ ์ถ ์ํ์ ์ค์ธ๋ค.
Aljunaid et al. (2025)โ์ด ์ฝํธํธ์์ ๊ฐ์ฅ ๋์ ์ธ์ฉ ์๋ฅผ ๊ธฐ๋กํ ์ฐ๊ตฌโ๋ ์ํ ์ฌ๊ธฐ ํ์ง๋ฅผ ์ํด FL๊ณผ ์ค๋ช
๊ฐ๋ฅํ AI๋ฅผ ๊ฒฐํฉํ๋ค. ์ด๋ค์ ์ ๊ทผ ๋ฐฉ์์ ๋์ ํ์ง ์ ํ๋๋ฅผ ๋ฌ์ฑํ๋ ๋์์, ๋ชจ๋ธ ํด์ ๊ฐ๋ฅ์ฑ์ ๋ํ ๊ท์ ์๊ฑด์ ์ถฉ์กฑํ๋ ํน์ฑ ์ค์๋ ์ค๋ช
์ ์ ๊ณตํ๋ค. ๋์ ์ธ์ฉ ์๋ ์ค์ฉ์ ํ์๋ค์ ์๋ ด์ ๋ฐ์ํ๋ค. ์ํ์ ์๋ํ๋ ์ฌ๊ธฐ ํ์ง ์์คํ
์ด ํ์ํ๊ณ , ๊ท์ ๊ธฐ๊ด์ ์ค๋ช
์ ์๊ตฌํ๋ฉฐ, ๊ฐ์ธ์ ๋ณด ๋ณดํธ๋ฒ์ ๋ฐ์ดํฐ ๊ณต์ ๋ฅผ ๊ธ์งํ๋ค.
Kasyap et al. (2024)์ ๊ธ์ต ๋ถ์ผ FL์์์ ๊ฐ์ธํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃฌ๋ค. ํ์ค FL์ ๋จ์ผ ๊ธ๋ก๋ฒ ๋ชจ๋ธ์ ์์ฑํ์ง๋ง, ์ํ๋ง๋ค ์ฌ๊ธฐ ํจํด, ๊ณ ๊ฐ ๊ธฐ๋ฐ, ๋ฆฌ์คํฌ ํ๋กํ์ผ์ด ๋ค๋ฅด๋ค. ์ด๋ค์ ๊ฐ์ธํ๋ FL ์ ๊ทผ ๋ฐฉ์์ ๊ฐ ์ฐธ์ฌ ๊ธฐ๊ด์ด ํ๋ ฅ ํ์ต์ ์ด์ ์ ์ ์งํ๋ฉด์๋ ๋ก์ปฌ์ ์ ์๋ ๋ชจ๋ธ์ ์ ์งํ ์ ์๋๋ก ํ์ฌ, ๊ธ๋ก๋ฒ ๋ชจ๋ธ์ด ๋ฌ์ฑํ๋ ์์ค์ ๋์ด์๋ ๊ธฐ๊ด๋ณ ์ฌ๊ธฐ ํจํด ํ์ง๋ฅผ ๊ฐ์ ํ๋ค.
๋นํ์ ๋ถ์: ์ฃผ์ฅ๊ณผ ๊ทผ๊ฑฐ
<
| ์ฃผ์ฅ | ๊ทผ๊ฑฐ | ํ์ |
|---|
| ๋ฐ์ดํฐ ์ด์ง์ฑ์ FL ์ฑ๋ฅ์ ์๋ฏธ ์๊ฒ ์ ํ์ํจ๋ค | Babar et al. ์ฒด๊ณ์ ํ๊ฐ | ์ง์ง๋จ โ ์กฐ๊ฑด ์ ๋ฐ์ ๊ฑธ์ณ ์ผ๊ด๋ ๋ฐ๊ฒฌ |
| ์ค๋ช
๊ฐ๋ฅํ FL์ ์์์ ์ ๋ขฐ์ ๋์
์ ํฅ์์ํจ๋ค | Mastoi et al. ๋์ข
์ ์ฐ๊ตฌ | ๋ถ๋ถ์ ์ผ๋ก ์ง์ง๋จ โ ์ค๋ช
๊ฐ๋ฅ์ฑ์ ์
์ฆ๋์์ผ๋, ๋์
์ํฅ์ ๊ฐ์ ๋ ๊ฒ |
| NVIDIA FLARE๊ฐ ํฌ์ค์ผ์ด ๋ถ์ผ์์ ๊ฐ์ฅ ๋ฐฐํฌ ์ค๋น๊ฐ ๋ ํ๋ ์์ํฌ์ด๋ค | Gupta et al. ํ๋ ์์ํฌ ๋ฒค์น๋งํฌ | ํ์ฌ ์ํ์ ๋ํด ์ง์ง๋จ โ ๋จ, ํ๋ ์์ํฌ๋ ๋น ๋ฅด๊ฒ ๋ฐ์ ํจ |
| ํ๋ผ์ด๋ฒ์ ๋ณด์กด FL์ ์ค์ํ ๋ฐฉ์์ ๊ทผ์ ํ ํ์ง ์ฑ๋ฅ์ ์ ์งํ๋ค | Abadi et al. Starlit | ์ง์ง๋จ โ ๋จ, ์ด๋ค์ ์คํ ์ค์ ์ ํ์ ๋จ |
| ๊ฐ์ธํ๋ FL์ ๊ธฐ๊ด๋ณ ์ฌ๊ธฐ ํ์ง์์ ๊ธ๋ก๋ฒ FL์ ๋ฅ๊ฐํ๋ค | Kasyap et al. ๊ฐ์ธํ ์ฐ๊ตฌ | ์ง์ง๋จ โ ๋ก์ปฌ ์ฌ๊ธฐ ํจํด์์ 5-12% ํฅ์ |
| FL์ ๊ฐ๋
์ฆ๋ช
๋จ๊ณ์์ ๋ฐฐํฌ ๋จ๊ณ๋ก ์ฑ์ํ๋ค | Rahmaniar et al. ์๋ฒ ์ด | ๋ถ๋ถ์ ์ผ๋ก ์ง์ง๋จ โ ๋ฐฐํฌ ์ค์ฌ ์ฐ๊ตฌ๋ ์กด์ฌํ๋, ๋๊ท๋ชจ ์ค์ ๋ฐฐํฌ๋ ์ฌ์ ํ ์ ํ์ |
๋ฏธํด๊ฒฐ ๊ณผ์ ์ ํฅํ ๋ฐฉํฅ
์ด์ง์ฑ ๊ฒฉ์ฐจ. Babar et al.์ non-IID ๋ฐ์ดํฐ์์ 8-15%์ ์ฑ๋ฅ ์ ํ๋ฅผ ๋ณด์ธ๋ค. ์ด ๊ฒฉ์ฐจ๋ ๊ทน๋ณต๋ ์ ์๋๊ฐ, ์๋๋ฉด ํ๋ผ์ด๋ฒ์ ๋ณด์กด์ ๊ทผ๋ณธ์ ์ธ ๋น์ฉ์ธ๊ฐ? FedProx ๋ฐ SCAFFOLD ๊ฐ์ ์ ๊ทผ ๋ฐฉ์์ ์ด๋ฅผ ๊ฐ์์ํค์ง๋ง ์์ ํ ์ ๊ฑฐํ์ง๋ ๋ชปํ๋ค.๊ท์ ์ ํฉ์ฑ. ํฌ์ค์ผ์ด(HIPAA, GDPR)์ ๊ธ์ต(PSD2, AI Act)์ ์๋ก ๋ค๋ฅธ ๊ท์ ์ฒด๊ณ๋ฅผ ๊ฐ์ง๋ค. ํ ๋๋ฉ์ธ์ ์ ํฉํ FL ํ๋ ์์ํฌ๊ฐ ๋ค๋ฅธ ๋๋ฉ์ธ์ ์๊ฑด์ ์ถฉ์กฑํ์ง ๋ชปํ ์ ์๋ค. ํฌ๋ก์ค ๋๋ฉ์ธ ํ๋ ์์ํฌ๊ฐ ํ์ํ๋ค.๋๊ท๋ชจ ํ๊ฒฝ์์์ ํต์ ํจ์จ์ฑ. ๋๋ถ๋ถ์ FL ์ฐ๊ตฌ๋ 5-20๊ฐ์ ์ฐธ์ฌ ๋
ธ๋๋ฅผ ํฌํจํ๋ค. ์ค์ ๋ณ์ ๋คํธ์ํฌ๋ ์ํ ์ปจ์์์์ ์๋ฐฑ ๊ฐ๋ฅผ ํฌํจํ ์ ์๋ค. ํต์ ์ค๋ฒํค๋๋ ์ฐธ์ฌ์ ์์ ๋ฐ๋ผ ์ฆ๊ฐํ๋ฉฐ, ํ์ฌ์ ์์ถ ๊ธฐ์ ๋ก๋ ๋ถ์กฑํ ์ ์๋ค.์ ๋์ ๊ฒฌ๊ณ ์ฑ. FL์ ์
์์ ์ธ ์ฐธ์ฌ์๊ฐ ์์๋ ๊ทธ๋๋์ธํธ๋ฅผ ์ ์ถํ๋ ํฌ์ด์ฆ๋ ๊ณต๊ฒฉ์ ์ทจ์ฝํ๋ค. ํฌ์ค์ผ์ด์ ๊ธ์ต์์ ์ค์ผ๋ ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ ์ฌ๊ฐํ๋ค. ๊ฒฌ๊ณ ํ ์ง๊ณ ๋ฐฉ๋ฒ์ด ์กด์ฌํ์ง๋ง ๊ณ์ฐ ๋ฐ ํต์ ์ค๋ฒํค๋๋ฅผ ์ถ๊ฐํ๋ค.์ธ์ผํฐ๋ธ ์ค๊ณ. ๊ธฐ๊ด์ ์ FL์ ์ฐธ์ฌํด์ผ ํ๋๊ฐ? ์ด์ ์ ๋น๋์นญ์ ์ด๋คโ๋ฐ์ดํฐ๊ฐ ์ ์ ๊ธฐ๊ด์ด ํ๋ ฅ์ผ๋ก๋ถํฐ ๋ ๋ง์ ์ด์ต์ ์ป๋๋ค. ์ ์ ํ ์ธ์ผํฐ๋ธ ๋ฉ์ปค๋์ฆ ์์ด๋ ์ต์์ ๋ฐ์ดํฐ๋ฅผ ๋ณด์ ํ ๊ธฐ๊ด์ด ์ฐธ์ฌ๋ฅผ ๊ฑฐ๋ถํ ์ ์๋ค.์ค๋ฌด์์๊ฒ ์ฃผ๋ ์์ฌ์
์ด ์ฐ๊ตฌ๋ค์ด ์ ํ๋ ๋ฉ์์ง๋ ์ ์คํ๊ฒ ๋๊ด์ ์ด๋ค. FL์ ํฌ์ค์ผ์ด ์์๊ณผ ๊ธ์ต ์ฌ๊ธฐ ํ์ง ๋ชจ๋์์ ํจ๊ณผ์ ์ด์ง๋ง, ๋ฐฐํฌ๋ฅผ ์ํด์๋ ๋ฐ์ดํฐ ์ด์ง์ฑ, ํ๋ ์์ํฌ ์ ํ, ๊ท์ ์ค์์ ๋ํ ์ธ์ฌํ ์ฃผ์๊ฐ ํ์ํ๋ค. FL์ ํ๊ฐ ์ค์ธ ํฌ์ค์ผ์ด ๊ธฐ๊ด์๊ฒ๋ Gupta et al.์ ํ๋ ์์ํฌ ๋น๊ต๊ฐ ์ค์ฉ์ ์ธ ์ถ๋ฐ์ ์ ์ ๊ณตํ๋ค. ๊ธ์ต ๊ธฐ๊ด์๊ฒ๋ ๊ฐ์ธํ๋ FL(Kasyap et al.)๊ณผ ํ๋ผ์ด๋ฒ์ ๋ณด์กด ์ง๊ณ(Abadi et al.)์ ๊ฒฐํฉ์ด ํ์ฌ์ ๋ชจ๋ฒ ์ฌ๋ก๋ฅผ ๋ํํ๋ค.
ํ์ ๋ฒค์น๋งํฌ์ ์ค์ ๋ฐฐํฌ ์ฌ์ด์ ๊ฒฉ์ฐจ๋ ์ด ๋ถ์ผ์ ํต์ฌ ๊ณผ์ ๋ก ๋จ์ ์๋ค. ์ด๋ฅผ ํด์ํ๊ธฐ ์ํด์๋ ์๊ณ ๋ฆฌ์ฆ์ ๋ฐ์ ๋ฟ๋ง ์๋๋ผ ๋ชจ๋ํฐ๋ง, ๋๋ฒ๊น
, ๋ชจ๋ธ ๊ฑฐ๋ฒ๋์ค ๋ฑ์ ์์ญ์์ ์์ง๋์ด๋ง ์ฑ์๋๊ฐ ์๊ตฌ๋๋ค.
๊ด๋ จ ์ฐ๊ตฌ๋ ORAA ResearchBrain์ ํตํด ํ์ํ ์ ์๋ค.
References (8)
[1] Babar, M., Qureshi, B., & Koubaa, A. (2024). Investigating the impact of data heterogeneity on the performance of federated learning algorithm using medical imaging. PLoS ONE, 19.
[2] Mastoi, Q., Latif, S., & Brohi, S. (2025). Explainable AI in medical imaging: an interpretable and collaborative federated learning model for brain tumor classification. Frontiers in Oncology.
[3] Gupta, R., Chowdhury, A., & Nalawade, S. (2025). Benchmarking Federated Learning Frameworks for Medical Imaging Deployment: A Comparative Study of NVIDIA FLARE, Flower, and Owkin Substra. arXiv preprint.
[4] Rahmaniar, W., Deng, Z., & Yang, Y. (2025). Future of the Medical World: Collaborative Medical Imaging AI With Federated Learning. IEEE Consumer Electronics Magazine.
[5] Abadi, A., Doyle, B., & Gini, F. (2024). Starlit: Privacy-Preserving Federated Learning to Enhance Financial Fraud Detection. IEEE FLTA.
[6] Aljunaid, S., Almheiri, S., & Dawood, H. (2025). Secure and Transparent Banking: Explainable AI-Driven Federated Learning Model for Financial Fraud Detection. JRFM, 18(4), 179.
[7] Kasyap, H., Atmaca, U., & Maple, C. (2024). Privacy-preserving personalised federated learning financial fraud detection. IET Conference Proceedings.
Hu, J., Yang, Z., Wang, P., Zhao, G., Huang, H., Zong, Z., et al. (2025). Federated Learning for Medical Image Analysis: Privacy-Preserving Paradigms and Clinical Challenges. Transactions on Artificial Intelligence.