34 lines
2.6 KiB
Markdown
34 lines
2.6 KiB
Markdown
---
|
|
id: [[P-Reinforce|P-Reinforce]]-AUTO-EDAI-001
|
|
category: Dev
|
|
confidence_score: 0.96
|
|
tags: [auto-reinforced, edge-ai, on-device-ai, privacy, low-latency, bandwidth, [[Distributed-Computing|Distributed-Computing]], [[Hardware|Hardware]]-acceleration]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Edge-Artificial-Intelligence|Edge-Artificial-Intelligence]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "네트워크 없이 숨 쉬는 지능: 거대 클라우드 서버에 물어보지 않고, 스마트폰, CCTV, 드론, 심지어 커피 머신 속의 작은 칩에서 AI가 실시간으로 판단하고 학습하게 함으로써 속도는 높이고 사생활 침해는 막는 분산형 지능 구조."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
엣지 AI(Edge-[[Artificial-Intelligence|Artificial-Intelligence]])는 데이터가 생성되는 현장(Edge) 기기에서 실시간으로 AI 알고리즘을 처리하는 기술입니다.
|
|
|
|
1. **4대 장점**:
|
|
* **Low Latency**: 서버 통신이 필요 없어 즉각적인 반응 가능 (자율주행, 산업용 로봇).
|
|
* **Privacy**: 민감한 데이터를 외부로 보내지 않고 기기 안에서 처리. (Security와 연결)
|
|
* **Bandwidth [[Efficiency|Efficiency]]**: 원본 데이터를 모두 전송할 필요 없이 핵심 결과만 전송하여 네트워크 부하 감소.
|
|
* **[[Reliability|Reliability]]**: 오프라인 상태에서도 작동 보장.
|
|
2. **핵심 기술**:
|
|
* **Model Compression**: 가중치 가지치기(Pruning), 양자화([[Quantization|Quantization]]). ([[Optimization|Optimization]]와 연결)
|
|
* **NPU (Neural [[Processing|Processing]] Unit)**: AI 연산에 특화된 저전력 전용 칩셋.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 "성능 좋은 AI는 무조건 커야 한다"는 대규모 정책(Big models)만 고집했으나, 현대 정책은 엣지에서 돌아가는 작지만 강력한 최적화 정책(SLM, TinyML)이 실제 서비스의 도달 범위 정책을 결정함을 인정함(RL Update).
|
|
- **정책 변화(RL Update)**: 이제는 단순 추론 정책(Inference)을 넘어, 각 기기에서 수집한 데이터로 현지화 학습 정책을 수행하고 그 결과만 공유하는 '연합 학습 정책(Federated Learning)'으로 진화 중임. ([[Reinforcement Learning (RL)|Reinforcement Learning (RL)]]와 연결)
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- Security, [[Optimization|Optimization]], [[Reinforcement Learning (RL)|Reinforcement Learning (RL)]], [[Efficiency|Efficiency]], [[Architecture|Architecture]], Automation
|
|
- **Key Platforms**: Apple Neural Engine, NVIDIA Jetson, Google Coral.
|
|
---
|