[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,8 +1,8 @@
|
||||
---
|
||||
id: P-REINFORCE-AUTO-ZFS-001
|
||||
id: [[P-Reinforce]]-AUTO-ZFS-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.99
|
||||
tags: [auto-reinforced, few-shot, zero-shot, in-context-learning, prompting, llm]
|
||||
tags: [auto-reinforced, few-shot, zero-shot, [[In-Context-Learning]], [[prompt]]ing, llm]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
@@ -25,10 +25,10 @@ last_reinforced: 2026-04-20
|
||||
3. **One-Shot Learning**: 예시를 딱 하나만 주는 중간 단계.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌**: 과거에는 새로운 태스크를 위해 수만 개의 데이터를 통한 전인 교육(Fine-tuning)이 필수였으나, 현대의 LLM 정책은 단 몇 개의 예시만으로도 전문 지식을 흉내 내는 'In-context Learning 정책'만으로도 충분한 성능을 낼 수 있음을 증명함(RL Update).
|
||||
- **과거 데이터와의 충돌**: 과거에는 새로운 태스크를 위해 수만 개의 데이터를 통한 전인 교육([[Fine-tuning]])이 필수였으나, 현대의 LLM 정책은 단 몇 개의 예시만으로도 전문 지식을 흉내 내는 'In-context Learning 정책'만으로도 충분한 성능을 낼 수 있음을 증명함(RL Update).
|
||||
- **정책 변화(RL Update)**: 데이터 개인정보 보호 정책이 강화됨에 따라, 데이터를 모델에 주입해 학습시키지 않고 프롬프트 수준에서만 활용하여 휘발시키는 '프라이버시 친화적 제로샷 추론 정책'이 기업용 AI 활용의 표준이 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Foundational Models, [[Prompt-Engineering]], [[Transfer Learning]], [[SFT (Supervised Fine-Tuning)]], NLP (자연어 처리)
|
||||
- **Modern Tech/Tools**: LangChain prompt templates, Meta Llama-3 few-shot benchmarks.
|
||||
- **Modern Tech/Tools**: LangChain prompt templates, Meta Llama-3 few-shot [[Benchmarks]].
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user