[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
+4 -4
View File
@@ -1,8 +1,8 @@
---
id: P-REINFORCE-AI-LORA
id: [[P-Reinforce]]-AI-LORA
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.00
tags: [AI, LLM, LoRA, FineTuning, Efficiency]
tags: [AI, LLM, LoRA, FineTuning, [[Efficiency]]]
last_reinforced: 2026-04-20
---
@@ -21,8 +21,8 @@ last_reinforced: 2026-04-20
- 수 기가바이트의 모델 대신 수 메가바이트의 'LoRA 가중치 파일'만 저장하고 공유하면 됨.
## ⚠️ 모순 및 업데이트 (RL Update)
- LoRA는 효율적이지만, 대규모 멀티 모달 학습이나 근본적인 기초 지식 습득에는 전체 파인튜닝(Full Fine-tuning)보다 성능이 소폭 떨어질 수 있다. 이를 보완하기 위해 양자화 기술을 결합한 **QLoRA**가 등장하여, 일반 소비자용 그래픽카드 한 장으로도 거대 언어 모델을 튜닝하는 'AI 민주화'를 이끌고 있다.
- LoRA는 효율적이지만, 대규모 멀티 모달 학습이나 근본적인 기초 지식 습득에는 전체 파인튜닝(Full [[Fine-tuning]])보다 성능이 소폭 떨어질 수 있다. 이를 보완하기 위해 양자화 기술을 결합한 **QLoRA**가 등장하여, 일반 소비자용 그래픽카드 한 장으로도 거대 언어 모델을 튜닝하는 'AI 민주화'를 이끌고 있다.
## 🔗 지식 연결 (Graph)
- Related: [[Instruction-Tuning]] , Quantization (양자화)
- Related: [[Instruction-Tuning]] , [[Quantization]] (양자화)
- Variant: QLoRA (Quantized LoRA)