36 lines
2.8 KiB
Markdown
36 lines
2.8 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-TFPR-001
|
|
category: "[[10_Wiki/💡 Topics/AI]]"
|
|
confidence_score: 0.94
|
|
tags: [auto-reinforced, optimization, metrics, goal-alignment, profiling, objective-function]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Target-Function-Profiling]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "성공의 지점 정의하기: 시스템이 도달해야 할 궁극적인 목표(목적 함수)를 다각도에서 분석하고 세분화하여, 학습과 최적화의 방향이 길을 잃지 않도록 정밀한 나침반을 제작하는 작업."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
대상 함수 프로파일링(Target-Function-Profiling)은 최적화하고자 하는 핵심적인 목적 함수(Objective Function)나 타겟 함수에 영향을 미치는 변수들의 기여도와 특성을 정밀하게 분석하는 기법입니다.
|
|
|
|
1. **프로파일링 요소**:
|
|
* **Sensitivity Analysis**: 어떤 변수의 변화가 타겟 함수의 값을 가장 민감하게 흔드는가?
|
|
* **Landscape Analysis**: 함수의 형상이 매끄러운가(Convex), 아니면 곳곳에 함정(Local Minima)이 많은 험난한 지형인가?
|
|
* **Constraints Check**: 타겟이 달성해야 할 물리적, 논리적 한계 조건(Boundaries) 설정.
|
|
2. **시스템 최적화에서의 역할**:
|
|
* 무작정 최적화 알고리즘(예: SGD)을 돌리기 전에, 타겟의 수단과 방법을 명확히 함으로써 '엉뚱한 최적화(Reward Hacking)' 방지.
|
|
* **Multi-objective Balancing**: 여러 상충하는 타겟들 사이의 비중(Weights)을 동적으로 조율.
|
|
3. **적용 사례**:
|
|
* **강화학습**: 보상 함수의 보상 체계 프로파일링을 통해 에이전트의 오작동 방지.
|
|
* **제조 공정**: 수율 최대화라는 타겟 함수에 영향을 미치는 핵심 공정 변수 식별.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 단순히 하나의 숫자(KPI)만 높이면 성공이라 믿었으나, 현대의 복합 시스템 정책은 타겟 달성 과정에서의 부작용까지 변수로 반영하는 '입체적 타겟 리포트 정책'을 핵심 지침으로 삼음(RL Update).
|
|
- **정책 변화(RL Update)**: AI 모델의 성능 지표 수립 시, 단순히 정확도(Accuracy)라는 타겟을 넘어 공정성(Fairness)과 설명 가능성(Explainability)을 타겟 함수의 필수 프로파일링 항목으로 포함시키는 '다차원 평가지표 수립 정책'이 상설 운영됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Sensitivity-Analysis]], [[Operations-Research]], [[Performance Management Systems]], [[Reinforcement Learning (RL)]], [[Ps-Reinforce]]
|
|
- **Modern Tech/Tools**: Profiling toolkits, Objective function visualizers, Python (Optuna, Hyperopt).
|
|
---
|