# Self-verification (μžκ°€ 검증) ## πŸ“Œ Brief Summary Self-verification(μžκ°€ 검증)은 AI μ—μ΄μ „νŠΈκ°€ μž‘μ—…μ„ 마친 ν›„ ν˜Ήμ€ μ‹€ν–‰ 도쀑에 μžμ‹ μ˜ 좜λ ₯λ¬Όμ΄λ‚˜ 행동 κ²°κ³Όκ°€ μš”μ²­λœ μš”κ΅¬μ‚¬ν•­μ„ μΆ©μ‘±ν–ˆλŠ”μ§€, 였λ₯˜λŠ” μ—†λŠ”μ§€ 슀슀둜 κ²€ν† ν•˜κ³  μˆ˜μ •ν•˜λŠ” ν”„λ‘œμ„ΈμŠ€μ΄λ‹€. λͺ¨λΈμ˜ ν™•λ₯ λ‘ μ  ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κ³  결과물의 신뒰성을 높이기 μœ„ν•œ 핡심적인 κΈ°λ²•μœΌλ‘œ, μ—μ΄μ „νŠΈ ν•˜λ„€μŠ€μ˜ V-component와 E-componentκ°€ ν˜‘μ—…ν•˜μ—¬ μˆ˜ν–‰ν•œλ‹€. ## πŸ“– Core Content * **검증 λ©”μ»€λ‹ˆμ¦˜ (Verification Loops)**: * **자기 λΉ„νŒ (Self-critique)**: λͺ¨λΈμ—κ²Œ "λ„€ 닡변을 λ‹€μ‹œ 읽고 였λ₯˜λ₯Ό 찾아봐"라고 μš”μ²­ν•˜μ—¬ 논리적 ν—ˆμ μ„ λ°œκ²¬ν•˜κ²Œ 함. * **정적 뢄석 톡합**: μ—μ΄μ „νŠΈκ°€ μƒμ„±ν•œ μ½”λ“œλ₯Ό Linterλ‚˜ 컴파일러λ₯Ό 톡해 싀행해보고, λ°œμƒν•œ μ—λŸ¬λ₯Ό ν”Όλ“œλ°±μœΌλ‘œ ν™œμš©. * **λ‹¨μœ„ ν…ŒμŠ€νŠΈ μ‹€ν–‰**: μ—μ΄μ „νŠΈκ°€ 슀슀둜 ν…ŒμŠ€νŠΈ μ½”λ“œλ₯Ό μž‘μ„±ν•˜κ³  μ‹€ν–‰ν•˜μ—¬ κΈ°λŠ₯의 정상 μž‘λ™ μ—¬λΆ€λ₯Ό 확인. * **κ·Όκ±° λŒ€μ‘° (Evidence Grounding)**: μƒμ„±λœ 정보가 λ©”λͺ¨λ¦¬(Evidence Memory) λ‚΄μ˜ μ‹€μ œ 데이터와 μΌμΉ˜ν•˜λŠ”μ§€ ꡐ차 검증. * **PEV (Plan-Execute-Verify) 루프**: μž‘μ—…μ„ 기획(Plan), μ‹€ν–‰(Execute)ν•œ ν›„ λ°˜λ“œμ‹œ 검증(Verify) 단계λ₯Ό κ±°μΉ˜λ„λ‘ μ›Œν¬ν”Œλ‘œμš°λ₯Ό κ΅¬μ‘°ν™”ν•˜μ—¬ 검증 λˆ„λ½μ„ λ°©μ§€ν•œλ‹€. * **ν‰κ°€μž μ—μ΄μ „νŠΈ (Evaluator Agent)**: 생성 λͺ¨λΈκ³Ό λ³„κ°œλ‘œ κ²€μ¦λ§Œμ„ μ „λ‹΄ν•˜λŠ” 독립적인 μ—μ΄μ „νŠΈλ₯Ό 두어 '자기 확증 편ν–₯'을 μ΅œμ†Œν™”ν•˜κ³  객관성을 ν™•λ³΄ν•œλ‹€. * **결정둠적 ν”Όλ“œλ°±**: λͺ¨λΈμ˜ μΆ”λ‘ μ—λ§Œ μ˜μ‘΄ν•˜μ§€ μ•Šκ³ , μ‹€μ œ μ‹€ν–‰ κ²°κ³Ό(Success/Failure)λ‚˜ μ™ΈλΆ€ 툴의 좜λ ₯값을 μ΅œμ’… κ²€μ¦μ˜ μž£λŒ€λ‘œ μ‚ΌλŠ”λ‹€. ## βš–οΈ Trade-offs & Caveats * **자기 확증 편ν–₯**: λͺ¨λΈμ€ μžμ‹ μ΄ λ§Œλ“  결과물을 μ˜³λ‹€κ³  λ―ΏμœΌλ €λŠ” κ²½ν–₯이 μžˆμ–΄, λ‹¨μˆœν•œ ν”„λ‘¬ν”„νŠΈλ§ŒμœΌλ‘œλŠ” μ‹¬κ°ν•œ 였λ₯˜λ₯Ό 놓칠 수 μžˆλ‹€. * **λΉ„μš©κ³Ό μ§€μ—° μ‹œκ°„**: λ§€ μž‘μ—…λ§ˆλ‹€ 검증 루프λ₯Ό 돌리면 토큰 μ†Œλͺ¨λŸ‰μ΄ 2~3배둜 λŠ˜μ–΄λ‚˜κ³  μ‹œμŠ€ν…œ λ°˜μ‘ 속도가 μ €ν•˜λœλ‹€. * **λ‘  루프 (Doom Loop)**: μ—μ΄μ „νŠΈκ°€ 였λ₯˜λ₯Ό κ³ μΉ˜μ§€ λͺ»ν•˜κ³  λ™μΌν•œ 검증 μ‹€νŒ¨λ₯Ό λ¬΄ν•œ λ°˜λ³΅ν•˜λ©° 루프에 κ°‡νž μœ„ν—˜μ΄ μžˆλ‹€. ## πŸ”— Knowledge Connections ### Related Concepts * [[V-component (Evaluation Interface)|V-component (Evaluation Interface)]] * μ—°κ²° 이유: μžκ°€ 검증이 μ‹€μ§ˆμ μœΌλ‘œ κ΅¬ν˜„λ˜λŠ” ν•˜λ„€μŠ€μ˜ ꡬ성 μš”μ†Œμ΄λ‹€. * Reflexion * μ—°κ²° 이유: μ‹€νŒ¨λ‘œλΆ€ν„° 배우고 슀슀둜λ₯Ό μˆ˜μ •ν•˜λŠ” μƒμœ„ κ°œλ…μ˜ ν”„λ ˆμž„μ›Œν¬μ΄λ‹€. * Context Attention Decay * μ—°κ²° 이유: μž₯κΈ° μž‘μ—… μ‹œ μ—μ΄μ „νŠΈκ°€ 검증 κ·œμΉ™μ„ μžŠμ–΄λ²„λ¦¬κ²Œ λ§Œλ“œλŠ” 원인이닀. ### Deeper Research Questions * 'κ²€μ¦μ˜ 깊이'λ₯Ό μž‘μ—…μ˜ μ€‘μš”λ„μ— 따라 λ™μ μœΌλ‘œ μ‘°μ ˆν•˜μ—¬ λΉ„μš© νš¨μœ¨μ„±μ„ κ·ΉλŒ€ν™”ν•˜λŠ” μŠ€μΌ€μ€„λ§ μ „λž΅μ€ 무엇인가? * μΈκ°„μ˜ ν”Όλ“œλ°±(HITL)이 적은 μƒν™©μ—μ„œ μžλ™ν™”λœ μžκ°€ κ²€μ¦λ§ŒμœΌλ‘œ μ†Œν”„νŠΈμ›¨μ–΄ μˆ˜μ€€μ˜ μ•ˆμ •μ„±μ„ 보μž₯ν•  수 μžˆλŠ”κ°€? * 검증 μ‹€νŒ¨ μ‹œ μ—μ΄μ „νŠΈμ—κ²Œ μ œκ³΅ν•˜λŠ” 'ν”Όλ“œλ°±μ˜ ꡬ체성'이 μžκ°€ μˆ˜μ •(Self-correction) 성곡λ₯ μ— λ―ΈμΉ˜λŠ” 영ν–₯은 μ–΄λ– ν•œκ°€? ### Practical Application Contexts * **Implementation:** `agent.run()` λ©”μ„œλ“œ λ§ˆμ§€λ§‰μ— λ°˜λ“œμ‹œ `agent.verify()`λ₯Ό ν˜ΈμΆœν•˜λ„λ‘ κ°•μ œν•˜κ³ , 검증 μ‹€νŒ¨ μ‹œ μ΅œλŒ€ NνšŒκΉŒμ§€ `agent.fix()`λ₯Ό μ‹œλ„ν•˜κ²Œ ν•œλ‹€. * **System Design:** μ½”λ”© μ—μ΄μ „νŠΈ νŒŒμ΄ν”„λΌμΈμ—μ„œ 'Generator μ—μ΄μ „νŠΈ'와 'Reviewer μ—μ΄μ „νŠΈ'λ₯Ό λΆ„λ¦¬ν•˜μ—¬ μ„œλ‘œμ˜ 결과물을 λΉ„νŒν•˜κ²Œ λ§Œλ“œλŠ” GAN μŠ€νƒ€μΌμ˜ ν˜‘μ—… 체계λ₯Ό κ΅¬μΆ•ν•œλ‹€. --- *Last updated: 2026-05-01*