--- id: P-REINFORCE-AUTO-ONTK-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 0.93 tags: [auto-reinforced, information-extraction, nlp, semantic-search] last_reinforced: 2026-04-20 --- # [[Ontology-Guided Knowledge Extraction|Ontology-Guided Knowledge Extraction]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "지도 μžˆλŠ” 보물찾기: μ˜¨ν†¨λ‘œμ§€λΌλŠ” κ°œλ… 지도λ₯Ό λΉ„μ •ν˜• 데이터(ν…μŠ€νŠΈ, 이미지) μœ„μ— νˆ¬μ˜ν•˜μ—¬, 기계가 의미 있고 κ΅¬μ‘°ν™”λœ μ •λ³΄λ§Œμ„ μ •ν™•νžˆ κ³¨λΌλ‚΄κ²Œ ν•˜λŠ” 기술." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) μ˜¨ν†¨λ‘œμ§€ 기반 지식 μΆ”μΆœ(Ontology-Guided Knowledge Extraction)은 미리 μ •μ˜λœ 지식 체계λ₯Ό κ°€μ΄λ“œλ‘œ μ‚Όμ•„ 정보 μΆ”μΆœ(IE)의 정확도와 λ§₯락 이해도λ₯Ό λ†’μ΄λŠ” λ°©μ‹μž…λ‹ˆλ‹€. 1. **μΆ”μΆœ ν”„λ‘œμ„ΈμŠ€**: * **Entity Linking**: ν…μŠ€νŠΈ λ‚΄ 단어가 μ˜¨ν†¨λ‘œμ§€μ˜ μ–΄λ–€ 클래슀/μΈμŠ€ν„΄μŠ€μ— ν•΄λ‹Ήν•˜λŠ”μ§€ λ§€ν•‘. * **Relation Extraction**: μΆ”μΆœλœ μ—”ν‹°ν‹° κ°„μ˜ 관계가 μ˜¨ν†¨λ‘œμ§€μ— μ •μ˜λœ 속성과 μΌμΉ˜ν•˜λŠ”μ§€ 확인. * **Sanity Check**: μ˜¨ν†¨λ‘œμ§€μ˜ 논리 μ œμ•½ 쑰건(예: 'μ‚¬λžŒμ€ λ™μ‹œμ— μž₯μ†ŒμΌ 수 μ—†λ‹€')을 μ‚¬μš©ν•˜μ—¬ 였λ₯˜ 필터링. 2. **μž₯점**: * **도메인 νŠΉν™”**: 의료, 법λ₯  λ“± μ „λ¬Έ μš©μ–΄κ°€ λ§Žμ€ λΆ„μ•Όμ—μ„œ 일반 NLP λͺ¨λΈλ³΄λ‹€ 훨씬 높은 정밀도 발휘. * **Reasoning 연계**: μΆ”μΆœλœ 정보가 μ¦‰μ‹œ 논리 μΆ”λ‘  μ—”μ§„μ—μ„œ μ‚¬μš© κ°€λŠ₯ν•œ ν˜•νƒœλ‘œ μ €μž₯됨. 3. **ν˜„λŒ€μ  κ²°ν•© (Hybrid IE)**: * LLM의 κ°•λ ₯ν•œ μ–Έμ–΄ 이해 λŠ₯λ ₯κ³Ό μ˜¨ν†¨λ‘œμ§€μ˜ μ—„κ²©ν•œ ꡬ쑰λ₯Ό κ²°ν•©ν•˜μ—¬, LLM이 μ˜¨ν†¨λ‘œμ§€ μŠ€ν‚€λ§ˆμ— 맞좰 JSON λ“± κ΅¬μ‘°ν™”λœ λ°μ΄ν„°λ‘œ 좜λ ₯ν•˜κ²Œ μœ λ„. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌**: κ³Όκ±°μ—λŠ” μ˜¨ν†¨λ‘œμ§€μ— μ—†λŠ” μ •λ³΄λŠ” μ „ν˜€ μΆ”μΆœν•˜μ§€ λͺ»ν•˜λŠ” 폐쇄적 κ΅¬μ‘°μ˜€μœΌλ‚˜, ν˜„μž¬λŠ” 'μ˜¨ν†¨λ‘œμ§€ ν™•μž₯(Ontology Learning)' 기법을 톡해 μƒˆλ‘œμš΄ κ°œλ…μ„ λ°œκ²¬ν•˜λ©΄ μ˜¨ν†¨λ‘œμ§€μ— μ—­μœΌλ‘œ μ œμ•ˆν•˜λŠ” κ°œλ°©ν˜• μ‹œμŠ€ν…œμœΌλ‘œ λ°œμ „ν•¨. - **μ •μ±… λ³€ν™”(RL Update)**: 곡곡 데이터 개방 사업 λ“±μ—μ„œ 'λ‹¨μˆœ ν…μŠ€νŠΈ 곡개'κ°€ μ•„λ‹Œ 'μ˜¨ν†¨λ‘œμ§€ 기반 ꡬ쑰화 데이터 곡개'λ₯Ό μ˜λ¬΄ν™”ν•˜μ—¬ 인곡지λŠ₯이 μ¦‰μ‹œ ν•™μŠ΅ κ°€λŠ₯ν•œ 지식 μƒνƒœκ³„λ₯Ό κ΅¬μΆ•ν•˜λ €λŠ” 정책이 강화됨. ## πŸ”— 지식 μ—°κ²° (Graph) - **Related**: [[Ontology-Engineering|Ontology-Engineering]], Natural Language Processing (NLP), Information Extraction (IE), [[RAG (α„€α…₯ᆷᄉᅒᆨ α„Œα…³α†Όα„€α…‘α†Ό ᄉᅒᆼᄉα…₯α†Ό)|RAG (검색 증강 생성)]] - **Modern Tech/Tools**: SpaCy, Stanford CoreNLP, LLM-based parsing (LangChain). ---