--- id: wiki-2026-0508-structured-data title: Structured Data category: Computer_Science_and_Theory status: needs_review canonical_id: self aliases: [P-Reinforce-AUTO-SDA-001] duplicate_of: none source_trust_level: A confidence_score: 1.0 tags: [auto-reinforced, structured-data, inverted-index, indexing, data-organization, search-engine] raw_sources: [] last_reinforced: 2026-05-04 github_commit: pending inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08) tech_stack: language: unspecified framework: unspecified --- # [[Structured Data|Structured Data]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "검색을 μœ„ν•œ μ§€μ‹μ˜ 섀계도: λΉ„μ •ν˜• ν…μŠ€νŠΈλ₯Ό 기계가 λΉ λ₯΄κ³  μ •ν™•ν•˜κ²Œ μ°Ύμ•„λ‚Ό 수 μžˆλ„λ‘ νŠΉμ • κ·œμΉ™(색인, μŠ€ν‚€λ§ˆ λ“±)에 맞좰 μž¬μ‘°μ§ν•¨μœΌλ‘œμ¨ 검색 νš¨μœ¨μ„±μ„ κ·ΉλŒ€ν™”ν•˜λŠ” 데이터 가곡 체계." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) κ΅¬μ‘°ν™”λœ 데이터(Structured Data)λŠ” 정보 검색 μ‹œμŠ€ν…œμ΄ 데이터λ₯Ό 효율적으둜 μ €μž₯ν•˜κ³  μ‘°νšŒν•  수 μžˆλ„λ‘ 미리 μ •μ˜λœ 데이터 λͺ¨λΈμ΄λ‚˜ 색인 ꡬ쑰λ₯Ό κ°–μΆ˜ λ°μ΄ν„°μž…λ‹ˆλ‹€. 1. **전톡적 ꡬ쑰화 기술**: * **[[Inverted Index|Inverted Index (역색인)]]**: 각 단어가 μ–΄λ–€ λ¬Έμ„œλ“€μ— ν¬ν•¨λ˜μ–΄ μžˆλŠ”μ§€ κΈ°λ‘ν•œ λ¦¬μŠ€νŠΈμž…λ‹ˆλ‹€. ν‚€μ›Œλ“œ κ²€μƒ‰μ˜ 속도λ₯Ό 보μž₯ν•˜λŠ” 핡심 κ΅¬μ‘°μž…λ‹ˆλ‹€. * **[[TF-IDF|TF-IDF]] / [[BM25|BM25]]**: λ‹¨μ–΄μ˜ 톡계적 νŠΉμ§•μ„ μˆ˜μΉ˜ν™”ν•˜μ—¬ μ •ν˜•ν™”λœ 점수(Score)λ₯Ό μ‚°μΆœν•©λ‹ˆλ‹€. 2. **검색 μ—”μ§„ μ΅œμ ν™”(SEO)와 ꡬ쑰화**: * **Schema Markup (JSON-LD)**: μ›ΉνŽ˜μ΄μ§€μ˜ 의미(μ œν’ˆ, 인물, 리뷰 λ“±)λ₯Ό 검색 엔진이 μ¦‰μ‹œ 이해할 수 μžˆλ„λ‘ HTML에 μ‚½μž…ν•˜λŠ” λ©”νƒ€λ°μ΄ν„°μž…λ‹ˆλ‹€. * **리치 μŠ€λ‹ˆνŽ« (Rich Snippets)**: κ΅¬μ‘°ν™”λœ 데이터λ₯Ό 기반으둜 검색 결과창에 μ΄λ―Έμ§€λ‚˜ 별점 등을 μΆ”κ°€λ‘œ λ…ΈμΆœν•˜μ—¬ κ°€μ‹œμ„±μ„ λ†’μž…λ‹ˆλ‹€. 3. **지식 κ΄€λ¦¬μ˜ ꡬ쑰화 ([[P-Reinforce|P-Reinforce]])**: * νŒŒνŽΈν™”λœ λ©”λͺ¨λ₯Ό [[Frontmatter|Frontmatter]], [[Hierarchy|κ³„μΈ΅ν˜• 폴더]], [[Internal Link|λ‚΄λΆ€ 링크]] λ“±μœΌλ‘œ κ΅¬μ‘°ν™”ν•˜μ—¬ AI μ—μ΄μ „νŠΈκ°€ μ‰½κ²Œ 지식을 νƒμƒ‰ν•˜λ„λ‘ λ§Œλ“­λ‹ˆλ‹€. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & Updates) * **μœ μ—°μ„± λΆ€μ‘±**: λ„ˆλ¬΄ μ—„κ²©ν•œ μŠ€ν‚€λ§ˆλŠ” λΉ„μ •ν˜• 데이터가 κ°€μ§„ ν’λΆ€ν•œ λ§₯락을 ν›Όμ†ν•˜κ±°λ‚˜, μƒˆλ‘œμš΄ ν˜•νƒœμ˜ 데이터λ₯Ό μˆ˜μš©ν•˜κΈ° μ–΄λ ΅κ²Œ λ§Œλ“€ 수 μžˆμŠ΅λ‹ˆλ‹€. * **가곡 λΉ„μš©**: λΉ„μ •ν˜• 데이터λ₯Ό κ΅¬μ‘°ν™”ν•˜λŠ” λ°λŠ” μ „μ²˜λ¦¬ νŒŒμ΄ν”„λΌμΈ ꡬ좕과 데이터 μ •μ œ(Cleaning)λ₯Ό μœ„ν•œ 초기 λΉ„μš©μ΄ λ°œμƒν•©λ‹ˆλ‹€. * **였λ₯˜ μ „νŒŒ**: ꡬ쑰화 κ³Όμ •μ—μ„œ 잘λͺ»λœ λ ˆμ΄λΈ”μ΄ λΆ™κ±°λ‚˜ 인덱싱 였λ₯˜κ°€ λ°œμƒν•˜λ©΄ 검색 κ²°κ³Ό μ „μ²΄μ˜ 신뒰도가 λ–¨μ–΄μ§‘λ‹ˆλ‹€. ## πŸ’» μ‹€μ „ κ΅¬ν˜„ μ½”λ“œ (Boilerplate) 검색 엔진이 μ΄ν•΄ν•˜κΈ° μ‰¬μš΄ `JSON-LD` ν˜•μ‹μ˜ κ΅¬μ‘°ν™”λœ 데이터 μ˜ˆμ‹œμž…λ‹ˆλ‹€. ```html ``` ## πŸ”— 지식 μ—°κ²° (Graph) * **μƒμœ„ κ°œλ…**: [[Computer Science and Theory|Computer Science]], [[Data Engineering|Data Engineering]] * **핡심 기술**: [[Inverted Index|Inverted Index]], [[SEO|SEO (Search Engine Optimization)]] * **κ΄€λ ¨ λͺ¨λΈ**: [[Knowledge Graph|Knowledge Graph]], [[Vector Database|Vector Database (Unstructured-to-Structured)]] --- *Last updated: 2026-05-04* ## πŸ€– LLM ν™œμš© 힌트 (How to Use This Knowledge) **μ–Έμ œ 이 지식을 μ“°λŠ”κ°€:** - *(TODO)* **μ–Έμ œ μ“°λ©΄ μ•ˆ λ˜λŠ”κ°€:** - *(TODO)* ## πŸ§ͺ 검증 μƒνƒœ (Validation) - **정보 μƒνƒœ:** needs_review - **좜처 신뒰도:** A - **κ²€ν†  이유:** *(P-Reinforce Phase 1 μžλ™ μ •κ·œν™”. λ³Έλ¬Έ 검증 ν•„μš”.)* ## 🧬 쀑볡 검사 (Duplicate Check) - **κΈ°μ‘΄ μœ μ‚¬ λ¬Έμ„œ:** *(TODO: μΈλ±μ„œ ν΄λŸ¬μŠ€ν„° 리포트 μ°Έμ‘°)* - **처리 방식:** UPDATE (μžλ™ μ •κ·œν™”) - **처리 이유:** Phase 1 μ •κ·œν™” β€” μ˜› ν…œν”Œλ¦Ώ/λˆ„λ½ ν•„λ“œ 보강. ## πŸ•“ λ³€κ²½ 이λ ₯ (Changelog) | λ‚ μ§œ | λ³€κ²½ λ‚΄μš© | 처리 방식 | 신뒰도 | |------|-----------|-----------|--------| | 2026-05-08 | P-Reinforce Phase 1 μ •κ·œν™” (frontmatter + 헀더 ν‘œμ€€ν™”) | UPDATE | A | ## πŸ’» μ½”λ“œ νŒ¨ν„΄ (Code Patterns) **νŒ¨ν„΄ 1:** *(TODO: 이 ν”„λ‘œμ νŠΈ μ»¨λ²€μ…˜ λ°˜μ˜ν•œ ꡬ쑰 μŠ€μΌˆλ ˆν†€)* ```text # TODO ``` ## πŸ€” μ˜μ‚¬κ²°μ • κΈ°μ€€ (Decision Criteria) **선택 Aλ₯Ό 써야 ν•  λ•Œ:** - *(TODO)* **선택 Bλ₯Ό 써야 ν•  λ•Œ:** - *(TODO)* **κΈ°λ³Έκ°’:** > *(TODO)* ## ❌ μ•ˆν‹°νŒ¨ν„΄ (Anti-Patterns) - **[μ•ˆν‹°νŒ¨ν„΄]:** *(TODO: 무엇을 ν•˜λ©΄ μ•ˆ λ˜λŠ”κ°€ + 이유 + λŒ€μ‹  무엇을)*