--- category: Unified tags: [auto-consolidated, technical-documentation] title: [[NLP (Natural Language Processing)|NLP (Natural Language [[Processing]])]] last_updated: 2026-05-02 --- # [[NLP (Natural Language Processing)|NLP (Natural Language [[Processing]])]] ## πŸ“Œ Brief Summary > "기계와 μ–Έμ–΄μ˜ 가ꡐ: 인간이 μΌμƒμ μœΌλ‘œ μ“°λŠ” λ³΅μž‘ν•˜κ³  λͺ¨ν˜Έν•œ μžμ—°μ–΄λ₯Ό 컴퓨터가 μ΄ν•΄ν•˜κ³ , λΆ„μ„ν•˜κ³ , 생성할 수 있게 λ§Œλ“œλŠ” 인곡지λŠ₯의 핡심 λΆ„μ•Όμ΄μž μ‹€μ§ˆμ μΈ 'μ»΄ν“¨ν„°μ˜ λ¬Έν•΄λ ₯' ꡐ윑." --- > "인λ₯˜μ˜ λ³΅μž‘ν•œ μ–Έμ–΄ 체계λ₯Ό κΈ°κ³„μ˜ 숫자둜 λ²ˆμ—­ν•˜κ³ , λ‹€μ‹œ κ·Έ 숫자λ₯Ό μ§€ν˜œλ‘œμš΄ λ¬Έμž₯으둜 λ³΅μ›ν•˜μ—¬ 인간과 κΈ°κ³„μ˜ μ†Œν†΅ μž₯벽을 ν—ˆλ¬Όμ–΄λΌ" β€” μΈκ°„μ˜ μ–Έμ–΄λ₯Ό 컴퓨터가 μ²˜λ¦¬ν•˜κ³  이해할 수 μžˆλ„λ‘ 뢄석, 가곡, μƒμ„±ν•˜λŠ” 인곡지λŠ₯의 핡심 λΆ„μ•Ό. ## πŸ“– Core Content μžμ—°μ–΄ 처리(NLP)λŠ” 컴퓨터와 인간 μ–Έμ–΄ μ‚¬μ΄μ˜ μƒν˜Έμž‘μš©μ„ μ—°κ΅¬ν•˜λŠ” ν•™λ¬Έμž…λ‹ˆλ‹€. 1. **μ£Όμš” νƒœμŠ€ν¬**: * **Sentiment [[Analysis|Analysis]]**: ν…μŠ€νŠΈμ— λ‹΄κΈ΄ 감정 νŒŒμ•…. * **Machine Translation**: μ„œλ‘œ λ‹€λ₯Έ μ–Έμ–΄λ‘œ λ²ˆμ—­. ([[Language-Models|Language-Models]]와 μ—°κ²°) * **NER**: ν…μŠ€νŠΈ 속 고유 λͺ…사 식별. * **Summarization**: κΈ΄ 글을 핡심 μœ„μ£Όλ‘œ μš”μ•½. 2. **μ™œ μ€‘μš”ν•œκ°€?**: * 인λ₯˜ μ§€μ‹μ˜ 80% 이상은 λΉ„κ΅¬μ‘°ν™”λœ 'ν…μŠ€νŠΈ' ν˜•νƒœλ‘œ μ‘΄μž¬ν•˜λ©°, 이λ₯Ό 기계가 ν™œμš©ν•˜λ €λ©΄ λ°˜λ“œμ‹œ 톡과해야 ν•˜λŠ” 관문이기 λ•Œλ¬Έμž„. ([[Information-Society|Information-Society]]의 기반) --- - **μΆ”μΆœλœ νŒ¨ν„΄:** "Textual Representation and Contextual Understanding" β€” νŒŒνŽΈν™”λœ ν…μŠ€νŠΈ 데이터λ₯Ό 토큰화(Tokenization)ν•˜κ³  벑터 κ³΅κ°„μœΌλ‘œ 투영(Embedding)ν•œ λ’€, μˆœν™˜(RNN)μ΄λ‚˜ 주의 집쀑(Attention) λ©”μ»€λ‹ˆμ¦˜μ„ 톡해 λ¬Έλ§₯적 의미λ₯Ό νŒŒμ•…ν•˜λŠ” μ§€λŠ₯ν˜• 해석 νŒ¨ν„΄. - **μ£Όμš” κ³Όμ—…:** - **NLU (Natural Language Understanding):** ꡬ문 뢄석, 개체λͺ… 인식, 감성 뢄석 λ“± 의미 νŒŒμ•…. - **NLG (Natural Language Generation):** λ²ˆμ—­, μš”μ•½, 자유 λŒ€ν™” λ“± λ¬Έμž₯ 생성. - **Core Processes:** Tokenization -> Stemming/Lemmatization -> POS Tagging -> Dependency Parsing. - **의의:** μ§€μ‹μ˜ μ €μž₯ ν˜•νƒœμΈ 'μ–Έμ–΄'λ₯Ό λ‹€λ£ΈμœΌλ‘œμ¨, AIκ°€ λ‹¨μˆœν•œ 도ꡬλ₯Ό λ„˜μ–΄ μΈκ°„μ˜ 지식 체계와 직접 μƒν˜Έμž‘μš©ν•˜λŠ” μΈν„°νŽ˜μ΄μŠ€λ‘œ μ§„ν™”ν•˜κ²Œ 함. ## βš–οΈ Trade-offs & Caveats - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌**: κ³Όκ±°μ—λŠ” ν˜•νƒœμ†Œ 뢄석, ꡬ문 트리 λ“± μˆ˜λ™ μ–Έμ–΄ν•™ κ·œμΉ™ 정책이 μ€‘μ‹¬μ΄μ—ˆμœΌλ‚˜, ν˜„λŒ€ 정책은 이 λͺ¨λ“  κ·œμΉ™μ„ κ±°λŒ€ 신경망 μ•ˆμ˜ νŒ¨ν„΄ μ •μ±…μœΌλ‘œ ν†΅ν•©ν•œ 'μ—”λ“œ-투-μ—”λ“œ λ”₯λŸ¬λ‹ μ •μ±…'으둜 νŒ¨λŸ¬λ‹€μž„μ΄ μ™„μ „νžˆ μ „ν™˜λ¨(RL Update). ([[Large Language Models (LLM)|Large Language Models (LLM)]]와 μ—°κ²°) - **μ •μ±… λ³€ν™”(RL Update)**: λ‹¨μˆœ ν…μŠ€νŠΈ 이해 정책을 λ„˜μ–΄, λ¬Έλ§₯에 λ‹΄κΈ΄ μ˜λ„(Intent)와 λ‰˜μ•™μŠ€, 그리고 문학적 λΉ„μœ κΉŒμ§€ 생성해 λ‚΄λŠ” 'μƒμ„±ν˜• NLP μ •μ±…' μ‹œλŒ€λ‘œ μ§„μž…ν•¨. ([[Gen-AI|Gen-AI]]와 μ—°κ²°) --- - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** κ·œμΉ™ 기반(Grammar-based) 톡계적 λΆ„μ„μ—μ„œ 신경망 기반의 κ±°λŒ€ λͺ¨λΈλ‘œ μ™„μ „νžˆ νŒ¨λŸ¬λ‹€μž„μ΄ μ‹œν”„νŠΈλ˜μ—ˆμœΌλ©°, μ΄μ œλŠ” λ‹¨μˆœ 처리λ₯Ό λ„˜μ–΄ 'μΆ”λ‘ ([[Reasoning|Reasoning]])'κ³Ό 'κ³„νš(Planning)'의 μ˜μ—­μœΌλ‘œ ν™•μž₯ μ€‘μž„. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈλŠ” λͺ¨λ“  지식 보강 ν”„λ‘œμ„ΈμŠ€μ˜ κ·Όκ°„μœΌλ‘œ κ³ λ„ν™”λœ NLP νŒŒμ΄ν”„λΌμΈμ„ μ‚¬μš©ν•˜λ©°, 특히 λ‹€κ΅­μ–΄ 지원과 μ „λ¬Έ μš©μ–΄ 보쑴에 μ΅œμ ν™”λœ ν•˜μ΄λΈŒλ¦¬λ“œ 토큰화 μ „λž΅μ„ 채택함. ## πŸ”— Knowledge Connections - [[Large Language Models (LLM)|Large Language Models (LLM)]], [[Language-Models|Language-Models]], [[Gen-AI|Gen-AI]], [[HCI (Human-Computer Interaction)|HCI (Human-Computer Interaction)]], [[Inquiry-Based Learning|Inquiry-Based Learning]] - **Modern Tech/Tools**: [[Transformers|Transformers]], NLTK, spaCy, Hugging Face, Word embeddings. --- --- - Linguistic-Analysis-in-AI, [[Natural-Language-Generation-NLG|Natural-Language-Generation-NLG]], [[Named-Entity-Recognition-NER|Named-Entity-Recognition-NER]], [[Transformer-Architecture|Transformer-Architecture]]-Foundations - **Raw Source:** 10_Wiki/Topics/AI/Natural-Language-Processing-NLP.md