[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -2,11 +2,11 @@
|
||||
id: VOICE-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, voice-assistant, stt, tts, nlp, audio-processing]
|
||||
tags: [ai, voice-assistant, stt, tts, nlp, audio-[[Processing]]]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# Voice Assistant Architecture (음성 비서 아키텍처)
|
||||
# Voice Assistant [[Architecture]] (음성 비서 아키텍처)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "소리에서 의도를 추출하고, 지능을 다시 소리로 빚어내라" — 음성 신호를 텍스트로 변환(STT), 의미 파악 및 답변 생성(NLU/LLM), 그리고 다시 음성으로 합성(TTS)하는 일련의 지능형 파이프라인.
|
||||
@@ -17,7 +17,7 @@ last_reinforced: 2026-04-26
|
||||
- **Wake Word Detection:** "헤이 지니"와 같은 특정 단어를 저전력으로 상시 감시.
|
||||
- **Automatic Speech Recognition (ASR/STT):** 오디오 파형을 텍스트 토큰 시퀀스로 변환.
|
||||
- **Natural Language Understanding (NLU):** 의도(Intent)와 엔티티(Entity)를 추출. 현대 시스템에서는 LLM이 이 역할을 통합 수행.
|
||||
- **Dialog Management:** 대화의 맥락을 유지하고 다음 행동 결정.
|
||||
- **Dialog [[Management]]:** 대화의 맥락을 유지하고 다음 행동 결정.
|
||||
- **Text-to-Speech (TTS):** 생성된 텍스트를 감정과 톤이 실린 자연스러운 음성으로 합성.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
|
||||
Reference in New Issue
Block a user