docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -6,7 +6,7 @@ tags: [auto-reinforced, multimodal, ai-learning, cross-modal, computer-vision, n
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Multimodal-Learning]]
|
||||
# [[Multimodal-Learning|Multimodal-Learning]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "오감을 가진 인공지능: 텍스트만 읽는 편식에서 벗어나 이미지, 오디오, 비디오, 센서 데이터 등 서로 다른 형태(Modality)의 정보를 동시에 받아들여 결합하고, 인간처럼 세상을 입체적으로 이해하고 생성하는 지능의 진화."
|
||||
@@ -26,6 +26,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: 단순히 보는 것을 넘어, 영상을 보고 동작을 수행하는 '로보틱스 멀티모달 정책'이나 감정이 실린 목소리까지 직접 생성하는 '표현형 멀티모달 정책'으로 빠르게 확장 중임.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Large Language Models (LLM)]], [[Computer Vision]], [[Foundation-Models]], [[Gen-AI]], [[HCI (Human-Computer Interaction)]]
|
||||
- [[Large Language Models (LLM)|Large Language Models (LLM)]], [[Computer Vision|Computer Vision]], [[Foundation-Models|Foundation-Models]], [[Gen-AI|Gen-AI]], [[HCI (Human-Computer Interaction)|HCI (Human-Computer Interaction)]]
|
||||
- **Modern Tech/Tools**: GPT-4o, Claude 3.5, Gemini 1.5, CLIP (OpenAI), Stable Diffusion.
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user