Files
2nd/AI/Bloom-Filters.md
T

1.5 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
P-REINFORCE-AI-BLOOM-FILTER 10_Wiki/💡 Topics/AI 1.0
Bloom Filters
Probabilistic Data Structure
Search Optimization
Hashing
2026-04-20

Bloom-Filters (블룸 필터)

📌 한 줄 통찰 (The Karpathy Summary)

"없다는 것은 확실히 알지만, 있다는 것은 가끔 착각한다." 공간 효율성을 극대화한 확률적 자료구조로, 거대한 데이터 집합에서 특정 원소가 포함되어 있는지 '초고속'으로 확인하는 선별 장치다.

📖 구조化된 지식 (Synthesized Content)

  • Probabilistic Membership:
    • "원소가 집합에 있는가?"에 대해 "없음"(100% 확실) 또는 "있을지도 모름"(False Positive 발생 가능)으로 답한다.
  • Space Efficiency:
    • 실제 원소를 저장하지 않고 해시 함수와 비트 배열(Bit Array)만 사용하므로, 메모리 사용량을 획기적으로 줄인다.
  • Use Cases:
    • 데이터베이스의 불필요한 디스크 읽기 방지, 악성 URL 차단 목록 확인, 대규모 네트워크 라우팅 등에서 전방 필터로 활약한다.

⚠️ 모순 및 업데이트 (RL Update)

  • 블룸 필터의 성능 관건은 False Positive 확률을 낮추는 것이다. 비트 배열의 크기와 해시 함수의 개수를 데이터 양에 맞게 정밀하게 계산하는 수학적 튜닝이 필수적이다.

🔗 지식 연결 (Graph)