--- id: a/b-testing title: "A/B Testing" category: "10_Wiki/Topics" status: "draft" verification_status: "conceptual" canonical_id: "" aliases: ["Split Testing", "λŒ€μ‘° μ‹€ν—˜"] duplicate_of: "" source_trust_level: "B" confidence_score: 0.90 created_at: 2026-06-12 updated_at: 2026-06-12 review_reason: "" merge_history: [] tags: ["research", "Assumption Validation Loop", "Experimentation"] raw_sources: ["NotebookLM Synthesis"] applied_in: ["Amazon (Feature Placement Testing)", "Buffer (Demand/Pricing Validation)", "Microsoft/Netflix (Feature Performance Validation)"] github_commit: "" --- # [[A/B Testing]] ## 🎯 ν•œ 쀄 톡찰 (One-line insight) A/B Testing은 μ§κ΄€μ΄λ‚˜ 의견이 μ•„λ‹Œ **μ‹€μ œ μ‚¬μš©μž 행동 데이터**λ₯Ό 기반으둜 두 κ°€μ§€ μ΄μƒμ˜ λŒ€μ•ˆμ„ λΉ„κ΅ν•˜μ—¬ 가섀을 κ²€μ¦ν•˜κ³  리슀크λ₯Ό μ΅œμ†Œν™”ν•˜λŠ” μ •λŸ‰μ  μ‹€ν—˜ 도ꡬ이닀. [1-3] ## 🧠 핡심 κ°œλ… (Core concepts) 1. **κ°€μ„€ 기반 μ‹€ν—˜ (Hypothesis-Driven):** λͺ¨λ“  A/B ν…ŒμŠ€νŠΈλŠ” "λ§Œμ•½ Xλ₯Ό ν•˜λ©΄, Y μ§€ν‘œκ°€ Z만큼 λ³€ν•  것이닀"λΌλŠ” κ°€μ„€μ—μ„œ μ‹œμž‘ν•˜λ©°, 이λ₯Ό 증λͺ…ν•˜κ±°λ‚˜ λ°˜μ¦ν•˜κΈ° μœ„ν•΄ μ„€κ³„λœλ‹€. [2, 4] 2. **λ³€μˆ˜ ν†΅μ œ 및 격리 (Variable Isolation):** μ‹ λ’°ν•  수 μžˆλŠ” κ²°κ³Όλ₯Ό μ–»κΈ° μœ„ν•΄ ν•œ λ²ˆμ— ν•˜λ‚˜μ˜ λ³€μˆ˜λ§Œ λ³€κ²½ν•˜μ—¬ 결과의 인과관계λ₯Ό λͺ…ν™•νžˆ ν•œλ‹€. [3, 5] 3. **λ¬΄μž‘μœ„ λŒ€μ‘°κ΅° μ„€μ • (Control & Variant):** μ‚¬μš©μžλ₯Ό λ¬΄μž‘μœ„λ‘œ λŒ€μ‘°κ΅°(A)κ³Ό μ‹€ν—˜κ΅°(B)으둜 λ‚˜λˆ„μ–΄ μ™ΈλΆ€ μš”μΈμ„ μ°¨λ‹¨ν•˜κ³  λŒ€μ•ˆ κ°„μ˜ μˆœμˆ˜ν•œ μ„±λŠ₯ 차이λ₯Ό μΈ‘μ •ν•œλ‹€. [3] 4. **행동 μ§€ν‘œ 쀑심 μΈ‘μ • (Behavioral Metrics):** μ‚¬μš©μžμ˜ 주관적인 '말'이 μ•„λ‹ˆλΌ 클릭λ₯ (CTR), μ „ν™˜μœ¨, μœ μ§€μœ¨ λ“± μ‹€μ œ '행동' 데이터λ₯Ό 톡해 성곡 μ—¬λΆ€λ₯Ό νŒλ‹¨ν•œλ‹€. [6-8] ## 🧩 μΆ”μΆœλœ νŒ¨ν„΄ (Extracted patterns) - **점진적 배포 νŒ¨ν„΄ (Staged Rollout):** [[Feature Flag]]λ₯Ό μ‚¬μš©ν•˜μ—¬ 전체 μ‚¬μš©μžμ—κ²Œ 리슀크λ₯Ό λ…ΈμΆœν•˜μ§€ μ•Šκ³  νŠΉμ • μ„Έκ·Έλ¨ΌνŠΈμ—μ„œλ§Œ A/B ν…ŒμŠ€νŠΈλ₯Ό μ§„ν–‰ν•˜μ—¬ μ•ˆμ •μ„±μ„ ν™•λ³΄ν•œλ‹€. [2, 9, 10] - **λžœλ”© νŽ˜μ΄μ§€ 슀λͺ¨ν¬ ν…ŒμŠ€νŠΈ (Landing Page Smoke Test):** μ œν’ˆμ„ μ‹€μ œλ‘œ κ΅¬μΆ•ν•˜κΈ° 전에 μ„œλ‘œ λ‹€λ₯Έ κ°€μΉ˜ μ œμ•ˆ(Value Proposition)μ΄λ‚˜ 가격 책정을 담은 λžœλ”© νŽ˜μ΄μ§€λ₯Ό A/B ν…ŒμŠ€νŠΈν•˜μ—¬ μ‹œμž₯ μˆ˜μš”λ₯Ό λ¨Όμ € ν™•μΈν•œλ‹€. [5, 11, 12] - **순차적 κ°€μ„€ 검증 (Sequential Validation):** μˆ˜μš” κ°€μ„€(λžœλ”© νŽ˜μ΄μ§€ A/B) -> 가격 κ°€μ„€(가격 νŽ˜μ΄μ§€ A/B) -> κΈ°λŠ₯ κ°€μ„€(κΈ°λŠ₯별 A/B) 순으둜 검증 단계λ₯Ό λ†’μ—¬κ°€λ©° μžμ› λ‚­λΉ„λ₯Ό λ°©μ§€ν•œλ‹€. [13, 14] ## πŸ“– μ„ΈλΆ€ λ‚΄μš© (Details) A/B Testing은 [[Assumption Validation Loop]]의 μ‹€ν–‰ λ‹¨κ³„μ—μ„œ κ°€μž₯ κ°•λ ₯ν•œ μ •λŸ‰μ  검증 도ꡬ 쀑 ν•˜λ‚˜λ‘œ ν™œμš©λœλ‹€. [2, 15] - **μ‹€ν—˜ 섀계 및 μ‹€ν–‰:** - μ‹€ν—˜ μ „ λ°˜λ“œμ‹œ **성곡 μ§€ν‘œ(Success Metric)**와 **μ‹€νŒ¨ κΈ°μ€€(Fail Criteria)**을 사전에 μ •μ˜ν•΄μ•Ό 사후 ν™•μ‹  편ν–₯을 λ°©μ§€ν•  수 μžˆλ‹€. [16-18] - λŒ€μ‘°κ΅°(A)은 κΈ°μ‘΄ μƒνƒœλ₯Ό μœ μ§€ν•˜κ³ , μ‹€ν—˜κ΅°(B)μ—λŠ” λ³€κ²½λœ 단일 λ³€μˆ˜λ₯Ό μ μš©ν•˜μ—¬ 일정 κΈ°κ°„ λ™μ•ˆ 데이터λ₯Ό μˆ˜μ§‘ν•œλ‹€. [3] - ν‘œλ³Έ 크기가 μΆ©λΆ„ν•˜μ§€ μ•Šμ€ 초기 단계(50~200λͺ… μˆ˜μ€€)μ—μ„œλŠ” 톡계적 μœ μ˜λ―Έμ„± 확보가 μ–΄λ €μš°λ―€λ‘œ 정성적 인터뷰와 λ³‘ν–‰ν•˜λŠ” 것이 ꢌμž₯λœλ‹€. [19, 20] - **검증 μ˜μ—­:** - **μˆ˜μš” 검증:** λžœλ”© νŽ˜μ΄μ§€μ˜ λ©”μ‹œμ§€λ‚˜ λ””μžμΈμ„ λ‹¬λ¦¬ν•˜μ—¬ 더 높은 κ°€μž…λ₯ μ„ λŒμ–΄λ‚΄λŠ” μš”μ†Œλ₯Ό μ°ΎλŠ”λ‹€. [12, 21] - **가격 검증:** μ„œλ‘œ λ‹€λ₯Έ 가격 μ²΄κ³„λ‚˜ 수읡 λͺ¨λΈ(예: μ‚¬μš©λŸ‰ 기반 μš”κΈˆμ œ)에 λŒ€ν•œ 고객의 결제 μ˜μ‚¬(Willingness to Pay)λ₯Ό λΉ„κ΅ν•œλ‹€. [22-24] - **κΈ°λŠ₯ κ°€μ„€ 검증:** νŠΉμ • κΈ°λŠ₯이 μ‚¬μš©μžμ—κ²Œ μ‹€μ œλ‘œ κ°€μΉ˜λ₯Ό μ œκ³΅ν•˜λŠ”μ§€, ν˜Ήμ€ μ œκ±°ν–ˆμ„ λ•Œ 반발이 μ—†λŠ”μ§€λ₯Ό ν™•μΈν•˜κΈ° μœ„ν•΄ μ‚¬μš©λœλ‹€. [5, 12] - **도ꡬ 및 기술:** - ν˜„λŒ€μ  μ œν’ˆ κ°œλ°œνŒ€μ€ AI μ–΄μ‹œμŠ€ν„΄νŠΈλ₯Ό ν™œμš©ν•˜μ—¬ 정성적 λ¦¬μ„œμΉ˜λ₯Ό ν•©μ„±ν•˜κ±°λ‚˜ A/B ν…ŒμŠ€νŠΈ κ²°κ³Όλ₯Ό λΆ„μ„ν•˜μ—¬ ν•™μŠ΅ 속도λ₯Ό 높인닀. [25] - No-code 도ꡬ(Webflow, Zapier λ“±)λ₯Ό μ‚¬μš©ν•˜λ©΄ μ‹€μ œ μ½”λ“œλ₯Ό μž‘μ„±ν•˜κΈ° 전에 고좩싀도(High-fidelity) ν™˜κ²½μ—μ„œ A/B ν…ŒμŠ€νŠΈλ₯Ό μˆ˜ν–‰ν•  수 μžˆμ–΄ μ—”μ§€λ‹ˆμ–΄λ§ λΉ„μš©μ„ 90%κΉŒμ§€ μ ˆκ°ν•  수 μžˆλ‹€. [26, 27] ## βš–οΈ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & updates) - **톡계적 μœ μ˜λ―Έμ„±μ˜ 함정:** μ†ŒμŠ€ λ°μ΄ν„°λŠ” 신생 μŠ€νƒ€νŠΈμ—…μ΄ μ™„λ²½ν•œ 톡계적 확싀성을 μ–»κΈ° μœ„ν•΄ 결정을 λ―Έλ£¨λŠ” 것을 "검증 함정(Validation Trap)"으둜 κ²½κ³ ν•œλ‹€. [20] μ΄ˆκΈ°μ—λŠ” μ™„λ²½ν•œ μˆ«μžλ³΄λ‹€ 정성적 수렴과 λΉ λ₯Έ ν•™μŠ΅ 속도가 더 μ€‘μš”ν•  수 μžˆλ‹€. [19, 28] - **λ‹¨μˆœ A/B vs MVT:** A/B ν…ŒμŠ€νŠΈλŠ” 단일 λ³€μˆ˜ 비ꡐ에 μ΅œμ ν™”λ˜μ–΄ μžˆμœΌλ‚˜, 볡합적인 λ³€μˆ˜ κ°„ μƒν˜Έμž‘μš©μ„ 확인해야 ν•  λ•ŒλŠ” λ‹€λ³€λŸ‰ ν…ŒμŠ€νŠΈ(Multi-variant Testing, MVT)κ°€ ν•„μš”ν•˜λ‹€λŠ” 점이 κ΅¬λΆ„λ˜μ–΄ λͺ…μ‹œλœλ‹€. [3] ## πŸ› οΈ 적용 사둀 (Applied in summary) - **Amazon:** μƒˆλ‘œμš΄ μ œν’ˆ μΉ΄ν…Œκ³ λ¦¬ 투자 μ „, κΈ°μ‘΄ μ‚¬μš©μžμΈ΅μ„ λŒ€μƒμœΌλ‘œ 페이크 도어(Fake Door) A/B ν…ŒμŠ€νŠΈλ₯Ό μ‹€μ‹œν•˜μ—¬ 클릭λ₯ μ΄ 높은 μ œν’ˆλ§Œ μ‹€μ œ 재고λ₯Ό 확보함. [21, 29] - **Buffer:** λžœλ”© νŽ˜μ΄μ§€μ™€ 가격 μ±…μ • νŽ˜μ΄μ§€λ₯Ό λ‹¨κ³„λ³„λ‘œ A/B ν…ŒμŠ€νŠΈν•˜μ—¬, μ‹€μ œ μ œν’ˆ μ½”λ“œλ₯Ό ν•œ 쀄도 μ“°κΈ° 전에 μˆ˜μš”μ™€ 결제 μ˜μ‚¬λ₯Ό λͺ¨λ‘ 증λͺ…함. [14, 30, 31] - **Microsoft, Netflix:** λ°°ν¬λ˜λŠ” κΈ°λŠ₯의 60~90%κ°€ μ§€ν‘œ κ°œμ„ μ— μ‹€νŒ¨ν•œλ‹€λŠ” 데이터λ₯Ό 근거둜, 거의 λͺ¨λ“  μ‹ κ·œ κΈ°λŠ₯을 A/B ν…ŒμŠ€νŠΈλ₯Ό 거쳐 검증함. [32, 33] ## βœ… 검증 μƒνƒœ 및 신뒰도 - **μƒνƒœ:** draft - **검증 단계:** conceptual (μ‹€μ œ 적용 사둀가 ν’λΆ€ν•˜κ²Œ 보고됨) - **좜처 신뒰도:** B (전문적인 μ œν’ˆ 관리 및 λ¦° μŠ€νƒ€νŠΈμ—… ν”„λ ˆμž„μ›Œν¬ 기반) - **쀑볡 검사 κ²°κ³Ό:** μ‹ κ·œ 생성 (New discovery) ## πŸ”— κ΄€λ ¨ λ¬Έμ„œ 링크 (Related document links) ### μƒμœ„/μœ μ‚¬ κ°œλ… #### [ν”„λ ˆμž„μ›Œν¬ 및 방법둠] - [[Assumption Validation Loop]] - μ—°κ²° 이유: A/B Testing은 이 λ£¨ν”„μ˜ 'Measure' 단계λ₯Ό κ΅¬μ„±ν•˜λŠ” 핡심 μ—”μ§„μž„. [15] - 이 κ°œλ…μ„ 톡해 더 깊게 이해할 수 μžˆλŠ” λΆ€λΆ„: 전체적인 리슀크 μ™„ν™” ν”„λ‘œμ„ΈμŠ€ λ‚΄μ—μ„œμ˜ μ‹€ν—˜ μœ„μΉ˜. - [[Riskiest Assumption Testing]] (RAT) - μ—°κ²° 이유: κ°€μž₯ μœ„ν—˜ν•œ 가섀을 κ°€μž₯ μ €λ ΄ν•˜κ²Œ κ²€μ¦ν•˜λŠ” λ°©λ²•μœΌλ‘œ A/B ν…ŒμŠ€νŠΈκ°€ 자주 ν™œμš©λ¨. [34, 35] - 이 κ°œλ…μ„ 톡해 더 깊게 이해할 수 μžˆλŠ” λΆ€λΆ„: 'μ΅œμ†Œ κΈ°λŠ₯ μ œν’ˆ' ꡬ좕 μ „ λ‹¨κ³„μ˜ 검증 μ „λž΅. #### [μΈ‘μ • 및 뢄석] - [[Conversion Rate]] - μ—°κ²° 이유: A/B ν…ŒμŠ€νŠΈμ˜ 성곡 μ—¬λΆ€λ₯Ό νŒλ‹¨ν•˜λŠ” κ°€μž₯ λŒ€ν‘œμ μΈ μ •λŸ‰ μ§€ν‘œμž„. [12, 30] - 이 κ°œλ…μ„ 톡해 더 깊게 이해할 수 μžˆλŠ” λΆ€λΆ„: μ‹€ν—˜ 결과의 객관적 해석 κΈ°μ€€. ### 심측 후속 질문 (Deeper Research Questions) - 초기 μ‚¬μš©μžκ°€ κ·Ήμ†Œμˆ˜μΈ ν™˜κ²½μ—μ„œ A/B ν…ŒμŠ€νŠΈμ˜ 톡계적 신뒰도λ₯Ό ν™•λ³΄ν•˜κΈ° μœ„ν•œ μ΅œμ†Œ ν‘œλ³Έ ν¬κΈ°λŠ” μ–΄λ–»κ²Œ κ²°μ •ν•˜λŠ”κ°€? [19, 20, 36] - [[Feature Flag]]λ₯Ό ν™œμš©ν•œ A/B ν…ŒμŠ€νŠΈ ν™˜κ²½ ꡬ좕 μ‹œ μ‹œμŠ€ν…œ λ³΅μž‘λ„μ™€ 기술 뢀채λ₯Ό μ–΄λ–»κ²Œ κ΄€λ¦¬ν•˜λŠ”κ°€? [2, 37, 38] - μ •λŸ‰μ μΈ A/B ν…ŒμŠ€νŠΈ 결과와 정성적인 μ‚¬μš©μž 인터뷰 κ²°κ³Όκ°€ 상좩될 λ•Œ μ˜μ‚¬κ²°μ • μš°μ„ μˆœμœ„λŠ” μ–΄λ–»κ²Œ μ„€μ •ν•˜λŠ”κ°€? [22, 39, 40] - λ‹€λ³€λŸ‰ ν…ŒμŠ€νŠΈ(MVT)와 λ‹¨μˆœ A/B ν…ŒμŠ€νŠΈμ˜ 선택 기쀀은 무엇이며, 각각의 λΉ„μš© νš¨μœ¨μ„±μ€ μ–΄λ–»κ²Œ 차이가 λ‚˜λŠ”κ°€? [3, 26] - AI 기반 뢄석 도ꡬ가 A/B ν…ŒμŠ€νŠΈμ˜ κ°€μ„€ μ„€μ • 및 κ²°κ³Ό 해석 λ‹¨κ³„μ—μ„œ 편ν–₯을 μ œκ±°ν•˜λŠ” 데 μ–΄λ–€ 역할을 ν•˜λŠ”κ°€? [25] ### 싀무 적용 λ§₯락 (Practical Application Contexts) - **Implementation:** [[Feature Flag]] μ‹œμŠ€ν…œμ„ λ„μž…ν•˜μ—¬ μ½”λ“œ λ³€κ²½ 없이 μ‹€ν—˜κ΅°/λŒ€μ‘°κ΅° μ „ν™˜μ„ 관리함. [2, 10] - **System Design:** μ‹€ν—˜ 데이터λ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ μˆ˜μ§‘ν•˜κ³  뢄석할 수 μžˆλŠ” 데이터 νŒŒμ΄ν”„λΌμΈ 및 λŒ€μ‹œλ³΄λ“œ 섀계가 μ„ ν–‰λ˜μ–΄μ•Ό 함. [9, 41] - **Operation / Maintenance:** μ‹€ν—˜ μ’…λ£Œ ν›„ μ‹€νŒ¨ν•œ λŒ€μ•ˆμ˜ μ½”λ“œλ₯Ό μ¦‰μ‹œ μ œκ±°ν•˜μ—¬ 기술 뢀채가 μŒ“μ΄μ§€ μ•Šλ„λ‘ 운영 ν”„λ‘œμ„ΈμŠ€λ₯Ό μˆ˜λ¦½ν•¨. [37, 38] - **Learning Path:** λ¦° μŠ€νƒ€νŠΈμ—… 방법둠을 읡히고 κ°€μ„€ 수립 -> μ‹€ν—˜ 섀계 -> μ§€ν‘œ λΆ„μ„μ˜ 사이클을 반볡 ν›ˆλ ¨ν•¨. [42-44] ### 인접 μ£Όλ³€ 주제 - [[Kano Model]] - ν™•μž₯ λ°©ν–₯: μ–΄λ–€ κΈ°λŠ₯을 A/B ν…ŒμŠ€νŠΈ λŒ€μƒμœΌλ‘œ μš°μ„  μ„ μ •ν• μ§€ κ²°μ •ν•  λ•Œ μ‚¬μš©μž λ§Œμ‘±λ„ μœ ν˜•μ„ λΆ„λ₯˜ν•˜λŠ” 데 도움을 쀌. [45, 46] - [[Jobs-to-be-Done]] (JTBD) - ν™•μž₯ λ°©ν–₯: A/B ν…ŒμŠ€νŠΈλ₯Ό 톡해 κ²€μ¦ν•˜κ³ μž ν•˜λŠ” 근본적인 μ‚¬μš©μž 동기와 λͺ©μ μ„ μ •μ˜ν•˜λŠ” 데 ν™œμš©λ¨. [47-49] ## πŸ“ λ³€κ²½ 이λ ₯ (Change history) - 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine. [Source Synthesis]