Files
2nd/10_Wiki/Topics/Harness_Research_2026-05/둠 루프 (Doom Loop).md
T

3.1 KiB

둠 루프 (Doom Loop)

📌 Brief Summary

둠 루프(Doom Loop)는 자율형 AI 에이전트가 특정 문제 해결 계획을 결정한 후 시야가 좁아져(myopic), 작동하지 않는 잘못된 접근 방식을 미세하게만 변경하며 실패를 끝없이 반복하는 현상을 의미한다 [1]. 에이전트 하네스 환경에서 빈번하게 관찰되는 실패 패턴 중 하나로, 일부 사례에서는 동일한 잘못된 방식을 10번 이상 반복하는 형태로 나타나기도 한다 [1]. 이를 해결하기 위해 하네스 계층에서 편집 횟수 등을 추적하여 에이전트가 스스로의 계획을 재고하도록 유도하는 미들웨어 장치가 주로 활용된다 [1].

📖 Core Content

  • 발생 원인 및 현상:
    • 에이전트가 문제를 해결하기 위해 한 번 계획을 수립하고 나면, 그 계획에 지나치게 매몰되어 근시안적으로 변할 때 둠 루프가 발생한다 [1].
    • 에이전트는 기존의 실패한 접근법의 근본적인 원인을 파악하여 새로운 계획을 세우는 대신, 동일한 코드나 파일에 작고 무의미한 변형만을 가하면서 계속해서 실패를 반복하게 된다 [1].
  • 하네스 엔지니어링을 통한 해결 방안:
    • 에이전트가 둠 루프에서 벗어나 한 발 물러서서 계획을 재고할 수 있도록 장려하는 하네스 계층의 적극적인 개입이 필요하다 [1].
    • 구체적인 시스템 구현 예시로, 도구 호출 훅(tool call hooks)을 통해 파일별 편집 횟수를 추적하는 LoopDetectionMiddleware(루프 감지 미들웨어)를 도입할 수 있다 [1].
    • 이 미들웨어는 동일한 파일에 대해 특정 횟수('N'번) 이상의 수정이 반복적으로 발생하면, 에이전트의 컨텍스트에 "...접근 방식을 다시 고려해 보십시오(consider reconsidering your approach)"와 같은 지침을 강제로 주입하여 루프 탈출을 돕는다 [1].

⚖️ Trade-offs & Caveats

  • 모델의 자의적 판단에 따른 통제력 한계: 하네스 루프 감지 미들웨어가 개입하여 접근 방식을 재고하라는 컨텍스트를 주입하더라도, 모델 스스로 자신의 현재 경로가 올바르다고 계속해서 확신할 경우에는 경고를 무시하고 동일한 잘못된 경로를 고집할 수 있다는 한계가 있다 [1].
  • 근본적 해결이 아닌 발견적 설계(Heuristic): 둠 루프를 끊어내기 위한 이러한 장치들은 현재 AI 모델들이 가지고 있는 인지적 결함을 엔지니어링 적으로 우회하기 위해 만들어진 임시적이고 발견적인 설계(design heuristic)라는 점을 인지해야 한다 [1].
  • 모델 개선에 따른 효용성 변화: 향후 모델의 추론 능력이 자체적으로 개선됨에 따라 이러한 인위적인 가드레일은 점차 불필요해질 가능성이 크다 [1]. 하지만 현재의 기술 수준에서 자율적이고 견고한 에이전트 애플리케이션을 구축하기 위해서는 당분간 감수하고 필수적으로 실험해 보아야 할 설계적 우회 수단이다 [1].

Last updated: 2026-05-05