콘텐츠로 이동

4.5. 예산 & 안전

Squad에는 토큰 과다 소비를 방지하고 예측 가능한 리소스 사용을 보장하는 내장 예산 제어 및 안전 제한이 포함되어 있습니다.

예산 구성

Squad 모니터링 대시보드에서 예산 설정 패널을 열어 Squad의 제한을 설정합니다.

토큰 제한

설정 기본값 설명
최대 총 토큰 100,000 전체 실행에서의 최대 토큰 수
에이전트당 최대 토큰 30,000 단일 에이전트가 소비할 수 있는 최대 토큰 수
태스크당 최대 토큰 10,000 단일 태스크 실행의 최대 토큰 수

실행 제한

설정 기본값 설명
최대 동시 에이전트 3 동시에 실행되는 최대 에이전트 수
플랜당 최대 태스크 20 플래너가 생성할 수 있는 최대 태스크 수
최대 재계획 횟수 3 플랜이 거부될 경우 최대 재계획 시도 횟수
에이전트당 최대 턴 20 태스크당 에이전트의 최대 추론 턴 수

시간 제한

설정 기본값 설명
실행 타임아웃 1,800초 (30분) 전체 최대 실행 시간
태스크 타임아웃 300초 (5분) 단일 태스크의 최대 시간
에이전트 유휴 타임아웃 60초 에이전트가 중지되기 전 최대 유휴 시간

경고 임계값

경고 임계값 (기본값: 80%)은 토큰 사용량이 전체 예산의 지정된 비율에 도달하면 알림을 트리거합니다. 이를 통해 제한에 도달하기 전에 개입할 시간을 확보할 수 있습니다.

실시간 예산 추적

예산 미터는 현재 리소스 소비의 시각적 개요를 제공합니다:

  • 전체 토큰 사용량 vs. 예산 제한
  • 에이전트별 토큰 분석
  • 생성된 태스크 수 vs. 제한
  • 활성 에이전트 수 vs. 동시성 제한
  • 경과 시간 vs. 타임아웃

안전 이벤트

예산 경고

토큰 사용량이 경고 임계값에 도달하면 squad:budget-warning 이벤트가 발생합니다. 모니터링 대시보드에서 예산 미터가 주황색으로 강조되어 제한에 근접하고 있음을 알립니다.

예산 초과

예산 제한에 도달하면 실행이 자동으로 일시 중지됩니다:

  • 초과된 제한이 식별됩니다 (전체 토큰, 에이전트별 토큰, 태스크 수 등)
  • 실행 중인 태스크는 현재 턴을 완료할 수 있습니다
  • 새로운 태스크는 시작되지 않습니다
  • squad:budget-exceeded 이벤트가 발생합니다

긴급 정지

위급한 상황(예: 극히 빠른 토큰 소비)에서는 긴급 정지가 모든 실행을 즉시 중단합니다:

  • 모든 실행 중인 에이전트가 중지됩니다
  • 대기 중인 태스크가 취소됩니다
  • 실행 상태가 실패로 변경됩니다
  • squad:emergency-stopped 이벤트가 사유와 함께 발생합니다

모범 사례

  • 보수적으로 시작 — 기본 제한으로 시작하고 Squad의 사용 패턴을 이해한 후 증가시키세요.

  • 에이전트별 제한 활용 — 특정 에이전트가 장황한 경향이 있다면 전체 예산을 올리기보다 에이전트별 토큰 제한을 낮추세요.

  • 첫 실행 모니터링 — 첫 실행 시 예산 미터를 주의 깊게 관찰하여 제한을 보정하세요.

  • 태스크 타임아웃 설정 — 개별 태스크 타임아웃이 전체 예산을 소진하기 전에 멈춘 에이전트를 잡아냅니다.

예산 제한은 정확하지 않습니다

토큰 카운팅은 근사값이며, 시스템이 초과를 감지하기 전에 설정된 제한을 약간 초과할 수 있습니다. 항상 작은 안전 마진을 두고 제한을 설정하세요.