4.5. 예산 & 안전¶
Squad에는 토큰 과다 소비를 방지하고 예측 가능한 리소스 사용을 보장하는 내장 예산 제어 및 안전 제한이 포함되어 있습니다.
예산 구성¶
Squad 모니터링 대시보드에서 예산 설정 패널을 열어 Squad의 제한을 설정합니다.
토큰 제한¶
| 설정 | 기본값 | 설명 |
|---|---|---|
| 최대 총 토큰 | 100,000 | 전체 실행에서의 최대 토큰 수 |
| 에이전트당 최대 토큰 | 30,000 | 단일 에이전트가 소비할 수 있는 최대 토큰 수 |
| 태스크당 최대 토큰 | 10,000 | 단일 태스크 실행의 최대 토큰 수 |
실행 제한¶
| 설정 | 기본값 | 설명 |
|---|---|---|
| 최대 동시 에이전트 | 3 | 동시에 실행되는 최대 에이전트 수 |
| 플랜당 최대 태스크 | 20 | 플래너가 생성할 수 있는 최대 태스크 수 |
| 최대 재계획 횟수 | 3 | 플랜이 거부될 경우 최대 재계획 시도 횟수 |
| 에이전트당 최대 턴 | 20 | 태스크당 에이전트의 최대 추론 턴 수 |
시간 제한¶
| 설정 | 기본값 | 설명 |
|---|---|---|
| 실행 타임아웃 | 1,800초 (30분) | 전체 최대 실행 시간 |
| 태스크 타임아웃 | 300초 (5분) | 단일 태스크의 최대 시간 |
| 에이전트 유휴 타임아웃 | 60초 | 에이전트가 중지되기 전 최대 유휴 시간 |
경고 임계값¶
경고 임계값 (기본값: 80%)은 토큰 사용량이 전체 예산의 지정된 비율에 도달하면 알림을 트리거합니다. 이를 통해 제한에 도달하기 전에 개입할 시간을 확보할 수 있습니다.
실시간 예산 추적¶
예산 미터는 현재 리소스 소비의 시각적 개요를 제공합니다:
- 전체 토큰 사용량 vs. 예산 제한
- 에이전트별 토큰 분석
- 생성된 태스크 수 vs. 제한
- 활성 에이전트 수 vs. 동시성 제한
- 경과 시간 vs. 타임아웃
안전 이벤트¶
예산 경고¶
토큰 사용량이 경고 임계값에 도달하면 squad:budget-warning 이벤트가 발생합니다. 모니터링 대시보드에서 예산 미터가 주황색으로 강조되어 제한에 근접하고 있음을 알립니다.
예산 초과¶
예산 제한에 도달하면 실행이 자동으로 일시 중지됩니다:
- 초과된 제한이 식별됩니다 (전체 토큰, 에이전트별 토큰, 태스크 수 등)
- 실행 중인 태스크는 현재 턴을 완료할 수 있습니다
- 새로운 태스크는 시작되지 않습니다
squad:budget-exceeded이벤트가 발생합니다
긴급 정지¶
위급한 상황(예: 극히 빠른 토큰 소비)에서는 긴급 정지가 모든 실행을 즉시 중단합니다:
- 모든 실행 중인 에이전트가 중지됩니다
- 대기 중인 태스크가 취소됩니다
- 실행 상태가 실패로 변경됩니다
squad:emergency-stopped이벤트가 사유와 함께 발생합니다
모범 사례¶
-
보수적으로 시작 — 기본 제한으로 시작하고 Squad의 사용 패턴을 이해한 후 증가시키세요.
-
에이전트별 제한 활용 — 특정 에이전트가 장황한 경향이 있다면 전체 예산을 올리기보다 에이전트별 토큰 제한을 낮추세요.
-
첫 실행 모니터링 — 첫 실행 시 예산 미터를 주의 깊게 관찰하여 제한을 보정하세요.
-
태스크 타임아웃 설정 — 개별 태스크 타임아웃이 전체 예산을 소진하기 전에 멈춘 에이전트를 잡아냅니다.
예산 제한은 정확하지 않습니다
토큰 카운팅은 근사값이며, 시스템이 초과를 감지하기 전에 설정된 제한을 약간 초과할 수 있습니다. 항상 작은 안전 마진을 두고 제한을 설정하세요.