| 보유 AI skip 비율 |
0.0% |
20% ~ 60% |
너무 낮으면 비용 절감이 약하고, 너무 높으면 stale 리스크를 점검해야 합니다. |
| 보유 AI skip WS age p95 |
0.00s |
<= 1.50s |
skip 시점의 웹소켓 나이가 길면 최신성이 부족할 수 있습니다. |
| Gatekeeper 평가 p95 |
0ms |
< 1200ms |
높을수록 컨텍스트 생성 또는 AI 응답이 무거운 상태입니다. |
| Gatekeeper fast reuse 비율 |
0.0% |
15% ~ 55% |
너무 낮으면 최적화 효과가 적고, 너무 높으면 같은 판단을 오래 재사용할 수 있습니다. |
| Gatekeeper fast reuse WS age p95 |
0.00s |
<= 2.00s |
fast reuse가 stale WS 위에서 일어나지 않는지 확인합니다. |
| 보유 AI 결과 cache hit |
0.0% |
10% ~ 50% |
높다고 무조건 좋은 건 아닙니다. 너무 높으면 같은 판단 반복일 수 있습니다. |
| 듀얼 페르소나 shadow 표본 |
0건 |
20건 이상 |
표본이 너무 적으면 충돌률과 veto 비율 해석이 쉽게 흔들립니다. |
| 듀얼 페르소나 충돌률 |
0.0% |
15% ~ 35% |
너무 낮으면 중복 판단, 너무 높으면 프롬프트 방향 불일치를 의심할 수 있습니다. |
| 보수 veto 비율 |
0.0% |
8% ~ 25% |
과도한 veto는 과보수, 지나치게 낮은 veto는 실익 부족일 수 있습니다. |
| 가상 fused override 비율 |
0.0% |
5% ~ 15% |
shadow 기준으로 Gemini 결과와 다른 결론이 얼마나 나오는지 확인합니다. |
| 듀얼 페르소나 extra latency p95 |
0ms |
<= 2500ms |
shadow는 비동기지만, 실제 live 전환 전에 응답시간 분포는 미리 관찰해두는 편이 좋습니다. |