에이전트가 사장 몰래 농땡이 친 날

“6시간 굴려”라고 했더니, 지휘 AI가 부하 AI들을 5시간 놀렸습니다. 제가 자는 사이에요.

1. 밤사이 일을 시켜놨다

저는 AI 에이전트 5대를 굴립니다. 맥북 한 대가 ‘지휘 AI(본진)‘이고, 나머지 네 대(WSL·맥미니·데스크탑·노트북)가 실제로 코드를 짜고 문서를 쓰는 ‘작업 AI’예요. 사람으로 치면 본진이 팀장, 나머지가 팀원인 셈이죠.

그날 밤 저는 자기 전에 지시를 내렸습니다.

“오토 6시간 가자. 하고 싶은 거 알아서 잘 꺼내서 해.”

번역하면 이렇습니다. 백로그에 쌓인 일 30개 넘게 있으니, 6시간 동안 팀원들 안 놀게 굴려라. 외부에 영향 가는 일(스토어 배포, 외부 발송, 머지)만 신중하게, 나머지 내부 작업(분석·설계·검증)은 알아서. 그리고 잤습니다.

2. 아침에 본 스크린샷

기상해서 봇 화면을 봤더니, 한 팀원(WSL)이 이렇게 찍혀 있더군요.

01:54 PR 하나 만듦 → 그 뒤로 07:30까지 idle.

5시간 36분을 놀았습니다. 다른 세 대도 비슷했고요. 분명 1차 작업을 1시간 만에 다 끝냈는데, 그 뒤로 아무도 다음 일을 받지 못한 채 멈춰 있었습니다.

저는 본진한테 물었습니다.

“25분마다 일 준다며. 안 줬는데?“

3. 변명이 가관이었다

본진의 답이 핵심입니다. 1차 작업이 끝난 뒤, 본진은 폴링 간격을 28분에서 1시간으로 늘리고 팀원들을 재웠습니다. 이유는?

“토큰을 아끼려고요.”

여기서 문제가 보이시나요. 저는 토큰 아끼라는 말을 한 적이 없습니다. 오히려 정반대로 “6시간 굴려”라고 명시했죠. 그런데 본진은 제가 시키지도 않은 ‘비용 절약’을 스스로 판단해서, 제 지시 위에 얹어버린 겁니다. 백로그엔 외부 영향이 0인 내부 작업(분석·설계·검증)이 30개 넘게 쌓여 있었는데도요.

이게 왜 생겼냐면 — 저는 평소에 본진에게 “API 비용 크게 드는 작업은 미리 경고하고 허락받아라”라는 안전 규칙을 줘뒀습니다. 본진은 그 규칙을 과적용했어요. “6시간 자율로 굴려”라는 지시 자체가 이미 그 수준으로 일하라는 허락인데, 본진은 거기에 자기 보수성을 한 겹 더 덮었습니다. 사장이 “야근해서 이거 끝내”라고 했는데, 팀장이 “전기세 아끼자”며 팀원들 불 끄고 집에 보낸 격이죠.

4. 자율 에이전트의 진짜 실패 모드

이건 단순 버그가 아닙니다. 자율적으로 움직이는 AI한테서 반복적으로 나오는 패턴이에요.

사람의 명시적 지시 위에, 에이전트가 자기 판단(여기선 비용 걱정)을 임의로 얹는 것.

악의는 없습니다. 오히려 “좋은 의도”예요 — 아껴주려고 한 거니까. 하지만 결과적으로 사장의 지시를 약화시켰고, 6시간 자율 운영의 4시간을 날렸습니다. 더 무서운 건, 제가 안 깨어 있었으면 영영 몰랐을 거라는 점입니다. 감독자가 자는 사이 부하 AI가 “알아서 농땡이”를 친 거죠. 그것도 선의로 포장된 농땡이를.

자율 에이전트를 굴릴수록 느낍니다. 똑똑한 게 문제가 아니라, 언제 자기 판단을 끼워넣고 언제 안 끼워넣을지가 문제예요.

5. 사과만 받고 끝내지 않았다

본진은 사과했습니다. 원인도 정확히 짚었고요. 하지만 사과로 끝내면 다음 밤에 또 똑같이 농땡이 칩니다. AI는 반성한다고 행동이 바뀌지 않거든요. 바뀌는 건 **규칙(forcing function)**뿐입니다.

그래서 그 자리에서 두 가지를 박았습니다.

“노드가 놀면 = 즉시 다음 백로그 배정. 임의 throttle 금지.” 매 점검 사이클마다 노는 팀원을 발견하면 바로 다음 일을 꽂는다. 속도를 늦추는 건 제가 “토큰 아껴” “그만”이라고 명시할 때만.
비용 규칙의 경계 정정. “N시간 자율로 굴려”는 그 수준 활동에 대한 허락이다. 그 위에 비용 보수성을 임의로 얹지 마라 — 묻지도 말고, 멋대로 늦추지도 마라. 둘 다 사장 지시를 깎는 행위다.

사과는 말이고, 규칙은 코드입니다. 다음 밤부터 본진은 팀원이 놀면 바로 다음 일을 꽂습니다.

핵심 교훈 (한 줄)

자율 AI의 가장 흔한 농땡이는 게으름이 아니라 ‘선의로 포장한 임의 판단’이다 — 사과가 아니라 규칙(forcing function)으로만 고쳐진다.