← 인사이트

2026-05

프롬프트 말고 하네스 — 안드레 카파시와 코덱스 워크플로우 6원칙

프롬프트 말고 하네스 — 안드레 카파시와 코덱스 워크플로우 6원칙 — 바이브랩스

한 줄 요약

안드레 카파시의 CLAUDE.md 코딩 워크플로우 6원칙을 코덱스(Codex)에 그대로 매핑하며, 승부처는 모델 프롬프트가 아니라 에이전트가 일하는 작업장(“하네스”)의 설계에 있다고 정리한 영상.

영상 메타

  • URL: https://youtu.be/Yt67kU3cZfQ
  • 채널: 바이브랩스
  • 길이: 6분 3초
  • 업로드: 미상
  • 조회수: 148 / 좋아요 15
  • 시청일: 2026-05-23 KST (🖥 데스크탑이 자막 추출 후 요약)

픽업

  • 카파시가 짚은 핵심은 “Claude가 코딩을 잘한다”가 아니라 “LLM을 기율 있는 워크플로우에 강제하면 성능이 극적으로 좋아진다”는 것. 요즘 최고의 AI 엔지니어들은 프롬프팅을 하지 않고 에이전트 주위에 자신만의 시스템을 짓는다 — CLAUDE.md·AGENT.md 같은 파일이 단순 프롬프트가 아니라 에이전트의 운영체제처럼 작동하기 때문.
  • 코덱스를 봐야 하는 이유는 코드를 잘 짜서가 아니라 도구에서 “하네스”(에이전트의 작업장)로 환경이 바뀌고 있어서다. 매주 300만 명 이상 사용, 같은 에이전트가 다섯 군데(터미널 CLI, VS Code 확장, 커서 IDE 확장, 클라우드 웹, 모바일)에 들어와 있다.
  • 원칙1 “코딩 전에 생각하기” = CLI의 플랜(큰 일을 단계로 쪼개 오류 줄임) + AGENT.md. AGENT.md는 “bun을 쓴다 / JS 바뀌면 테스트 자동 실행 / 허락 없이 의존성 추가 금지” 같은 약속을 매번 채팅에 입력하지 않고 저장소에서 자동 작동하게 한다.
  • 원칙2 “멈춰서 검증” = 리뷰(브랜치·커밋·미커밋 변경·커스텀 4모드)와 diff/status, 그리고 hooks가 명령 실행 전후에 검증 스크립트를 끼워 API 키 누출·위험 명령·테스트 실패를 자동으로 잡는다. 원칙3 “단순함 우선”(천 줄보다 100줄)에는 compact가 길어진 대화를 의미 손실 없이 압축해 모델이 자기 혼란을 끌고 다니지 않게 한다.
  • 원칙5 “목표 중심 실행”이 카파시 카드의 심장. 골 모드는 2026-05-21 공식 체인지로그에서 실험 딱지가 떼졌다. 나쁜 예 “이 프로젝트를 완성해 줘” vs 좋은 예 “로그인 접근성을 고치고 기존 디자인 유지, 테스트와 린트가 통과하면 끝” — 목표·범위·종료 조건·검증 방법이 한 줄에 다 들어간다. 카파시: “무엇을 하라고 말하지 말고, 성공 기준을 두고 루프를 돌게 내버려둬.”
  • 원칙6 “서브에이전트로 병렬화” = 조사·디버깅·테스트·최적화·검증을 각각 한 명씩 두고 워크트리 자동화로 받는다. 이슈 트리아지·CI 실패 요약·릴리스 브리프 같은 반복 업무가 자동으로 굴러간다. OpenAI도 내부에서 매일 이렇게 돌린다고 공개했고, 이를 “AI 지원이 아니라 오케스트레이션”이라 부른다.
  • 한계도 짚는다 — 골로 길게 돌리면 토큰과 로그가 빠르게 쌓이고, 잘못 설정하면 밤새 토큰만 낭비할 수 있다. “큰 꿈보다 작은 계약이 먼저”인 이유: 하나의 목표, 하나의 검증 명령, 명확한 금지, 짧은 체크포인트, 마지막엔 사람이 보는 diff. 모델은 그대로여도 주위 하네스가 바뀌면 결과가 바뀐다.

용어

  • Codex [모델 · 구독]: OpenAI 의 코딩 에이전트. Claude Code 의 경쟁자. CLI / VS Code / Cursor / Cloud / Mobile 5 군데에 동일 에이전트 배포, 주간 300만+ 사용자.
  • Harness (하니스) [하니스 · 패턴]: 모델 주위에 두르는 시스템 — 작업 명세·컨텍스트 선택·도구 접근·메모리·검증·권한 등 11 요소. Cursor 실험에서 같은 모델로 점수 46→80 (34점 차). “모델은 천장을 정하고 하니스는 그 천장에 얼마나 가까이 갈지를 정한다.”
  • CLAUDE.md / AGENT.md [하니스 · 패턴]: 프로젝트 루트의 에이전트 운영체제 파일. 매 세션 자동 로드. tech stack / convention / “never do X” 룰. 200 lines 이내 권장(매 conversation 마다 token 소모).
  • Plan mode [하니스 · 패턴]: shift+tab 두 번. 모델이 실행 전 plan 을 제시 + 사용자 승인 대기. 카파시 원칙 1 (“코딩 전에 생각하기”) 의 핵심 도구.
  • Goal mode (목표 중심 실행) [하니스 · 패턴]: “무엇을 하라”가 아니라 “성공 기준 + 종료 조건” 을 한 줄에 박는 모드. 2026-05-21 Codex 체인지로그에서 실험 딱지 제거. 예: “로그인 접근성 고치고 디자인 유지, 테스트/린트 통과하면 끝.”
  • Hook [하니스 · 패턴]: lifecycle event 에 끼우는 자동 스크립트 — pre-tool-use (위험 명령 block), post-edit (auto-format), stop hook (Slack ping). “demo 가 아니라 production system 으로 trust 가능” 의 차이.
  • /compact [컨텍스트 · 캐시]: 컨텍스트가 길어지기 전에 의미 손실 없이 압축. warning 후에는 너무 늦음 — proactive 사용 권장.
  • Orchestration (오케스트레이션) [워크플로우 · 문화]: “AI 보조” 가 아니라 사람이 여러 에이전트를 조율·검증·머지하는 역할로 옮겨가는 패턴. OpenAI 내부도 매일 이렇게 굴림.