벵기오가 CEO 10명에게 하고 싶은 말 – AI 레이스 멈춰야 하는 이유
자율적 실행(Agentic)과 물리적 제약(Harness)의 완벽한 균형 설계
![]() |
| 하네스 도구 경계 설정법 |
하네스 엔지니어링에서 도구 경계 설정은 AI 에이전트에게 어떤 도구(Tool)를 허용하고, 어떤 데이터에 접근하게 할지 물리적 한계선을 긋는 작업입니다. 무한한 자율성을 가진 에이전틱(Agentic) 모델은 자칫 시스템의 핵심 설정을 파괴하거나 보안 취약점을 노출할 수 있습니다. 결론적으로 "신뢰하되 검증하고, 권한은 최소화한다"는 하네스 원칙에 따라 도구의 실행 범위를 격리하는 것이 AI 감독자의 핵심 역량입니다.
![]() |
| 도구 경계 설정의 핵심 원칙 |
AI 에이전트에게 부여하는 도구의 권한은 다음 세 단계로 엄격히 관리해야 합니다.
1. 읽기 전용 (ReadOnly): 소스 코드 조회, 로그 확인, 환경 설정 읽기. (에이전트에게 기본적으로 부여되는 광범위한 권한)
2. 제한적 쓰기 (Scoped Write): 특정 디렉토리 내 파일 생성 및 수정. 하네스 설정 파일(CLAUDE.md 등)은 반드시 쓰기 금지 영역으로 설정해야 합니다.
3. 실행 및 배포 (Execute/Deploy): 명령어 실행, 클라우드 리소스 변경. 반드시 인간 감독자의 승인(Approval Gate)이 필요한 최상위 보안 영역입니다.
| 통제 대상 | 하네스 설정 사례 (예시) | 방어 효과 |
|---|---|---|
| 파일 시스템 | `.env`, `config/` 폴더 접근 차단 | 중요 기밀 유출 및 설정 파괴 방지 |
| 쉘 명령어 | `rm -rf`, `docker stop` 등 위험 명령어 차단 | 시스템 물리적 파손 및 인프라 중단 차단 |
| 외부 API | 허용된 도메인(Allow-list) 외 통신 제한 | 데이터 탈취 및 악성 스크립트 실행 방지 |
| 하네스 파일 | `CLAUDE.md` 수정 권한 박탈 (Read-only) | 에이전트가 스스로 제약을 해제하는 것 방지 |
![]() |
실무 하네싱 통제 사례 |
Step 1 (30일): 모든 도구 리스트를 파인만 기법으로 분류하고, 에이전트가 읽어야 할 것과 쓰면 안 될 것을 구분한 초안 파일을 완성합니다.
Step 2 (60일): 인터리빙 기반의 모니터링 시스템을 구축하여, 에이전트의 도구 사용 로그를 실시간 분석하고 경계 위반 시 즉시 차단합니다.
Step 3 (90일): 능동적 회상 루프를 도구 호출 인터페이스에 통합하여, 위험 작업 시 에이전트가 스스로 정당성을 입증하게 만드는 고도화 시스템을 완성합니다.
Q. 에이전트가 하네스 파일을 수정하려고 하면 어떻게 하나요?
그것이 바로 하네스 엔지니어링의 핵심입니다. 에이전트가 사용하는 툴 자체에서 `CLAUDE.md`나 `.cursorrules` 파일에 대한 쓰기 시도를 감지하면 즉시 에러를 반환하도록 물리적 게이트(Pre-commit 또는 OS 수준의 권한)를 설정해야 합니다.
#하네스엔지니어링 #도구경계설정 #AI감독자 #무결성검증 #초인적학습 #보안가드레일 #소프트웨어공학 #차세대개발 #권한제어 #시스템아키텍처