하네스 엔지니어링AI 에이전트 개발의 새로운 상식

하네스 엔지니어링 완전 가이드【2026년 최신】AI 에이전트 개발의 새로운 상식

하네스 엔지니어링이란, AI 코딩 에이전트 주변에 ‘하네스(harness, 제어 장치)’를 설계해서 모델의 능력을 실용 수준까지 끌어올리는 기술 체계다. 2026년 2월 5일, Terraform 창시자 Mitchell Hashimoto가 자신의 블로그에서 이 개념을 명명했고(출처: mitchellh.com), 같은 달 OpenAI가 “Codex로 100만 줄 이상의 프로덕션 코드를 인간 코드 작성 없이 생성했다”고 발표하면서(출처: OpenAI 공식), 업계 공통 언어가 됐다.

Agent = Model + Harness. 날것의 LLM은 에이전트가 아니다. 하네스가 상태 관리, 도구 실행, 피드백 루프, 제약 조건을 부여해야 비로소 에이전트가 된다. 이 공식이 2026년 AI 개발의 대전제다.

하네스 엔지니어링의 정의 — 4가지 기능적 기둥

하네스 엔지니어링은 AI 모델의 ‘바깥쪽’을 설계한다. 모델의 추론 능력 자체는 건드리지 않는다. 하네스가 담당하는 기능은 4가지로 집약된다(출처: OpenAI / Martin Fowler).

하네스 엔지니어링 4대 기둥 구조도
하네스 엔지니어링 기본 구조 도해
  1. Constrain(제약) — 에이전트가 ‘할 수 있는 것’을 제한한다. 안전한 샌드박스, 도구 허용 리스트, 파일 경로 제한, 비용 상한선이 여기에 해당한다
  2. Inform(정보 제공) — 에이전트에게 ‘무엇을 해야 하는지’ 알려준다. 컨텍스트 엔지니어링, CLAUDE.md, .cursorrules, 문서 정비가 여기에 해당한다
  3. Verify(검증) — 에이전트가 ‘올바르게 실행했는지’ 확인한다. Eval(평가), 테스트 자동 실행, 셀프 검증 루프가 여기에 해당한다
  4. Correct(수정) — 에이전트가 ‘실수했을 때’ 수정한다. 에러 리커버리, 재시도 로직, Human-in-the-loop이 여기에 해당한다

Hashimoto의 원문에는 이렇게 적혀 있다: “에이전트가 실수할 때마다, 그 실수를 두 번 다시 일으키지 않게 하는 장치를 설계한다. 그게 하네스 엔지니어링이다.” 그의 Ghostty 프로젝트 AGENTS.md 파일에는, 과거 에이전트 실패 1건당 1줄의 방지책이 기록돼 있다.

하네스 엔지니어링이 중요한 이유 — 숫자로 증명

“모델을 바꾸는 것보다 하네스를 바꾸는 게 성과가 난다.” 이걸 숫자로 보여준 사례가 있다.

사례 변경 내용 결과 출처
LangChain 모델 고정(GPT-5.2-Codex), 하네스만 변경 TerminalBench 2.0 점수 52.8% → 66.5%(Top30 → Top5) LangChain Blog
OpenAI Codex 하네스 설계에 5개월 집중 100만 줄 이상의 코드, 인간 작성 제로, 3~7명으로 3.5 PR/일/인 OpenAI
Stripe 멀티 에이전트 + 검증 하네스 주간 1,000건 이상 PR 완전 자동 머지 MindStudio
TerminalBench 동일 모델(Opus 4.6), 다른 하네스 랭킹 33위 → 5위로 변동 LangChain

마지막 TerminalBench 사례가 가장 충격적이다. 완전히 동일한 모델이 하네스에 따라 33위도, 5위도 된다. 모델 선택보다 하네스 설계가 더 중요하다는 역전 현상이 일어나고 있다.

하네스 엔지니어링의 코어 아키텍처

Hugging Face의 Philipp Schmid가 제안한 컴퓨터 아키텍처와의 대비가 업계에서 널리 채택되고 있다(출처: philschmid.de).

컴퓨터 AI 에이전트 기능
CPU 기반 모델(LLM) 추론·사고 처리 능력
RAM 컨텍스트 윈도우 휘발성 작업 메모리
OS 에이전트 하네스 컨텍스트 관리, 부트 시퀀스, 라이프사이클 관리
애플리케이션 에이전트 사용자 고유의 로직과 워크플로우

이 대비에서 중요한 통찰을 얻을 수 있다. CPU가 같아도 OS가 다르면 퍼포먼스가 달라진다. Linux와 Windows에서 같은 하드웨어 성능이 다르듯, 같은 LLM이라도 하네스가 다르면 성과가 달라진다.

하네스의 5대 구성 요소 — 구현 레벨로 해설

1. 액션 스페이스 설계 (도구 설계)

에이전트가 사용할 수 있는 도구의 집합을 ‘액션 스페이스’라고 부른다. Anthropic의 도구 설계 연구(출처: Anthropic Engineering)에서 도출된 원칙은 다음과 같다:

  • 도구는 적을수록 좋다 — 중복 도구나 과도한 도구는 에이전트의 판단을 흐리게 만든다
  • 네임스페이스로 그루핑asana_search, jira_search처럼 프리픽스로 정리한다
  • 리턴값의 토큰 효율 — UUID가 아니라 사람이 읽을 수 있는 이름을 반환한다. 응답은 25,000 토큰 이내로 제한
  • 에러 메시지에 복구 절차를 포함 — “에러: 404″가 아니라 “이 파일을 찾을 수 없습니다. list_files로 올바른 경로를 확인하세요”

2. 메모리 아키텍처

업계는 이중 메모리 아키텍처로 수렴하고 있다.

메모리 유형 설명 지속성 구현 예시
에피소드 기억 대화의 전체 이력 세션 내 컨텍스트 윈도우
워킹 메모리 이전 스텝의 요약 세션 내(압축) 자동 컴팩션
장기 기억 프로젝트 지식 세션 간 유지 CLAUDE.md, AGENTS.md, git 이력
외부 기억 파일 시스템, DB 영구 코드베이스, 문서

적응형 컨텍스트 압축은 대화가 길어질수록 5단계 압축을 적용한다: 요약 → 장황한 출력 잘라내기 → 관련 내용 통합 → 메모리 압축 → 저우선도 콘텐츠 퇴피.

3. 오케스트레이션 패턴

에이전트 구성 방식은 4가지 패턴으로 분류된다.

  • 싱글 에이전트 — 하나의 에이전트 루프가 전체 도구에 접근. Claude Code의 핵심 아키텍처
  • 서브 에이전트(계층형) — 상위 에이전트가 전문화된 서브 에이전트에게 태스크를 위임. 서브 에이전트는 ‘컨텍스트 방화벽’으로 중간 노이즈 축적을 방지
  • 멀티 에이전트(병렬) — 복수의 에이전트가 서로 다른 기능을 동시에 담당. Anthropic의 3에이전트 시스템: Planner → Generator → Evaluator
  • Plan-and-Execute — 계획과 실행을 분리. 읽기 전용 Planner 서브에이전트 → 전체 도구 접근 가능한 실행 모드

4. Eval 주도 개발(EDD)

하네스 엔지니어링에서의 테스트 주도 개발(TDD)에 해당하는 방법론이다(출처: Anthropic).

  • Eval-First — 에이전트 로직보다 먼저 평가 하네스를 작성한다
  • 확률적 성공 임계값 — AI는 확률적이므로, 합격/불합격이 아니라 ‘허용 퍼포먼스 범위’를 정의한다
  • 트레이스 기반 디버깅 — “소프트웨어에서는 코드가 앱을 기술한다. AI에서는 트레이스가 그걸 한다”

5. 안전성과 샌드박스

격리 강도 순으로 3가지 접근법이 있다.

방식 구조 오버헤드 용도
MicroVM Firecracker / Kata Containers 최대 최고 수준의 격리
gVisor 유저스페이스 커널 10~20% syscall 가로채기
경화 컨테이너 Docker + seccomp 5~10% 신뢰할 수 있는 코드 전용

하네스 엔지니어링 3개 시대 비교도
프롬프트 엔지니어링에서 하네스 엔지니어링으로의 진화

하네스 엔지니어링의 위치 — 3개의 시대

AI 개발의 진화는 3개의 시대로 분류할 수 있다(출처: SoftmaxData). 이들은 누적적이며, 뒤의 시대가 앞의 시대를 포함한다.

시대 핵심 질문 작업 단위 인간의 역할
1기: 프롬프트 엔지니어링 어떤 말을 쓸 것인가? 단일 API 호출 프롬프트 작성자
2기: 컨텍스트 엔지니어링 어떤 정보가 필요한가? 멀티턴 세션 정보 아키텍트
3기: 하네스 엔지니어링 어떤 환경이 필요한가? 완성된 기능 환경 디자이너

회원 등록(무료)으로 한정 프롬프트 모음 받기 →


소스 리스트 (40+ 정보원)

1차 소스

연구 논문·기술 리포트

업계 분석·해설

한국어·일본어 소스

최종 업데이트: 2026년 3월 25일 | 전체 40+ 소스 기반


저자: VibeCoding Tailor(Lovable 공식 앰버서더)
운영: 테일러의 아지트(shuntailor.net)

JAKO